When's picture

9 15

When

WhenceFade

·

https://mufan.me

WhenMelancholy

AI & ML interests

Generative Models.

Recent Activity

upvoted a paper about 5 hours ago

Coupling Experts and Routers in Mixture-of-Experts via an Auxiliary Loss

updated a dataset about 1 month ago

WhenceFade/dataset-mix-cached

upvoted an article 3 months ago

Open-R1: a fully open reproduction of DeepSeek-R1

View all activity

Organizations

upvoted a paper about 5 hours ago

Coupling Experts and Routers in Mixture-of-Experts via an Auxiliary Loss

Paper • 2512.23447 • Published 2 days ago • 77

updated a dataset about 1 month ago

WhenceFade/dataset-mix-cached

Updated Feb 25 • 1

upvoted an article 3 months ago

Article

Open-R1: a fully open reproduction of DeepSeek-R1

+1

Jan 28

•

887

upvoted a paper 5 months ago

Complex Logical Instruction Generation

Paper • 2508.09125 • Published Aug 12 • 40

upvoted a paper 6 months ago

Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination

Paper • 2507.10532 • Published Jul 14 • 89

liked a dataset 6 months ago

Open-Orca/OpenOrca

Viewer • Updated Feb 19 • 2.94M • 14k • 1.48k

updated 2 models 7 months ago

WhenceFade/0604_key_cache_qwen3_8b_new

Text Generation • 8B • Updated Jun 5 • 5

WhenceFade/0604_key_cache_qwen3_8b

Text Generation • 8B • Updated Jun 5 • 5

published 2 models 7 months ago

WhenceFade/0604_key_cache_qwen3_8b_new

Text Generation • 8B • Updated Jun 5 • 5

WhenceFade/0604_key_cache_qwen3_8b

Text Generation • 8B • Updated Jun 5 • 5

updated a dataset 7 months ago

WhenceFade/0604_key_cache_dynamic_qwen3

Viewer • Updated Jun 4 • 1.57M • 27 • 1

published a dataset 7 months ago

WhenceFade/0604_key_cache_dynamic_qwen3

Viewer • Updated Jun 4 • 1.57M • 27 • 1

updated a dataset 7 months ago

WhenceFade/0604_key_cache_dynamic_qwen

Viewer • Updated Jun 4 • 1.57M • 14

published a dataset 7 months ago

WhenceFade/0604_key_cache_dynamic_qwen

Viewer • Updated Jun 4 • 1.57M • 14

updated a dataset 7 months ago

WhenceFade/0601_key_cache_dynamic_olmoe

Viewer • Updated Jun 2 • 1.57M • 29

published a dataset 7 months ago

WhenceFade/0601_key_cache_dynamic_olmoe

Viewer • Updated Jun 2 • 1.57M • 29

updated a dataset 7 months ago

WhenceFade/0529_key_cache_dynamic_olmoe

Viewer • Updated May 29 • 1.52M • 23

published a dataset 7 months ago

WhenceFade/0529_key_cache_dynamic_olmoe

Viewer • Updated May 29 • 1.52M • 23

updated a dataset 7 months ago

WhenceFade/0528_key_cache_dynamic_olmoe

Viewer • Updated May 29 • 1.52M • 12

published a dataset 7 months ago

WhenceFade/0528_key_cache_dynamic_olmoe

Viewer • Updated May 29 • 1.52M • 12