AI & ML interests
None defined yet.
Recent Activity
MultiRL/qwen3_1.7b_base_C_normal_short_sft_lr_1e_5_C_easy_grpo_step70
2B
•
Updated
•
1
MultiRL/qwen3_1.7b_C_short_sft_lr_1e_5_C_easy_reinforce_step80
2B
•
Updated
MultiRL/qwen3_1.7b_base_C_normal_concise_sft_lr_5e_6
2B
•
Updated
MultiRL/qwen3_1.7b_base_C_easy_short_sft_lr_1e_6
2B
•
Updated
•
1
MultiRL/qwen3_1.7b_format_rl
2B
•
Updated
MultiRL/qwen3_1.7b_base_C_normal_short_sft_lr_5e_6
2B
•
Updated
MultiRL/qwen3_1.7b_base_B_normal_short_sft_lr_1e_5
2B
•
Updated
•
1
MultiRL/qwen3_1.7b_base_A_normal_short_sft_lr_1e_5
2B
•
Updated
MultiRL/qwen3_1.7b_base_C_normal_short_sft_lr_1e_5
2B
•
Updated
•
1
MultiRL/qwen3_1.7b_base_C_normal_sft_lr_1e_5
MultiRL/qwen3_1.7b_base_A_normal_sft_lr_1e_5
MultiRL/qwen3_1.7b_base_C_normal_sft_lr_1e_6_epoch4
MultiRL/qwen3_1.7b_base_B_normal_sft_lr_1e_6_epoch4
MultiRL/qwen3_1.7b_base_A_normal_sft_lr_1e_6_epoch4
MultiRL/qwen3_4b_base_sudoku_C_normal_sft_lr_1e_5_epoch2
4B
•
Updated
MultiRL/qwen3_4b_base_sudoku_C_normal_sft_lr_1e_5_epoch1
4B
•
Updated
•
1
MultiRL/qwen3_4b_base_sudoku_A_normal_sft_lr_1e_6_epoch3
4B
•
Updated
•
2
MultiRL/qwen3_1.7b_base_sudoku_A_normal_sft_lr_1e_6_epoch3
2B
•
Updated