非常有用的工作! 我最近想用这个数据集sft一下Qwen2.5-7B base模型,但我没有在论文中找到类似模型训练后的结果,因此想询问一下有没有类似模型在Light-R1训练后的指标,比如AIME25、AIME24,或者估计训练后能取得的分数。 十分感谢!!!