资讯

rStar2-Agent 仅有 140 亿参数,在参数规模上,与动辄千亿参数的模型相比,堪称 “小巧玲珑”。但就是这样一个看似 “不起眼” 的模型,在数学推理测试 AIME24 中却斩获了 80.6% 的准确率,力压拥有 6710 亿参数的 DeepSeek-R1(79.8%)。