本文讨论了 rStar-Math 的引入及其在数学任务上如何使小型语言模型超越大型模型的技术,例如通过代码增强的链式思维与自我进化策略。这种方法显著提高了小型语言模型的推理能力,在多个基准测试上取得了优异的成绩,展现了小型模型在数学推理领域的潜力。