最近LLM的推理能力进步真的很快。
谷歌Deepmind宣布他们的数学模型解决了今年国际数学奥赛(IMO)中的四个问题,达到了银牌。
同时 Sam 还在评论区可能暗示Open AI的模型可以拿到金牌。
如果按Paul Christiano的预测的话,如果在 2025 年之前看到 IMO 金牌,那么AGI将会在几年内快速实现。
两个数学模型分别是:
AlphaProof,这是一个基于强化学习的正式数学推理系统。
以及 AlphaGeometry 2,几何问题解决系统的改进版本。
在训练过程中,AlphaProof 通过证明或反驳数百万个问题来提高其性能。
AlphaGeometry 2 的性能也得到了显著提升,能够解决历史上大部分 IMO 几何问题。
而且通过对 Gemini 模型的微调,AlphaProof 能够自动将自然语言问题翻译成正式语言,从而创建了一个用于训练和解决问题的大型正式问题库。
详情:
deepmind.google