展会信息港展会大全

谷歌DeepMind AI系统展现超强几何解题能力
来源:互联网   发布日期:2025-02-08 08:12:19   浏览:175次  

导读:IT之家 2 月 8 日消息,谷歌旗下人工智能研究实验室 DeepMind 开发的人工智能系统 AlphaGeometry2 在解决国际数学奥林匹克竞赛(IMO)几何问题方面取得了突破性进展,其表现甚至超过了平均金牌得主。AlphaGeometry2 是 DeepMind 在今年 1 月发布的 AlphaGeometry 系统的改进版本。根据 DeepMind 研究人员最新发表的论文,该 AI 系统能够解决过去 25 年国际数学奥林匹克竞赛中 8 ......

IT之家 2 月 8 日消息,谷歌旗下人工智能研究实验室 DeepMind 开发的人工智能系统 AlphaGeometry2 在解决国际数学奥林匹克竞赛(IMO)几何问题方面取得了突破性进展,其表现甚至超过了平均金牌得主。

谷歌DeepMind AI系统展现超强几何解题能力

AlphaGeometry2 是 DeepMind 在今年 1 月发布的 AlphaGeometry 系统的改进版本。根据 DeepMind 研究人员最新发表的论文,该 AI 系统能够解决过去 25 年国际数学奥林匹克竞赛中 84% 的几何问题。国际数学奥林匹克竞赛是一项面向高中生的数学竞赛,而 DeepMind 认为,发现解决复杂几何问题(特别是欧几里得几何问题)的新方法可能是实现更强大人工智能的关键。

谷歌DeepMind AI系统展现超强几何解题能力

证明数学定理或逻辑解释定理(例如勾股定理)为何成立,需要推理能力以及从多种可能的步骤中选择解决方案的能力。如果 DeepMind 的观点正确,这些解决问题的技能将成为未来通用人工智能模型的重要组成部分。

IT之家注意到,去年夏天,DeepMind 展示了一个将 AlphaGeometry2 与 AlphaProof(一种用于形式化数学推理的 AI 模型)相结合的系统,成功解决了 2024 年国际数学奥林匹克竞赛中的 6 个问题中的 4 个。除了几何问题,类似的方法还可以扩展到数学和科学的其他领域,例如辅助复杂的工程计算。

AlphaGeometry2 包含几个核心要素,其中包括谷歌 Gemini 系列 AI 模型中的语言模型和一个“符号引擎”。Gemini 模型协助符号引擎,后者利用数学规则推导问题的解决方案,并为给定的几何定理提供可行的证明。

由于将证明转化为 AI 可理解的格式存在复杂性,可用的几何训练数据匮乏。因此,DeepMind 为 AlphaGeometry2 的语言模型创建了自己的合成数据,生成了超过 3 亿个不同复杂度的定理和证明。

研究团队从过去 25 年(2000 年至 2024 年)的国际数学奥林匹克竞赛中挑选了 45 个几何问题,包括线性方程和需要在平面上移动几何对象的方程,并将其“翻译”成一个更大的 50 个问题的集合(由于技术原因,某些问题需要拆分为两个)。根据论文,AlphaGeometry2 解决了其中的 42 个问题,超过了平均金牌得主40.9 的得分。

不过,该系统也存在局限性。一个技术问题导致 AlphaGeometry2 无法解决涉及可变数量点、非线性方程和不等式的问题。此外,尽管 AlphaGeometry2 不是第一个达到几何问题金牌水平表现的 AI 系统,但它是在如此规模的问题集上实现这一目标的首个系统。

在另一组更具挑战性的国际数学奥林匹克竞赛问题上,AlphaGeometry2 的表现也不尽如人意。DeepMind 团队额外挑选了 29 个由数学专家为竞赛提名但尚未出现在比赛中的问题,AlphaGeometry2 只能解决其中的 20 个。

赞助本站

AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港