382阅读
2回复

[智能应用]30位数学家出题也差点没难倒AI，但这似乎还不意味着它“懂数学” [2P] [复制链接]

上一主题下一主题查看指定楼层

在线姜谷粉丝

UID: 1569053

精华: 2
职务: 山庄囚徒
级别: 玉清道君

发帖: 165308

金币: 471136

道行: 20030

原创: 766

奖券: 350

斑龄: 0

道券: 30

获奖: 0

座驾

设备

摄影级

在线时间: 20200(小时)
注册时间: 2012-06-21
最后登录: 2025-12-14

只看楼主倒序阅读使用道具楼主发表于: 06-09

用户被禁言,该主题自动屏蔽!

山庄提示：道行不够，道券不够？---☆点此充值☆

分享到 淘江湖新浪 QQ微博 QQ空间开心人人豆瓣网易微博百度鲜果白社会飞信

在线姜谷粉丝

UID: 1569053

精华: 2
职务: 山庄囚徒
级别: 玉清道君

发帖: 165308

金币: 471136

道行: 20030

原创: 766

奖券: 350

斑龄: 0

道券: 30

获奖: 0

座驾

设备

摄影级

在线时间: 20200(小时)
注册时间: 2012-06-21
最后登录: 2025-12-14

只看该作者沙发发表于: 06-09

申请VIP---在山庄畅通无阻还送FTP单独下载账号!

用户被禁言,该主题自动屏蔽!

如何不发帖就快速得到金币和道行

在线jjybzxw

UID: 551814

精华: 0
职务: 超级斑竹
级别: 得道成仙

发帖: 210687

金币: 601860

道行: 2006

原创: 2438

奖券: 3180

斑龄: 40

道券: 1167

获奖: 0

座驾

设备

摄影级

在线时间: 46276(小时)
注册时间: 2008-10-01
最后登录: 2025-12-14

只看该作者板凳发表于: 06-09

在五月中旬，由非营利组织EpochAI主办的FrontierMath研讨会在加州伯克利秘密举行。三十位全球最负盛名的数学家齐聚一堂，他们的任务是设计出人类专家能够解决、但最先进的AI却会束手无策的数学难题。这场对决的主角，是来自OpenAI的推理大语言模型o4-mini。

o4-mini在处理需要深度几何直觉和拓扑理解的问题时表现尤其出色，而且其速度远超人类，能在几分钟内完成人类专家需要数周甚至数月才能完成的工作。尽管最终与会者们还是成功找到了10个能够难住AI的问题，但这个结果本身还是给数学家们带来极大冲击——相比于传统语言模型在类似基准测试中不到2%的成功率，o4-mini展现出的数学推理能力已经达到了前所未有的水平。

然而，数学家Jasper Zhang提出了一些异议，他表示，虽然AI的进步确实惊人，但原始报道在某些方面有些夸张，需要澄清。他指出，每个问题都需要一个数值答案，这与高等数学的核心有显著区别。现代数学研究的中心通常是推理与证明，而非纯粹的计算。AI可能并非通过类似人类的、严谨的逻辑推演来“理解”问题，而是利用其强大的模式匹配和计算能力，找到了一条通往正确数字的路径。

总的来说，AI在数学领域的进步令人震惊，但其深度推理能力和原创性思维仍有待提高。在未来，AI可能会成为数学家的助手，帮助发现新理论和解决开放问题，但在可预见的未来，人类的监督，尤其是在验证和综合方面，仍然是不可或缺的。

如何不发帖就快速得到金币和道行

发帖回复

返回列表


	关闭您还没有登录，快捷通道只有在登录后才能使用。立即登录还没有帐号？赶紧注册一个


	关闭选中1篇全选

帖子

[智能应用]30位数学家出题也差点没难倒AI，但这似乎还不意味着它“懂数学” [2P] [复制链接]