提供有观察深度、可迁移判断的内容,反而越来越受到用户和搜索引擎的双重认可。
这里存在不确定性——如果这类证明持续被Lean等形式化工具可靠验证,数学教育或将转向提示工程加人类验证的混合模式,否则影响可能仍限于少数实践者。
传统研究路径往往从分析视角切入,再自然过渡到概率解释,这种“gambit”自Erdős 1935年论文以来就隐含其中,看似高效却遮蔽了其他可能性。Lichtman 2022-2023年的工作已取得部分上界成果,但精细控制仍卡在分析难度上。
短期来看,这一事件很可能激发更多业余爱好者和研究者尝试vibe math,将开放问题扔给ChatGPT以获取新鲜思路。erdosproblems.com网站上类似实验已在增加,有人开始结合Lean形式化验证AI输出。人类把关环节依然关键——再有洞见的原始证明,也需专家sift和打磨,才能成为严谨成果。数据支持这个方向,但样本量仍有限,值得持续跟踪。
历史经验提供有益对照。过去AI在数学领域的不少成果,更偏向文献检索或已知技巧的重组,而非真正原创洞见。这次事件中,AI确实绕过了常规思维障碍,但正如Lichtman和Tao的介入所示,其输出仍需人类批判性验证和优化。社区中有人判断,如果只是“专家救场”模式,AI更像是高效的生产力工具;若能持续输出可直接验证的洞见,则可能真正加速数学进展。
早期AI在数学研究中的角色,主要停留在文献搜索和辅助验证层面。面对大量Erdős开放问题时,模型常被用来挖掘旧论文、整理已有思路,或快速检查潜在漏洞。这种辅助方式确实加速了部分进展,但本质上仍依赖人类设定的路径框架。
从历史视角看,过去AI在数学领域的许多成果更多是文献检索或已知技巧的重组,而非真正原创洞见。这次Erdős问题1196的解决虽引入了新连接,却仍需Tao和Lichtman等专家的介入才能提炼成可验证的形式。方向是对的——AI确实能提供人类因路径依赖而错过的思路。但现实更复杂:如果多数输出仍需“专家救场”,它就更多是强大生产力工具,而非独立颠覆者。70%和7%的剪刀差,在企业AI部署中早已显现,这次数学事件同样暴露了类似鸿沟。
Scientific American等媒体很快跟进报道,标题多强调“业余者借助ChatGPT破解60年难题”。Hacker News社区的初步反应充满兴奋,不少评论指出,这似乎展示了AI绕过人类思维定势的能力:研究者们往往在第一步就陷入集体路径依赖,而AI没有这些心理包袱,直接尝试了不同路径。
短期内,这一事件可能激发更多业余爱好者和研究者尝试“vibe prompting”,让Erdős问题平台涌入更多AI辅助候选。专家则需投入额外精力筛查输出,区分洞见与潜在幻觉。长期来看,数学原创门槛或将降低,普通人掌握提示技巧即可参与开放猜想。但如果AI幻觉问题未获更好解决,伪证明泛滥的风险将增加,人类深度验证的负担或将加重。这一点目前行业内仍有不同声音,值得持续跟踪,现在下结论为时尚早。
媒体和网友的讨论大多聚焦于戏剧性表象:一个普通年轻人靠“vibe-maths”式的随意提示,就让AI解决了专家多年未决的问题。Terence Tao等数学家给出初步认可,认为AI的路径避开了人类常见的集体思维定势。Erdős问题网站已将该问题标记为已解决,由GPT-5.4 Pro在Price提示下完成,并伴随Lean形式化验证的进展。
erdosproblems.com目前收录了上千个Erdős未解问题,其中数论和组合数学方向占比显著。许多问题无需高深背景,仅涉及素数分布、子集和或基本集合性质,却仍处于开放状态。AI的优势在于快速生成假设、枚举小规模实例并通过模式识别推进,这些“低垂果实”正成为测试提示工程和计算辅助的有效场地。相比那些需要深厚直觉的硬核难题,它们提供了更快的反馈循环。
但现实更复杂,很多光鲜案例的背后都有大量不为人知的调整。