你越真诚、越有洞察,用户就越愿意回应。
这件事的真正价值在于,它提醒我们AI在纯数学中的潜力不只是速度或规模,而是可能天然避开人类集体形成的思维盲区,发现更深层的统一结构。如果类似连接在其他Erdős问题上复现,数论进展是否会系统性加速?这一点值得持续跟踪,现在下结论为时尚早。
我的判断是,AI正成为强大却非万能的数学导师。成功关键始终在于人类的问题拆解与验证能力。历史上有不少案例,意外工具打破僵局——类似望远镜开启新天文观测,这次AI充当了连接器。但数据支持这个方向,样本量仍有限,值得持续跟踪,现在下结论为时尚早。方向是对的,但现实更复杂。
深入观察这次事件的技术逻辑,可以看到AI正在加速数学研究的民主化进程。Price没有遵循传统分析路径逐步逼近,而是让模型自由探索思路,结果意外地利用von Mangoldt函数在算术框架内完成了证明,避免了人类研究中常见的从分析转向概率的“自然”转向。Terence Tao提到,这种连接方式可能在更广范围内打开新路径。
主流报道大多聚焦于“23岁门外汉靠ChatGPT一次性破解老难题”的戏剧性,陶哲轩的评论“人类在第一步就集体走偏了”被反复引用,网友热议AI是否将取代顶尖数学研究。确实,Liam Price本人只是偶尔把问题丢给模型试试,并无前期深入准备,整个过程仅靠单次提示完成。但这些讨论容易忽略核心细节:GPT-5.4 Pro的原始输出质量并不完美,需要人类专家仔细筛查和重构,才能从中提取出严谨洞见。
Erdős问题1196关注原始集(primitive sets)中整数的Erdős和行为,即对于只包含足够大整数的集合,∑ 1/(a log a) 的渐近上界。之前Lichtman等人已给出较弱版本的上界约1.399+o(1),但精确控制一直悬而未决。Liam Price对这些背景几乎一无所知,他只是随意把开放问题扔给模型测试,没想到模型意外应用了von Mangoldt函数结合下行可除性Markov链的方法,避开了人类常见的分析路径。
表面信息往往停留在“业余爱好者用ChatGPT一键解决难题”的叙事上。Hacker News和相关论坛热议不断,网友惊呼这标志着数学的民主化开始,Terence Tao等专家也给出初步肯定,认为方法有新意。但主流讨论存在明显盲区:很多人强调AI“独立解决”,却忽略了原始输出仍需人类专家仔细梳理和完善。这并非AI首次辅助Erdős问题,此前已有工具帮助文献挖掘或生成草稿,核心区别在于这次的提示方式更接近直觉驱动。
短期来看,更多业余爱好者和研究者或将尝试类似vibe math实验,加速Erdős问题攻克,但证明仍需Lean等形式化工具和专家把关。长期而言,如果类似案例增多,它可能催生新的数学思考方式,帮助重新理解大数结构。不过,AI原始输出粗糙、需人类sift的现实提醒我们,其作用更接近“新连接方法”的提供者,而非独立证明者。这一点目前行业内仍有不同声音,现在下结论为时尚早。
短期内,这一事件很可能刺激更多业余爱好者和研究者尝试类似“vibe prompting”。Erdős问题这类开放平台或将迎来更多AI辅助的候选证明,专家则需要额外精力筛查输出中的洞见与潜在幻觉。目前该证明已进入Lean形式化讨论,显示人类在验证环节仍不可或缺。但如果AI幻觉问题未得到更好解决,伪证明泛滥的风险确实存在,数据支持这一方向,但样本量仍有限。
深层来看,这次事件的核心在于AI通过“vibe mathing”式的直觉提示,打破了人类长期形成的集体思维盲区。Erdős问题1196本质上探求原始集在数轴远端的渐近行为,传统方法易陷入固定分析框架,而GPT-5.4 Pro则意外保留了算术视角,利用von Mangoldt函数结合Markov链思路,避开了之前的障碍。70%和7%这样的剪刀差在企业AI部署中早已出现,这次在数学自学中也同样说明,问题驱动+AI迭代远胜按部就班刷题。
人类对这类问题的探索路径,往往从分析工具切入,随后自然转向概率方法。这种“分析转概率”的标准走法,从Erdős时代起就成为默认框架。Jared Lichtman等顶尖专家曾在相关原始集猜想上取得突破,却在1196这个渐近版本上耗费多年仍未突破。数据和历史记录显示,即使Fields Medal级别的合作者加入,研究者也难以摆脱早期步骤中隐含的微小偏差,这些偏差随时间积累,形成了难以察觉的思维盲区。
这个基于当前阶段公开数据、行业报告和一线观察所形成的初步趋势判断,当然还需要在未来更长的时间窗口内,借助更多、更全面、更多元化的真实业务数据和独立案例来进行进一步的验证、修正和细化。但从目前已经可以获得的多个相对独立的信息来源、调研报告和专家观点来看,它们所共同指向的核心趋势信号、大方向判断和关键驱动因素,是相对一致、收敛和具有较强稳定性的。