单纯的信息罗列已难以满足用户和搜索引擎的需求。
我的判断是,AI已成为强大却不完美的数学导师,成功关键始终在于人类的问题拆解与最终验证能力。没有清晰的问题意识和批判性审视,再先进的模型也只是产出一堆待清理的草稿。数据支持这个方向,但样本量仍有限,值得持续跟踪,现在下结论为时尚早。
埃及分数或单位分数分解相关的开放方向,也常被视为相对AI友好的目标。问题通常涉及Sylvester序列性质或最小分母界限,计算可控且有已知迭代算法作为脚手架。AI可生成前数十项序列并尝试规律猜想,用SymPy处理精确有理数避免浮点误差;当前状态显示小规模案例多有进展,但一般性质仍开放。这类问题比想象中更适合提示工程,因为数据生成成本低,验证直观。
媒体报道多突出“业余者单枪匹马破解难题”的叙事,Scientific American等文章强调AI采用了人类未曾尝试的von Mangoldt函数与Markov链结合方式,似乎打破了长期的思维定势。但深入观察会发现,主流兴奋点往往忽略了一个关键细节:Lichtman明确指出,ChatGPT的原始证明质量其实相当差,需要专家大幅梳理和精炼,才能提炼出核心洞见。
最近,一则来自erdosproblems.com的更新引发数学圈和AI社区的热议:23岁的业余爱好者Liam Price仅用ChatGPT Pro一个提示,在约80分钟内解决了Erdős问题#1196。这个由Erdős、Sárközy和Szemerédi在60多年前提出的猜想,围绕primitive set(集合中任意两元素互不整除)的加权和界限,长期困扰专业数学家。
粗糙数(rough numbers,指素因子受限的整数)或素因子相关问题,同样落在低难度区间边缘。围绕这类对象的计数或分布猜想,离散性强,AI在模式匹配上表现突出。erdosproblems.com上类似条目常有文献提及的下界,结合随机生成测试集,能让模型快速尝试不同角度;我的判断是,这类问题的时间窗口正在缩短,随着计算工具迭代,业余玩家或AI协作推进的速度会明显加快,但样本局限性仍需留意。
岁无高等数学背景的Liam Price,用一次ChatGPT Pro提示,在大约80分钟内拿到了Erdős问题1196的完整证明。这个问题涉及原始集——即正整数集合中任意两个不同元素都不互除——其倒数对数和在“足够大”元素上的渐近行为,困扰数学家60年。AI没有沿袭人类常见的概率路径,而是直接调用von Mangoldt函数,将其与整数唯一分解的经典恒等式相连,绕过了长期存在的分析障碍。
但这些报道往往停留在“AI强大”或“业余选手也能破题”的惊叹,较少触及这次证明的真正差异:AI不再复述已有路径,而是直接生成全新公式用法。
深入观察,这次事件的真正亮点在于“vibe mathing”的提示方式。Liam Price没有遵循传统文献综述和逐步推导的路径,而是让模型凭感觉探索连接。GPT-5.4 Pro意外地避开了从分析转向概率的常见“ gambit”,而是坚守算术框架,利用von Mangoldt权重构造了一种下向Markov链,近似保持了dn/(n log n)的测度。这一连接在人类先前工作中被直觉上的概率视角所掩盖,却提供了更干净的分析处理。
历史经验显示,意外工具常常打破学术僵局,比如望远镜让天文学家看到此前不可见的现象,这次AI扮演了类似“意外连接器”的角色。数据支持这一方向——过去几年AI已在Erdős问题网站上辅助解决数十个条目,但样本量仍有限,多数仍需人类验证。我的判断是,AI正成为强大数学导师,但成功关键始终在于人类的问题拆解与批判验证能力。没有好的问题意识,再强的模型也只是产出一堆待清理的草稿。
短期内,Erdős problems网站已更新问题状态,Lean形式化验证也在推进,数论社区将快速跟进相关聚类问题。长期来看,如果更多研究者系统化采用人机协作的“vibe mathing”实验,组合数学和数论猜想领域可能迎来方法论层面的系统创新。当然,raw output仍需专家提炼,这一点目前行业内仍有不同声音,值得持续跟踪,现在下结论为时尚早。
不急不躁的潜力,仍需真实场景来验证。