半个多世纪前数学巨匠留下的未解谜题,正被一名中国大四学生与AI联手破局。从疯狂压缩通识课、自学纯数学的青涩少年,到与陶哲轩深夜探讨解答的科研新锐,西安交通大学的本科生汤泉宇,正以敏锐直觉探索着“人机协同”的数学边界。
我们联系了汤同学,以亲历者的讲述,带您触碰AI浪潮前沿研究者的所思所想。在算力与人脑交织的无人区里,年轻的探路者留下了对这场技术狂飙的清醒审思:“AI不一定能给出答案,但它会把你带到一个你本来未必会去的地方。”
汤泉宇 | 受访者供图
撰文 | 嘉伟
抢在陶哲轩前头出证明的不眠之夜
2026年春,西安交通大学的一间普通宿舍里,显示器的荧光映着汤泉宇略显疲惫却发亮的眼睛。
屏幕右下角的时间显示,大概两个小时后天就要亮了,但他毫无睡意。他向菲尔兹奖得主陶哲轩提交了一份与AI协同完成的证明,此刻仍在等待对方的最新回复。
成功解答数学界开放问题带来的兴奋感,或许是他当下极度紧绷的大四生活里最好的一剂强心针。
大学前两年,为了把每一分钟都压榨给纯数学,汤泉宇做了一个极为疯狂的决定:他将所有与数学无关的通识课、选修课悉数“打包”,统统挪到了大三和大四。
这种“寅吃卯粮”的硬核自学方式很快便让他尝到了苦果。步入高年级,积压的学分像雪崩一样砸来。由于学分缺口巨大,他随时面临着延期毕业的风险。更具黑色幽默的是,因为这种极端的排课,他明天——不,已经是今天——一会还要去上体育课。
但这并不妨碍他继续在数学的无人区里狂奔。
汤泉宇此刻盯着的是名为“Erdős Problems”的网站[1]。这个网站收录了大量由传奇数学家保罗·埃尔德什本人提出或代为发布、却沉寂至今的未解谜题。许多问题表述得非常初等,连高中生都能看懂,但往往已经数十年未有进展。它更像是一个公开运转的“现代数学实战营”,全球的数学家在评论区里不断补充进展、交换灵感。
虽然还是本科生在读,但汤泉宇早在2年前、网站上线没多久的时候,就已经独立解决了若干埃尔德什问题。最近他又开始借助 AI 模型,希望测试 AI 能否提出证明思路。他的作用是识别错误、追问漏洞、重新组织问题,再让 AI 沿着更可靠的方向继续尝试。
他选择了一道有60年历史的难题,编号#650。
图1:这个问题被汤泉宇与两位合作者借助AI解决,并通过Lean语言校验了证明过程。问题的状态从open变为solved。| 图源:T. F. Bloom, Erdős Problem #650
汤泉宇的两位合作伙伴一度认为,这个问题超出了AI的能力范围。但汤泉宇具备一种直觉,他总是能敏锐地找到那些“人机协同”足以攻克的壁垒。他相信这个问题是现阶段可以解决的。
在AI一次次吐出错误的答案之后,终于,他看到了一个可靠的推理过程。经过人工分析后,他认为这就是跨越了60年的解答,并开心地提交了答案。
不过喜悦并未持续太久,陶哲轩在评论里指出,经过文献查找,图1中的表述其实未能反映埃尔德什的原始意图,真正的问题并不是只得到一个已有的量级上界,而是要更精确地确定f(m)!
换言之,问题 #650的“真正意图”,是那些历史上著名的数学家在解决完相对容易的部分后,久攻不下的“硬骨头”。
汤泉宇看到陶哲轩的信息时,已经晚上8点。但他没有气馁,因为他感觉到,自己有办法可以进一步收紧上下界。
在凌晨1点多的时候,他如愿推导出了完整的证明。刚得出结果,他就看到陶哲轩在网站上留言,说自己也正在研究同样的问题。汤泉宇就向这位菲尔兹奖得主提交了完整的证明。
随后,由初创科技公司 Harmonic 开发的 AI 系统 Aristotle(亚里士多德)在 Lean 中完成了形式化验证,确认了证明的正确性。这意味着悬而未解的650号问题被彻底解决[3]。
虽然问题 #650并不是数学史上的“大”问题,但其难度也非研究生毕业设计可比。而且,这也不是汤泉宇一系列工作里最重要和最有影响的成果。
他已经推进和解决了多个公开问题。其中一些正在整理成论文,一些已与国内外研究者展开合作,还有一些后来被发现其实已有旧文献解答,只是长期无人注意。
在经历了一次次与未解谜题的交锋后,一个越来越难以回避的问题,也开始浮现出来:
他感到自己不仅是在和毕业季的学分赛跑,更是站在一扇新世界的大门前——数学研究的古老范式,可能正在发生不可逆转的变化。
从竞赛少年到疯狂自学的本科生
汤泉宇现在就读于西安交通大学励志书院数学系的钱学森班。
初中时,数学经常考班级第一,让他自然对数学产生了浓厚兴趣,并顺势自学了高中数学。等到高中,又偶然在网上接触到了数学竞赛的网课,点进去一听,发现非常好玩。
他在高中花了很多时间自学数学竞赛,不过直到上了大学,汤泉宇才意识到,自学的很多所谓数学竞赛知识,其实是高中竞赛根本不会考,到大学专业课里才会教授的东西。
汤泉宇是互联网数学社区培养出来的一代。与他一起解决问题 #650的两位合作者,就是他在网络数学爱好者社区结识的朋友,他们在全国大学生数学竞赛(CMC)决赛的时候还见了面。
图2:汤泉宇同学在母校分享全国大学生数学竞赛(CMC)(数学A类)以及丘成桐大学生数学竞赛经验。| 图源:西安交通大学新闻网
汤泉宇的兴趣光谱十分广泛,每当聊起研究方向,他都会忍不住说:“其实数论、复分析、矩阵分析,我都喜欢做。”
他已经拿到了中国科学技术大学的研究生保送资格,研究方向是组合学。不过很有意思的是,他最早真正着迷的方向,其实是分析和偏微分方程。
汤泉宇刚入学时,数学系最重要的两门基础课《数学分析》和《高等代数》中,授课教师经常会布置一些极具挑战性的课后思考题。
大一上学期的一天,一道关于 PDE 里调和函数性质的思考题卡住了汤泉宇,他便去向一位相熟的分析学博士请教。对方一针见血地指出,这不过是“调和函数的平均值性质”。这让当时刚进校门、连数学分析还没学完的汤泉宇大受震撼:“我实在太想知道那道题怎么做了。”
一腔热血之下,汤泉宇买了一本 PDE 教材,开始在 B 站上对着网课疯狂自学。然而,PDE 的推导需要用到《数学分析III》的诸多内容(西交大的数分课程分为三学期上完)。为了看懂 PDE,汤泉宇被迫在大一上学期,一口气提前赶完了数分一、二、三的全部内容。
那段时间,为了把所有精力都倾注在《数学分析》《复变函数》和《偏微分方程》这三门课上,他做出了一个疯狂的决定——把大量时间压到图书馆里的自学上,甚至有时为了赶自学进度,没能按时参加一些非核心课程。
这种极端的自学方式差点让他付出了惨痛的代价。大学课程毕竟有考勤和平时成绩要求,而汤泉宇当时对时间的分配过于偏向自学,导致一些课程的课堂参与和平时表现受到了影响。
平时分的损失一度让他在期末前承受了很大压力,甚至有一门科目险些挂科。对于钱学森班的学生来说,学业成绩和保研资格紧密相关。这番“走钢丝”的经历至今回想起来仍让他惊出一身冷汗。
而他在《高等代数》这门基础课的学习经历,则更为曲折和富有戏剧性。
被教授“骗”入代数图论
当时全心思扑在分析学上的汤泉宇,几乎没有认真听过高代的正课。不过为了准备CMC,他经由网友的推荐,早早地将谢启鸿的《高等代数》(俗称白皮书)从头到尾刷了一遍。他至今认为这是数学系本科阶段,最有水平的题集。
西交大的高代考试极具特色:卷面满分 100 分,但在卷末往往附带一道 10 分的附加题。如果前面卷面扣了分,只要做对附加题,依然有机会将总分提上去。
汤泉宇因为把主要精力放在自学和竞赛准备上,试卷上一些平时课堂讲过的题目反而一时半会做不出来,但每次都能轻松解决最后的附加题。这成了他高代成绩的“续命仙丹”。
在一次月考后,因为卷面失分较多但做出了附加题,汤泉宇想着老师马上要发试卷,便难得去上了一次高代课。然而课上到一半,台上的王卫教授冷不丁地问了一句:“谁是汤泉宇?”原来他是这次月考唯一解出思考题的学生。
本来被老师记住是一件好事,但当时汤泉宇不这样想。
不出所料,在此后的高代课上,老师经常都要在班里问一句“汤泉宇在不在”,但大多时候都是“不在”。直到快期末时,王卫教授直接在微信上私信他,让他找个时间去一趟办公室,末尾还极其微妙地附带了一个“
”的表情。
极度心虚和紧张的汤泉宇回了一句“好的”,之后却迟迟鼓不起勇气前往办公室。直到期末考试后,他才跟老师坦白了心路历程:当时因为在丘赛中表现不佳,自尊心极度受挫,十分灰心之下才不敢露面。好在后来在阿里巴巴数学竞赛中斩获了奖项,他才重新找回了面对老师的自信。
图3:汤泉宇在丘赛与阿里数学竞赛中的获奖纪念。 | 受访者供图
在那个兵荒马乱的大一学期末,老师并没有责罚他,而是给了他一道“思考题”。
汤泉宇顺手将题目塞进了书包,原本压根没打算去做——因为此时学期结束,他已经不需要再上高等代数的课了。直到几天后的一个深夜,闲来无事的汤泉宇把这道题抽了出来。
然而一动笔,他便发现这道题的难度超乎想象。他也求助过不少朋友,但是无一例外,没人能够解决这个题目。在经历了两周极其曲折的推演后,他终于做出了答案。当时的他对“数学科研”几乎没有概念,只是觉得这道题“骨骼清奇”,不像是一般的课后习题。
“如果当时老师没有骗我是‘思考题’,而是直说是他科研中解决不了的难题,那当时的我大概率连碰都不会去碰它。”
这道题的解决过程一波三折。汤泉宇最初做出来的版本其实是个“伪证”,好在王卫教授随后找来了另外一位学者,合力将证明的漏洞修补完整。老师兴奋地告诉他:要带他一起写一篇文章。这是汤泉宇人生第一次触摸到数学科研的边缘[4]。
不过,这篇处女作并不是由汤泉宇亲笔撰写的。当时的他在学术上还是个纯粹的门外汉,连什么是LaTeX都不知道。
自此之后,主攻代数图论的王卫教授彻底不“演”了。他不再用思考题来当幌子,每次都直接把自己的科研卡点甩给汤泉宇去做。不过,数学研究的常态是残酷的,之后的那些难题汤泉宇一个都没做出来。
其中有一个课题,他甚至在大二时花掉了整整两个月的时间,每天从早到晚埋头死磕。直到查阅了数百篇文献后,他才在一篇文献中痛苦地查到——这个结果早在几十年前就被前人发表了。
但种子一旦发芽便不可遏制。到了2023年11月,已经在代数图论领域积累了一定经验的汤泉宇,开始将目光投向更广阔的荒原。他盯上了一篇关于谱图理论未解难题的经典文献[5]。
文献中罗列的数十个猜想让他跃跃欲试,其中他最感兴趣的,便是Conjecture 1(猜想1)和 Problem 10(问题10)。经过持续的思考,2026年3月,他解答了文献的Problem 10[6]。
不凡的成绩单
2023年,汤泉宇开始翻阅Erdős Problems网站。
在AI进入数学前沿领域之前,他就已经完全解决了7个埃尔德什问题:独立解决了#516、#1044、#1092,还与同班同学李铮合作解决#315,与同班同学胡韬合作解决#974,与合作者解决了#981与#1034。另外他还参与推进了十多个问题,但未能给出完整解答,此处不再一一列举。作为活跃用户,汤泉宇给关注Erdős Problems网站的各国数学研究者留下了深刻印象。
早在大规模引入 AI 辅助研究之前,他已经在传统数学研究中积累了相当扎实的成果:截至目前,他纯靠人工完成的纯数学论文已有 10 篇,发表在Bull. Lond. Math. Soc.、Proc. Amer. Math. Soc.、European J. Combin.等国际数学期刊。
这份履历的重点不在于数量。它说明,在汤泉宇将AI引入研究流程之前,他已经经历过相当完整的数学训练:选题、查文献、写证明、找漏洞、改稿、回应审稿意见。也正因为如此,当大语言模型给出看似漂亮、却常常暗藏漏洞的推理时,他能够判断哪些方向值得继续追,哪些证明必须推倒重来。换句话说,AI 并没有凭空制造出数学能力;而更像是把他原本已经形成的问题嗅觉和辨别能力放大了。
这种被AI放大的能力,让他的解题效率呈现出了惊人的爆发力。汤泉宇曾主动向学校的一位组合数学老师要来10个未解猜想。“他打包发给我后,我用手头的6个AI账号花了一天时间去跑,最后竟然成功解决了其中的7个。”汤泉宇回忆道。
在 AI 进入数学前沿之后,借助 AI 推进并解决 #543、#650 和 #1217 的经历,则带给汤泉宇超出数学本身的影响力。
致力于把数学内容形式化的初创科技公司Harmonic急切地想要向华尔街证明,他们的模型Aristotle除了很擅长翻译Lean语言,也具备推理能力。Harmonic的研究员找上了汤泉宇,希望他能用Aristotle独立解决几个有严肃学术背景的开放问题。
这些研究员本身具备数学专业背景,但是他们缺少一种能力——能识别出哪些问题是现阶段AI可以解决的判断力。哪怕是OpenAI和Google DeepMind也缺少这样的人才。巨头企业通常投入无限的算力,同时分析上千个问题来寻找突破口。目前来看,汤泉宇和Kevin Barreto与Liam Price(见《普通人用AI攻克数学猜想的时代,要来了?》)都具备这种能力。Barreto更是对汤泉宇惺惺相惜,认为他和Liam Price一样,是少数能用AI做重要问题的人。
实际上,汤泉宇和Liam Price早有“合作”。他和朋友李彦阳曾借助 GPT-5.4 Pro 推进并解决问题#1217:李运行模型得到候选证明,汤检查后确认核心论证成立。后来这项工作和Liam Price对#1196的解答被合并成一篇论文,共同作者包括陶哲轩等8人[7]。
“所以我的Erdős number≤陶哲轩的Erdős number + 1。”汤泉宇有些得意。Erdős number是数学界一个很有趣的“合作距离”概念,用来衡量一个数学家与保罗·埃尔德什之间的合作远近。
汤泉宇应下Harmonic的邀请之后,很快就不负所托,用免费的Aristotle模型自动解决了美国加性组合专家Melvyn Bernard Nathanson提出的两个关于Global Product Intersection Sets in Semigroups的问题[8]。随后又解决了匈牙利著名数学家András Sárközy在2001年提出的一个关于Gaps in Multiplicative Sidon Sets的公开问题[9]。
这两篇文章的反响非常之好,Nathanson邀请Harmonic的研究员去纽约数论研讨会讲解汤泉宇和他们共同署名的论文(后者负责Lean语言相关的内容),解释怎么用AI来解决他的问题。
这次研讨会在数学界引发了后续的涟漪。菲尔兹奖得主蒂莫西·高尔斯看到相关报道之后,也开始用其他AI模型(GPT-5.5 Pro)来测试Nathanson的问题,结果发现它只花大约一个小时就产出了一项博士水平的研究成果。他得出结论:“今后对数学作出贡献的‘下界’(最低门槛)将是证明一些大语言模型无法证明的东西,而不再只是解决某个此前无人解决、而尚有人关心的问题。”[10]
这是OpenAI用内部模型推翻单位距离问题的量级猜想之前,在数学界引发热议的话题。突破出现得这么快,汤泉宇也始料未及。他和笔者聊天的时候曾壮着胆子预测道:半年之内AI就可以生成足以冲击顶级数学期刊的成果。结果一周后,预言就实现了。
对于AI的狂飙突进,汤泉宇有几分悲观地认为,负面影响恐怕要高于正面影响:“AI不一定能给出答案,但它会把你带到一个你本来未必会去的地方。”
后记
就在本文写作过程中,汤泉宇与人合作,在AI辅助下证明了著名数学家本·格林(Ben Green)100个开放问题集里的问题90[11]。这位本·格林正是陶哲轩代表作“格林-陶定理”中的那位格林。
与此同时,汤泉宇当下最热衷的课题——一项自2024年便着手研究的图能量问题(不是埃尔德什问题),终于在今年4月末被他与合作者攻克。这项结果写成论文后足足有93页,直到前两天才完稿[12]。
汤泉宇有几分忧伤地说:“这么长的文章,投稿和审稿过程可能会很漫长。”中间他也尝试过使用 AI 辅助,结果确认了一个事实:至少在他的尝试中,现阶段 AI 很难一次性生成这样长而连贯的证明;它可以帮人推进局部思路,但还很难替代人类完成一篇长篇论文从结构到细节的整体组织。
虽然对AI和数学的未来带着些许不安,但汤泉宇应该还是会继续走下去。毕竟,他可能是当前全球范围内,最引人注目的AI辅助数学研究实践者。
参考来源
[1] Erdős Problems. https://www.erdosproblems.com/
[2] QuanyuTang. 650_lowerbound_v1.pdf. https://github.com/QuanyuTang/erdos-problem-650/blob/main/650_lowerbound_v1.pdf
[3] Optimal bounds for an Erdős problem on matching integers to distinct multiples. https://arxiv.org/abs/2603.28636
[4] 生成所有正则有理正交矩阵. ScienceDirect.https://www.sciencedirect.com/science/article/abs/pii/S0024379525002605
[5] Unsolved Problems in Spectral Graph Theory. https://arxiv.org/abs/2305.10290
[6] A Sharp Upper Bound on the Third Adjacency Eigenvalue of a Graph. https://arxiv.org/abs/2603.21181
[7] Primitive Sets and von Mangoldt Chains: Erdős Problem #1196 and Beyond. https://arxiv.org/abs/2605.00301
[8] Global Product Intersection Sets in Semigroups. https://arxiv.org/abs/2604.18869
[9] Gaps in Multiplicative Sidon Sets. https://arxiv.org/abs/2605.02064
[10] Timothy Gowers. A Recent Experience with ChatGPT 5.5 Pro. Gowers’s Weblog. https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/
[11] Almost Affine Invariance over Prime Fields: Green Problem 90. https://arxiv.org/abs/2605.13454
[12] Path-Minimality of p-Energy for Connected Graphs. https://arxiv.org/abs/2605.22730
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2.『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。