独家对话：AI正改变数学研究，一名中国本科生站在前沿,ai 数学

半个多世纪前数学巨匠留下的未解谜题，正被一名中国大四学生与AI联手破局。从疯狂压缩通识课、自学纯数学的青涩少年，到与陶哲轩深夜探讨解答的科研新锐，西安交通大学的本科生汤泉宇，正以敏锐直觉探索着“人机协同”的数学边界。

我们联系了汤同学，以亲历者的讲述，带您触碰AI浪潮前沿研究者的所思所想。在算力与人脑交织的无人区里，年轻的探路者留下了对这场技术狂飙的清醒审思：“AI不一定能给出答案，但它会把你带到一个你本来未必会去的地方。”

汤泉宇 | 受访者供图

撰文 | 嘉伟

抢在陶哲轩前头出证明的不眠之夜

2026年春，西安交通大学的一间普通宿舍里，显示器的荧光映着汤泉宇略显疲惫却发亮的眼睛。

屏幕右下角的时间显示，大概两个小时后天就要亮了，但他毫无睡意。他向菲尔兹奖得主陶哲轩提交了一份与AI协同完成的证明，此刻仍在等待对方的最新回复。

成功解答数学界开放问题带来的兴奋感，或许是他当下极度紧绷的大四生活里最好的一剂强心针。

大学前两年，为了把每一分钟都压榨给纯数学，汤泉宇做了一个极为疯狂的决定：他将所有与数学无关的通识课、选修课悉数“打包”，统统挪到了大三和大四。

这种“寅吃卯粮”的硬核自学方式很快便让他尝到了苦果。步入高年级，积压的学分像雪崩一样砸来。由于学分缺口巨大，他随时面临着延期毕业的风险。更具黑色幽默的是，因为这种极端的排课，他明天——不，已经是今天——一会还要去上体育课。

但这并不妨碍他继续在数学的无人区里狂奔。

汤泉宇此刻盯着的是名为“Erdős Problems”的网站[1]。这个网站收录了大量由传奇数学家保罗·埃尔德什本人提出或代为发布、却沉寂至今的未解谜题。许多问题表述得非常初等，连高中生都能看懂，但往往已经数十年未有进展。它更像是一个公开运转的“现代数学实战营”，全球的数学家在评论区里不断补充进展、交换灵感。

虽然还是本科生在读，但汤泉宇早在2年前、网站上线没多久的时候，就已经独立解决了若干埃尔德什问题。最近他又开始借助 AI 模型，希望测试 AI 能否提出证明思路。他的作用是识别错误、追问漏洞、重新组织问题，再让 AI 沿着更可靠的方向继续尝试。

他选择了一道有60年历史的难题，编号#650。

图1：这个问题被汤泉宇与两位合作者借助AI解决，并通过Lean语言校验了证明过程。问题的状态从open变为solved。| 图源：T. F. Bloom, Erdős Problem #650

汤泉宇的两位合作伙伴一度认为，这个问题超出了AI的能力范围。但汤泉宇具备一种直觉，他总是能敏锐地找到那些“人机协同”足以攻克的壁垒。他相信这个问题是现阶段可以解决的。

在AI一次次吐出错误的答案之后，终于，他看到了一个可靠的推理过程。经过人工分析后，他认为这就是跨越了60年的解答，并开心地提交了答案。

不过喜悦并未持续太久，陶哲轩在评论里指出，经过文献查找，图1中的表述其实未能反映埃尔德什的原始意图，真正的问题并不是只得到一个已有的量级上界，而是要更精确地确定f(m)！

换言之，问题 #650的“真正意图”，是那些历史上著名的数学家在解决完相对容易的部分后，久攻不下的“硬骨头”。

汤泉宇看到陶哲轩的信息时，已经晚上8点。但他没有气馁，因为他感觉到，自己有办法可以进一步收紧上下界。

在凌晨1点多的时候，他如愿推导出了完整的证明。刚得出结果，他就看到陶哲轩在网站上留言，说自己也正在研究同样的问题。汤泉宇就向这位菲尔兹奖得主提交了完整的证明。

随后，由初创科技公司 Harmonic 开发的 AI 系统 Aristotle（亚里士多德）在 Lean 中完成了形式化验证，确认了证明的正确性。这意味着悬而未解的650号问题被彻底解决[3]。

虽然问题 #650并不是数学史上的“大”问题，但其难度也非研究生毕业设计可比。而且，这也不是汤泉宇一系列工作里最重要和最有影响的成果。

他已经推进和解决了多个公开问题。其中一些正在整理成论文，一些已与国内外研究者展开合作，还有一些后来被发现其实已有旧文献解答，只是长期无人注意。

在经历了一次次与未解谜题的交锋后，一个越来越难以回避的问题，也开始浮现出来：

他感到自己不仅是在和毕业季的学分赛跑，更是站在一扇新世界的大门前——数学研究的古老范式，可能正在发生不可逆转的变化。

从竞赛少年到疯狂自学的本科生

汤泉宇现在就读于西安交通大学励志书院数学系的钱学森班。

初中时，数学经常考班级第一，让他自然对数学产生了浓厚兴趣，并顺势自学了高中数学。等到高中，又偶然在网上接触到了数学竞赛的网课，点进去一听，发现非常好玩。

他在高中花了很多时间自学数学竞赛，不过直到上了大学，汤泉宇才意识到，自学的很多所谓数学竞赛知识，其实是高中竞赛根本不会考，到大学专业课里才会教授的东西。

汤泉宇是互联网数学社区培养出来的一代。与他一起解决问题 #650的两位合作者，就是他在网络数学爱好者社区结识的朋友，他们在全国大学生数学竞赛（CMC）决赛的时候还见了面。

图2：汤泉宇同学在母校分享全国大学生数学竞赛（CMC）（数学A类）以及丘成桐大学生数学竞赛经验。| 图源：西安交通大学新闻网

汤泉宇的兴趣光谱十分广泛，每当聊起研究方向，他都会忍不住说：“其实数论、复分析、矩阵分析，我都喜欢做。”

他已经拿到了中国科学技术大学的研究生保送资格，研究方向是组合学。不过很有意思的是，他最早真正着迷的方向，其实是分析和偏微分方程。

汤泉宇刚入学时，数学系最重要的两门基础课《数学分析》和《高等代数》中，授课教师经常会布置一些极具挑战性的课后思考题。

大一上学期的一天，一道关于 PDE 里调和函数性质的思考题卡住了汤泉宇，他便去向一位相熟的分析学博士请教。对方一针见血地指出，这不过是“调和函数的平均值性质”。这让当时刚进校门、连数学分析还没学完的汤泉宇大受震撼：“我实在太想知道那道题怎么做了。”

一腔热血之下，汤泉宇买了一本 PDE 教材，开始在 B 站上对着网课疯狂自学。然而，PDE 的推导需要用到《数学分析III》的诸多内容（西交大的数分课程分为三学期上完）。为了看懂 PDE，汤泉宇被迫在大一上学期，一口气提前赶完了数分一、二、三的全部内容。

那段时间，为了把所有精力都倾注在《数学分析》《复变函数》和《偏微分方程》这三门课上，他做出了一个疯狂的决定——把大量时间压到图书馆里的自学上，甚至有时为了赶自学进度，没能按时参加一些非核心课程。

这种极端的自学方式差点让他付出了惨痛的代价。大学课程毕竟有考勤和平时成绩要求，而汤泉宇当时对时间的分配过于偏向自学，导致一些课程的课堂参与和平时表现受到了影响。

平时分的损失一度让他在期末前承受了很大压力，甚至有一门科目险些挂科。对于钱学森班的学生来说，学业成绩和保研资格紧密相关。这番“走钢丝”的经历至今回想起来仍让他惊出一身冷汗。

而他在《高等代数》这门基础课的学习经历，则更为曲折和富有戏剧性。

被教授“骗”入代数图论

当时全心思扑在分析学上的汤泉宇，几乎没有认真听过高代的正课。不过为了准备CMC，他经由网友的推荐，早早地将谢启鸿的《高等代数》（俗称白皮书）从头到尾刷了一遍。他至今认为这是数学系本科阶段，最有水平的题集。

西交大的高代考试极具特色：卷面满分 100 分，但在卷末往往附带一道 10 分的附加题。如果前面卷面扣了分，只要做对附加题，依然有机会将总分提上去。

汤泉宇因为把主要精力放在自学和竞赛准备上，试卷上一些平时课堂讲过的题目反而一时半会做不出来，但每次都能轻松解决最后的附加题。这成了他高代成绩的“续命仙丹”。

在一次月考后，因为卷面失分较多但做出了附加题，汤泉宇想着老师马上要发试卷，便难得去上了一次高代课。然而课上到一半，台上的王卫教授冷不丁地问了一句：“谁是汤泉宇？”原来他是这次月考唯一解出思考题的学生。

本来被老师记住是一件好事，但当时汤泉宇不这样想。

不出所料，在此后的高代课上，老师经常都要在班里问一句“汤泉宇在不在”，但大多时候都是“不在”。直到快期末时，王卫教授直接在微信上私信他，让他找个时间去一趟办公室，末尾还极其微妙地附带了一个“

”的表情。

极度心虚和紧张的汤泉宇回了一句“好的”，之后却迟迟鼓不起勇气前往办公室。直到期末考试后，他才跟老师坦白了心路历程：当时因为在丘赛中表现不佳，自尊心极度受挫，十分灰心之下才不敢露面。好在后来在阿里巴巴数学竞赛中斩获了奖项，他才重新找回了面对老师的自信。

图3：汤泉宇在丘赛与阿里数学竞赛中的获奖纪念。 | 受访者供图

在那个兵荒马乱的大一学期末，老师并没有责罚他，而是给了他一道“思考题”。

汤泉宇顺手将题目塞进了书包，原本压根没打算去做——因为此时学期结束，他已经不需要再上高等代数的课了。直到几天后的一个深夜，闲来无事的汤泉宇把这道题抽了出来。

然而一动笔，他便发现这道题的难度超乎想象。他也求助过不少朋友，但是无一例外，没人能够解决这个题目。在经历了两周极其曲折的推演后，他终于做出了答案。当时的他对“数学科研”几乎没有概念，只是觉得这道题“骨骼清奇”，不像是一般的课后习题。

“如果当时老师没有骗我是‘思考题’，而是直说是他科研中解决不了的难题，那当时的我大概率连碰都不会去碰它。”

这道题的解决过程一波三折。汤泉宇最初做出来的版本其实是个“伪证”，好在王卫教授随后找来了另外一位学者，合力将证明的漏洞修补完整。老师兴奋地告诉他：要带他一起写一篇文章。这是汤泉宇人生第一次触摸到数学科研的边缘[4]。

不过，这篇处女作并不是由汤泉宇亲笔撰写的。当时的他在学术上还是个纯粹的门外汉，连什么是LaTeX都不知道。

自此之后，主攻代数图论的王卫教授彻底不“演”了。他不再用思考题来当幌子，每次都直接把自己的科研卡点甩给汤泉宇去做。不过，数学研究的常态是残酷的，之后的那些难题汤泉宇一个都没做出来。

其中有一个课题，他甚至在大二时花掉了整整两个月的时间，每天从早到晚埋头死磕。直到查阅了数百篇文献后，他才在一篇文献中痛苦地查到——这个结果早在几十年前就被前人发表了。

但种子一旦发芽便不可遏制。到了2023年11月，已经在代数图论领域积累了一定经验的汤泉宇，开始将目光投向更广阔的荒原。他盯上了一篇关于谱图理论未解难题的经典文献[5]。

文献中罗列的数十个猜想让他跃跃欲试，其中他最感兴趣的，便是Conjecture 1（猜想1）和 Problem 10（问题10）。经过持续的思考，2026年3月，他解答了文献的Problem 10[6]。

不凡的成绩单

2023年，汤泉宇开始翻阅Erdős Problems网站。

在AI进入数学前沿领域之前，他就已经完全解决了7个埃尔德什问题：独立解决了#516、#1044、#1092，还与同班同学李铮合作解决#315，与同班同学胡韬合作解决#974，与合作者解决了#981与#1034。另外他还参与推进了十多个问题，但未能给出完整解答，此处不再一一列举。作为活跃用户，汤泉宇给关注Erdős Problems网站的各国数学研究者留下了深刻印象。

早在大规模引入 AI 辅助研究之前，他已经在传统数学研究中积累了相当扎实的成果：截至目前，他纯靠人工完成的纯数学论文已有 10 篇，发表在Bull. Lond. Math. Soc.、Proc. Amer. Math. Soc.、European J. Combin.等国际数学期刊。

这份履历的重点不在于数量。它说明，在汤泉宇将AI引入研究流程之前，他已经经历过相当完整的数学训练：选题、查文献、写证明、找漏洞、改稿、回应审稿意见。也正因为如此，当大语言模型给出看似漂亮、却常常暗藏漏洞的推理时，他能够判断哪些方向值得继续追，哪些证明必须推倒重来。换句话说，AI 并没有凭空制造出数学能力；而更像是把他原本已经形成的问题嗅觉和辨别能力放大了。

这种被AI放大的能力，让他的解题效率呈现出了惊人的爆发力。汤泉宇曾主动向学校的一位组合数学老师要来10个未解猜想。“他打包发给我后，我用手头的6个AI账号花了一天时间去跑，最后竟然成功解决了其中的7个。”汤泉宇回忆道。

在 AI 进入数学前沿之后，借助 AI 推进并解决 #543、#650 和 #1217 的经历，则带给汤泉宇超出数学本身的影响力。

致力于把数学内容形式化的初创科技公司Harmonic急切地想要向华尔街证明，他们的模型Aristotle除了很擅长翻译Lean语言，也具备推理能力。Harmonic的研究员找上了汤泉宇，希望他能用Aristotle独立解决几个有严肃学术背景的开放问题。

这些研究员本身具备数学专业背景，但是他们缺少一种能力——能识别出哪些问题是现阶段AI可以解决的判断力。哪怕是OpenAI和Google DeepMind也缺少这样的人才。巨头企业通常投入无限的算力，同时分析上千个问题来寻找突破口。目前来看，汤泉宇和Kevin Barreto与Liam Price（见《普通人用AI攻克数学猜想的时代，要来了？》）都具备这种能力。Barreto更是对汤泉宇惺惺相惜，认为他和Liam Price一样，是少数能用AI做重要问题的人。

实际上，汤泉宇和Liam Price早有“合作”。他和朋友李彦阳曾借助 GPT-5.4 Pro 推进并解决问题#1217：李运行模型得到候选证明，汤检查后确认核心论证成立。后来这项工作和Liam Price对#1196的解答被合并成一篇论文，共同作者包括陶哲轩等8人[7]。

“所以我的Erdős number≤陶哲轩的Erdős number + 1。”汤泉宇有些得意。Erdős number是数学界一个很有趣的“合作距离”概念，用来衡量一个数学家与保罗·埃尔德什之间的合作远近。

汤泉宇应下Harmonic的邀请之后，很快就不负所托，用免费的Aristotle模型自动解决了美国加性组合专家Melvyn Bernard Nathanson提出的两个关于Global Product Intersection Sets in Semigroups的问题[8]。随后又解决了匈牙利著名数学家András Sárközy在2001年提出的一个关于Gaps in Multiplicative Sidon Sets的公开问题[9]。

这两篇文章的反响非常之好，Nathanson邀请Harmonic的研究员去纽约数论研讨会讲解汤泉宇和他们共同署名的论文（后者负责Lean语言相关的内容），解释怎么用AI来解决他的问题。

这次研讨会在数学界引发了后续的涟漪。菲尔兹奖得主蒂莫西·高尔斯看到相关报道之后，也开始用其他AI模型（GPT-5.5 Pro）来测试Nathanson的问题，结果发现它只花大约一个小时就产出了一项博士水平的研究成果。他得出结论：“今后对数学作出贡献的‘下界’（最低门槛）将是证明一些大语言模型无法证明的东西，而不再只是解决某个此前无人解决、而尚有人关心的问题。”[10]

这是OpenAI用内部模型推翻单位距离问题的量级猜想之前，在数学界引发热议的话题。突破出现得这么快，汤泉宇也始料未及。他和笔者聊天的时候曾壮着胆子预测道：半年之内AI就可以生成足以冲击顶级数学期刊的成果。结果一周后，预言就实现了。

对于AI的狂飙突进，汤泉宇有几分悲观地认为，负面影响恐怕要高于正面影响：“AI不一定能给出答案，但它会把你带到一个你本来未必会去的地方。”

后记

就在本文写作过程中，汤泉宇与人合作，在AI辅助下证明了著名数学家本·格林（Ben Green）100个开放问题集里的问题90[11]。这位本·格林正是陶哲轩代表作“格林-陶定理”中的那位格林。

与此同时，汤泉宇当下最热衷的课题——一项自2024年便着手研究的图能量问题（不是埃尔德什问题），终于在今年4月末被他与合作者攻克。这项结果写成论文后足足有93页，直到前两天才完稿[12]。

汤泉宇有几分忧伤地说：“这么长的文章，投稿和审稿过程可能会很漫长。”中间他也尝试过使用 AI 辅助，结果确认了一个事实：至少在他的尝试中，现阶段 AI 很难一次性生成这样长而连贯的证明；它可以帮人推进局部思路，但还很难替代人类完成一篇长篇论文从结构到细节的整体组织。

虽然对AI和数学的未来带着些许不安，但汤泉宇应该还是会继续走下去。毕竟，他可能是当前全球范围内，最引人注目的AI辅助数学研究实践者。

参考来源

[1] Erdős Problems. https://www.erdosproblems.com/

[2] QuanyuTang. 650_lowerbound_v1.pdf. https://github.com/QuanyuTang/erdos-problem-650/blob/main/650_lowerbound_v1.pdf

[3] Optimal bounds for an Erdős problem on matching integers to distinct multiples. https://arxiv.org/abs/2603.28636

[4] 生成所有正则有理正交矩阵. ScienceDirect.https://www.sciencedirect.com/science/article/abs/pii/S0024379525002605

[5] Unsolved Problems in Spectral Graph Theory. https://arxiv.org/abs/2305.10290

[6] A Sharp Upper Bound on the Third Adjacency Eigenvalue of a Graph. https://arxiv.org/abs/2603.21181

[7] Primitive Sets and von Mangoldt Chains: Erdős Problem #1196 and Beyond. https://arxiv.org/abs/2605.00301

[8] Global Product Intersection Sets in Semigroups. https://arxiv.org/abs/2604.18869

[9] Gaps in Multiplicative Sidon Sets. https://arxiv.org/abs/2605.02064

[10] Timothy Gowers. A Recent Experience with ChatGPT 5.5 Pro. Gowers’s Weblog. https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/

[11] Almost Affine Invariance over Prime Fields: Green Problem 90. https://arxiv.org/abs/2605.13454

[12] Path-Minimality of p-Energy for Connected Graphs. https://arxiv.org/abs/2605.22730

特别提示

1. 进入『返朴』微信公众号底部菜单“精品专栏“，可查阅不同主题系列科普文章。

2.『返朴』提供按月检索文章功能。关注公众号，回复四位数组成的年份+月份，如“1903”，可获取2019年3月的文章索引，以此类推。

版权说明：欢迎个人转发，任何形式的媒体或机构未经授权，不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。