IT之家 08月21日
GPT-5 Pro 独立做数学研究:读论文后给出更精确边界,OpenAI 总裁称这是生命迹象
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI 的 GPT-5 Pro 在阅读一篇关于凸优化问题的论文后,独立推导出了比原文更精确的阈值和证明,引发广泛关注。尽管其研究成果后被人类研究者超越,但 GPT-5 Pro 的证明思路独特,显示出自主探索和证明数学规律的能力,被 OpenAI 总裁称为“生命迹象”。该研究聚焦于凸优化曲线的凸性问题,尤其是在梯度下降算法中步长选择对优化曲线凸性的影响。GPT-5 Pro 通过运用 Bregman 散度不等式和共强制性不等式等技巧,将关键边界从 1/L 推进到 1.5/L,展示了其在数学推理和发现方面的潜力。

📊 **GPT-5 Pro 独立推导数学规律:** OpenAI 的 GPT-5 Pro 在阅读一篇关于凸优化问题的论文后,自主推导出了比原文更精确的阈值和相应证明,显示出其在数学推理和发现方面的能力,这被视为 AI 的一项重要突破。

📈 **凸优化问题与优化曲线凸性:** 研究的核心是凸优化问题,特别是当使用梯度下降算法优化光滑凸函数时,优化曲线(函数值随迭代次数变化的曲线)是否具有凸性。这与优化算法的收敛性和效率密切相关。

💡 **步长选择的关键影响:** 论文指出,优化曲线的凸性与步长(step size)的选择密切相关。在特定步长范围内(如 η ∈ (0, 1/L]),优化曲线保证是凸的;而在其他范围(如 η ∈ (1.75/L, 2/L)),即使收敛,优化曲线也可能非凸。

🚀 **GPT-5 Pro 的精确化边界:** GPT-5 Pro 通过运用 Bregman 散度不等式和共强制性不等式等数学技巧,成功将论文中关于步长影响优化曲线凸性的边界从 1/L 推进到 1.5/L,展示了其在数学证明上的精细化能力。

🔄 **AI 与人类研究的互动:** 尽管 GPT-5 Pro 的研究成果后被人类研究者更新的论文所超越,但其证明思路与新版论文不同,表明 AI 并非简单模仿,而是具备了独立思考和探索数学规律的能力。这种 AI 与人类研究的互动推动了科学的进步。

AI 已经能够自主思考并证明新的数学规律了?OpenAI 研究人员表示,自己喂给 GPT-5 Pro 一篇论文,结果模型读完之后得到了新的结论。

在凸优化问题当中,GPT-5 Pro 针对一个边界问题,给出了比原文更加精确的阈值和相应证明。消息立即引发全网热议,不到半天推文就有 230 多万次阅读。

不过这位研究人员并没有将 GPT-5 Pro 的研究成果发表成论文,理由是被人类抢先了 —— 这篇论文后来又更新了一个版本,给出了新的边界,这个新的边界又把 GPT-5 Pro 反超了。

但是,GPT-5 Pro 的证明思路与此并不相同,说明它已经具备了独立探索的能力,所以人类的反攻也不影响这是 GPT-5 Pro 的一个新突破。OpenAI 总裁 Brockman 甚至将这一成果称之为“生命迹象”

凸优化曲线是凸的吗?

喂给 GPT-5 Pro 的这篇论文,研究的是凸优化(convex optimization)问题,凸优化是数学最优化的一个子领域,研究定义于凸集中的凸函数最小化的问题。

具体来说,这篇论文题目为《凸优化曲线是凸的吗?》,研究了这样的一个问题:

当使用梯度下降算法优化光滑凸函数时,其产生的优化曲线(optimization curve)是否是凸的?

这里的“优化曲线”指的是函数值 f (x_n) 随迭代次数 n 变化的曲线。如果这条曲线是凸的,意味着优化速率(即相邻两次迭代的函数值下降量)是单调递减的。

关于这个问题,论文的结论是优化曲线凸不凸,关键取决于步长(step size)的选择,具体包括如下几个关键点:

关于第一个结论,证明的核心是证明序列 {f (x_n) - f [(x_(n+1)]} 非递增。

论文作者巧妙地引入辅助函数 g_k (t),将离散的迭代过程转化为连续函数的积分,利用凸函数的性质证明辅助函数的单调性,通过比较相邻两个辅助函数的大小关系,最终证明优化曲线的凸性。

非凸可能区间部分则是构造一个分段函数(二次函数和线性函数的组合)作为反例实现证明。

作者选择特定的初始点 x_0 = -1.8,通过直接计算前三步迭代的函数值下降量,验证在该步长范围内,后面的下降量反而比前面大,违反了凸性要求。

由于 GPT-5 Pro 的证明主要针对的是边界问题,后面四个结论的证明过程在这里就不详细介绍了,感兴趣的话可以阅读原论文。

GPT-5 Pro 给出新边界

在论文的第一版中,作者分别证明了步长不大于 1 / L 和大于 1.75 / L 时的情况,但在 (1 / L, 1.75 / L] 范围内则未有定论。

GPT-5 Pro 则是通过更精细的不等式技巧,用 17 分半的时间把 1 / L 这个边界移动到了 1.5 / L。

而人类检查证明过程的时间,是 25 分钟,GPT-5 Pro 读论文并进行证明的时间还要长。

其核心思路与原论文相似,均是将优化曲线凸性问题转化为证明函数值下降量递减。

但 GPT-5 Pro 巧妙运用了凸 L-光滑函数的两个基本不等式 ——Bregman 散度不等式(提供更紧的下界)和标准的共强制性(cocoercivity)不等式。

通过这种巧妙的代数操作,GPT-5 Pro 成功将凸性条件进一步细化。

再之后,GPT-5 Pro 的发现还未来得及发表,论文原作者就对论文进行了更新,作者新增了一名,关键是证明了 1.75 / L 就是一个精确界限,之前未探索的区间实现了闭合。

其思路是利用凸 L-光滑函数的 Bregman 散度不等式,对三个点对 (x_0,x_1)、(x_1,x_2) 和 (x_0,x_2) 分别建立不等式,之后将三个不等式分别乘以不同权重后求和,并通过恒等式将复杂的梯度项组合化简。

虽然 GPT-5 Pro 给出的证明最后被人类扳回一城,但是,其思路和过程与新版论文不同。

也就是说,GPT-5 Pro 并不是发现了新论文才实现边界的精确化,而是确实具备了自主发现并证明数学规律的能力

参考链接:

本文来自微信公众号:量子位(ID:QbitAI),作者:克雷西

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

GPT-5 Pro 人工智能 数学证明 凸优化 AI 研究
相关文章