新智元报道
新智元报道
一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发
真是疯狂!刚刚,谷歌和OpenAI同时拿下ICPC金牌,尤其OpenAI还是满分!ICPC全称国际大学生程序设计竞赛,是世界上最负盛名的编程竞赛之一!规则是在五个小时内,求解十几个极其复杂的编程和算法难题!最终,Gemini成功解答了12道题目中的10道,荣获金牌。OpenAI则全部解答正确,获得满分,拿下金牌!人类呢?139支人类参赛队伍中,只有3支队伍取得了和Gemini 10/12一样的成绩,没有人类队伍获得满分。其中和Gemini战平的唯一中国队伍,是北交大,我们在ICPC全球总决赛放榜的第一时刻也做了深入报道,解析了这支中国最强战队是如何炼成的。力压哈佛MIT!北交大、清华勇夺2025国际大学生程序设计竞赛金牌尤其是,谷歌也特地提到,问题C所有人类队伍都没有解答出来,而谷歌Gemini在半个小时内成功求解!OpenAI则是解决了所有问题,拿下满分!真的是令人震撼的时刻,历史性的一夜,AI在最顶级的编程比赛中彻底的超过了人类!Gemini解出所有参赛人类队伍没有解决的问题C谷歌官方账号宣布了Gemini 2.5 Deep Think的高级版本在ICPC 2025上取得了金牌级别的成绩。据谷歌称,它并没有像今年早些时候为类似国际数学奥林匹克(IMO)那样,为ICPC创建全新训练的模型。参加ICPC的Gemini 2.5与我们在Gemini应用中使用的模型相同。不过,它经过了一些增强,能够在五个小时里不断思考!在ICPC比赛中,只有正确的答案才能得分,而得出答案所需的时间会影响最终得分。比赛开始后,Gemini迅速攀升至前几名,仅用45分钟就正确解答了8道题目。Gemini最终答对了10道题,在大学队伍中获得了第二名。谷歌特别地提到,在比赛中,Gemini成功解决了问题C——其他人类团队均未解决这个问题。问题C要求找到一种解决方案,将液体通过互连的管道网络分配到一组储液器中,目标是找到一种管道配置,使液体尽快充满所有储液器。由于每个管道可能是开放的、关闭的,甚至是部分开放的,因此可能的配置数量无穷无尽,因此寻找最佳配置非常困难。Gemini的解决方法是假设每个储液罐都有一个优先级值,这使得模型能够使用动态规划算法找到最高效的配置。经过30分钟的反复思考,Gemini使用嵌套三元搜索确定了正确的答案。我们对谷歌公布的答案让Cursor进行了评价,Cursor也认为谷歌的求解方法非常完美。其他题目谷歌已经全部公布在GitHub上,感兴趣可以挑战一下~https://github.com/google-deepmind/gemini_icpc2025OpenAI AK ICPC背后的秘密Gemini已经通过解出了让人类全军覆没的超高难度的C题证明了自己的强大实力。但是,还有高手!OpenAI的推理模型直接通关了全场12道题目,AK(All Kill,指解出全部题目) ICPC!背后的研究团队也是连发8条推文来庆祝这一历史性时刻。其中值得注意的是,其中11道题目,都是直接用了大家都能用的GPT-5解决的,只有最难的一道题(可能指的是难倒全部人类的题目C,可能是指最后一个问题L,也可能是其他对大模型而言更困难的问题)是用一个未公布型号的神秘实验推理模型解决的。这个神秘实验模型,会不会就是下一代的全新推理模型呢?最后一条推文中,几位幕后关键研究人员也纷纷被@出来亮相了。查询身份后得知,他们都是o1及之后的这些推理模型的关键研究人员。其中有一位,更是ICPC的2015年世界冠军队伍成员,Borys Minaiev。他为人熟知的算法界ID是:qwerty787788。在当年的这支夺冠队伍的三人中,还有另一位更广为人知的传奇人物,那就是tourist,算法界最强王者,世界第一人!此外,OpenAI首席科学家Jakub Pachocki也是ICPC世界金牌得主,赛后也转发了推文,对该团队的优异表现表达了热烈祝贺。众多ICPC世界顶尖选手加盟OpenAI,是OpenAI能最终训练出AK ICPC的大模型的强大支柱。历史性一夜上次OpenAI抢先谷歌公布IMO结果的时候,还闹出了小小的风波。谷歌和OpenAI都想争一争谁是第一个拿下IMO这种级别赛事的AI。而这一次,两者同时宣布,意义非凡!ICPC全球执行董事,BILL POUCHER博士认为:
文章原文
