第一财经头条 前天 17:14
AI投资竞赛:中国大模型夺冠,美国头部模型全线亏损
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

AI大模型投资比赛“Alpha Arena”近日落下帷幕,为期17天。比赛结果显示,两个中国大模型——阿里通义的Qwen3 Max和DeepSeek chat v3.1——成为本次比赛中唯二实现盈利的模型,分别以22.32%和4.89%的收益率夺得冠亚军。相比之下,参与比赛的四大美国头部模型均出现不同程度的亏损,其中GPT-5亏损高达62%,位列所有模型末位。此次比赛由初创公司Nof1发起,旨在测试AI的投资能力,为每个模型账户提供了1万美元的启动资金,使其在真实数字货币市场进行自主交易。比赛过程中,实时收益和交易思路均向公众直播,价格波动和排名持续变化。DeepSeek以其稳定表现获得赞誉,被认为与其母公司量化机构的背景相关,其交易策略偏向理性派。而Qwen3 Max则以每日“All in”一个标的、多倍杠杆的激进策略,最终成为盈利最多的模型。Grok 4交易风格激进,Claude则因犹豫不决而表现不佳,Gemini 2.5则因频繁调仓和高交易费被戏称为“散户”风格。发起方Nof1认为金融市场是AI训练的下一个前沿,但金融行业人士对完全依赖AI投资持保留态度,认为AI缺乏对用户真实情况的理解,且其逻辑基于已有信息而非未来预测,人机结合或许是更优解。

📊 **AI投资竞赛结果出炉:中国模型表现亮眼,美国模型全线亏损** 历时17天的AI大模型投资比赛“Alpha Arena”揭示了AI在真实市场交易中的能力差异。中国大模型阿里通义的Qwen3 Max以22.32%的收益率夺冠,DeepSeek chat v3.1以4.89%的收益率获得亚军,成为本次比赛中仅有的两个盈利模型。与之形成鲜明对比的是,参与比赛的四大美国头部模型均出现亏损,其中GPT-5亏损高达62%,位列末位,显示出在实际市场波动中,不同AI模型策略的有效性存在显著差异。

📈 **不同AI模型的交易策略与风格分析** 本次比赛不仅展示了AI的盈利能力,也揭示了其独特的交易风格。DeepSeek被认为策略稳定,与其量化背景相符,采取理性派的“不换手、不止损、不止盈”模式。Qwen3 Max则以每日“All in”一个标的、多倍杠杆的激进策略脱颖而出,虽然风险极高,但最终实现了最高收益。Grok 4交易风格激进,满仓多个标的,高频跟踪趋势;Claude则因过于讲逻辑而犹豫不决,调仓失败频频;Gemini 2.5则因频繁改变策略、高交易费而被戏称为“散户”风格,显示出AI在面对不可预测的市场时,其决策逻辑和执行方式的多样性。

💡 **金融市场作为AI训练新前沿的潜力与挑战** 发起方Nof1将金融市场视为推动AI发展的下一个最佳训练环境,认为其复杂性和动态性能够促进AI模型的进化。然而,金融行业人士对此持保留态度,指出AI在投资决策中缺乏对用户真实资产状况、家庭、工作现状和投资偏好的理解,单纯的投资建议可能存在风险。此外,AI的底层逻辑是归纳和复现已有信息,而非预测未来。因此,将AI作为一种理性的工具,与人的智慧相结合,或许是应对金融市场挑战的最佳组合,强调了人机协作在未来投资领域的重要性。

GPT-5亏损超62%垫底。

历时17天,AI大模型投资比赛“Alpha Arena”结果出炉,两个中国大模型夺得冠亚军,也是所有模型中唯二两个赚钱的,四大美国头部模型均亏损,GPT-5亏损超62%垫底。

这是一场由初创公司Nof1发起的模型投资基准测试,但并非模拟交易,为了衡量AI投资能力,主办方给每个模型账户发放了一万美元的启动资金,让它们在真实市场自主交易数字货币。Alpha Arena直播整个过程,价格实时波动,并对实时收益进行排名,还可以看到每个模型的交易思路。

参与这次比赛的有六大模型,按最终盈利能力排名,阿里通义的Qwen3 Max在最后阶段反超,排名第一,收益率22.32%,账户余额 12232 美元。DeepSeek chat v3.1紧随其后,收益率4.89%,余额 10489美元 。

Claude Sonnet 4.5、Grok 4、Gemini 2.5 pro、GPT 5排在第三至第六位,亏损幅度均超过30%。尤其是GPT-5亏得最多,账户余额只剩 3734 美元 。

真实市场交易有趣的地方在于,市场永远有波动,是不可预测的,即便最先进的AI也无法保持稳定的收益。这一投资交易竞赛开始于10月18日,持续约两周,排名也持续波动。

例如,Grok 4一度收益排在二位,但最后亏损达45%,排在倒数第三位而DeepSeek交易较为稳定,大部分时间领跑,但就在最后阶段被通义的Qwen3 反超。

就像真正的交易员一样,大模型也有自己的交易风格。

对于DeepSeek的稳定表现,行业将其归因为“专业对口”,毕竟DeepSeek的母公司幻方是量化机构。在持仓方面,DeepSeek覆盖了各个标的,策略简单直接,不换手、不止损、不止盈,属于理性派。

有趣的是Qwen3 Max,每天都在 “All in”一个标的,多倍杠杆,策略出奇地简单,此前方向错误便损失惨重,但从最终结果看反而是盈利最多的一种方向。

Grok 4则被认为交易风格激进,满仓多个标的,高频跟踪趋势,波动较大并不稳定。Claude 最大特点是非常会分析,但太讲逻辑,下手时却犹豫不决,经常调仓失败、反复止损。

亏损较多的Gemini 2.5被网友调侃“交易风格神似散户”,策略反复更改,例如一会做多一会做空,其交易次数远高于前几名的模型,交易费也更高。

对于这次竞赛,发起方Nof1在博客里提到,十年前 DeepMind 用游戏推动了前沿AI 的快速发展,现在他们认为金融市场是下一个AI 时代的最佳训练环境,也是唯一一个随着AI越来越智能而变得越来越难的一个基准。

“我们用市场来训练新的基础模型。”在博客里团队表示,他们想AI 通过开放式学习和大规模强化学习不断进化,最终解决终极复杂挑战。

将投资交给AI真的靠谱吗?有金融行业人士持保留态度,AI并不了解用户真实的资产状况、家庭、工作现状,不知道投资偏好,单纯给出投资建议是危险的行为。此外,AI的底层逻辑是归纳、总结、复现人类社会中已有的信息,而不涉及任何对未来的预测。理性的工具与人的智慧或许才是最佳组合。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI投资 Alpha Arena 大模型 量化交易 数字货币 Qwen3 Max DeepSeek GPT-5 金融科技 AI交易
相关文章