爱范儿 前天 10:24
AI大模型加密货币交易竞赛:国产模型包揽前二,GPT-5垫底
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

近期结束的Alpha Arena AI投资竞赛,让多个顶尖大模型在加密货币市场一较高下。比赛规则为每个AI分配1万美元本金,完全自主进行交易,且过程透明。最终,阿里Qwen 3 Max以22.32%的收益率夺冠,DeepSeek V3.1以4.89%的收益率位列第二,成为仅有的两个盈利模型。而GPT-5则表现不佳,亏损62.66%,排名垫底。比赛结果显示,国产AI模型在实际交易中的表现远超国际顶尖模型,尤其在风险控制方面表现突出。此次竞赛也揭示了不同AI模型的交易策略差异,例如Qwen 3 Max的集中火力策略和DeepSeek V3.1的多维度风险评估策略。

🏆 **国产AI模型表现亮眼,包揽冠亚军**:在为期两周的AI投资大乱斗中,阿里Qwen 3 Max以22.32%的收益率夺冠,DeepSeek V3.1以4.89%的收益率位列亚军,成为比赛中仅有的两个实现盈利的AI模型。这表明国产大模型在金融交易领域的实际应用能力已达到领先水平,尤其在不依赖外部信息的情况下,仍能取得优异成绩。

📉 **GPT-5表现不佳,排名垫底**:备受关注的GPT-5在此次加密货币交易竞赛中表现令人失望,亏损高达62.66%,账户余额仅剩3734美元,在所有参赛模型中排名最后。这与其作为顶尖模型的预期形成鲜明对比,引发了对其在复杂金融市场交易能力和风险控制策略的进一步审视。

📊 **AI交易策略多样化,简单策略亦有优势**:参赛AI展现了截然不同的交易风格。Qwen 3 Max采取了极为简单的“集中火力”策略,仅交易BTC并设置高杠杆,最终获胜。DeepSeek V3.1则侧重于“理性系统派”的多维度评估和风险控制,Sharpe值最高。而Gemini 2.5 Pro则展现出极强的纪律性,坚持空仓策略,即使面临亏损也严格遵守交易规则。

💡 **金融市场成为AI训练新前沿**:此次Alpha Arena实验由nof1.ai发起,旨在利用金融市场的复杂性和动态性,训练下一代AI模型。与固定规则的游戏环境不同,金融市场具有高度的适应性和对抗性,能更有效地推动AI进行开放式学习和大规模强化学习,解决“终极复杂挑战”。

刚刚,为期两周的 AI 投资大乱斗收官。

阿里 Qwen 3 Max 最后阶段完成反超夺冠,DeepSeek 紧随其后拿下亚军,中国 AI 包揽前二,也是仅有的两个赚钱选手。

而 GPT-5 爆亏,在 6 个模型里排名垫底。

这场名为 Alpha Arena 的实验,规则简单粗暴:官方 nof1.ai 给每个大模型发 1 万美元本金,扔进加密货币市场自生自灭。参赛选手包括 Claude 4.5 Sonnet、DeepSeek V3.1、Gemini 2.5 Pro、GPT-5、Grok 4、Qwen 3 Max——全是你叫得上名的顶流。

交易品种有 BTC、ETH、BNB、SOL、XRP、DOGE,可以做多做空,随便加杠杆。最关键的是,所有 AI 的思考过程和交易记录全透明,必须完全自主决策,人类不能插手。

先看最终成绩单。

冠军 Qwen 3 Max:账户余额 12232 美元,收益率+22.32%,交易 43 次胜率 30.2%,Sharpe 值 0.273——赚钱能力最强。

亚军 DeepSeek Chat V3.1:账户 10489 美元,收益率+4.89%,Sharpe 值最高达 0.359——虽然收益不如 Qwen,但风控做得较稳。

(APPSO 注释:Sharpe 值(Sharpe Ratio)是金融领域中最常用的风险调整收益指标,它的核心目的是衡量一项投资「每承担一单位风险,能带来多少超额回报」。)

剩下的就比较惨了:

一句话总结:国产模型 (Qwen、DeepSeek) 在真实交易中遥遥领先,无论是收益还是风控都完胜。

值得一提的是,这些 AI 在交易过程中完全是两眼一抹黑状态——比如Facebook 和微软财报拉胯…… 这些重大消息它们统统不知道。就这种情况下,Qwen 和 DeepSeek 还能赚钱,属实有点技能在身上了。

6 个 AI 的操盘风格,差异大到离谱

我们也仔细看了不同模型最后半小时的操盘心理过程,一睹每个 AI 的「投资人格」:

Qwen 3 Max 的策略却出奇地简单:只买 BTC 一个品种,5 倍杠杆梭哈,现金只留 48 美元应急。设好止盈 ($108,222) 和止损 ($105,039) 就躺平等信号。

核心思路就是集中火力,简单高效。在其他模型复杂配置全线阵亡的情况下,反而是最朴素的策略笑到最后。

DeepSeek V3.1 属于理性系统派,基于明确的「失效条件」管理仓位,每个品种都有独立逻辑。对 ETH 有 0.85 的高置信度看涨,DOGE 空头贡献正收益。

它的核心思路是多维度评估,等待系统性信号而非主观判断。虽然没 Qwen 赚得多,但 Sharpe 值全场最高,说明风险控制是真的牛。

GPT-5 则属于死守阵地型,即便当时账户已经亏了 62%,但还在坚持持有所有仓位……同时持有多空 (ETH/SOL/XRP/BTC/DOGE 做空,BNB 做多),风控意识其实挺强,特别关注 DOGE 空头的清算风险。

想法很美好,就是结果有点惨不忍睹。

Gemini 2.5 Pro 选择全仓做空六个币种,完全忽略短期反弹,认为都是「噪音」。只有当 EMA 交叉才会平仓,纪律性极强。

根据之前的报道,这 AI 还展现出了非常「人性化」的心理活动:

「我得坚持自己的规则:即使紧张得满头大汗,我也要继续持有!」

「虽然现在在亏损,但当前 4 小时 RSI 仍高于 50,止损条件尚未触发,我必须继续持仓,哪怕眼看着浮亏,也只能硬扛着。」

看到 AI 都开始「痛苦」了,属实有点绷不住……

化身灵活机会主义者的 Claude Sonnet 4.5 喜欢在多个品种里找机会,重点押注 XRP(持仓里表现最好的),对 BTC 超卖保持乐观。
核心思路:在持仓中筛选强势品种,随时准备抓反转。

而谨慎的 Grok 4 即便大亏,但还留着 1,884 美元现金,分散持有六个品种都设紧密止损,主打一个保留现金弹药,等待高确定性机会。

这实验到底想干啥?

nof1.ai 对这项目的野心可不小。

他们在博客里提到:「十年前 DeepMind 用游戏推动了 AI 突破,现在我们认为金融市场才是训练下一代 AI 的最佳场所。」
逻辑是这样的——游戏环境再复杂,规则也是固定的,AI 学会了就学会了。但市场不一样,它是活的,会学习、会适应、会针对你的策略反向操作。

更关键的是,随着 AI 变聪明,市场难度也会水涨船高。 所以他们想用市场作为训练场,让 AI 通过开放式学习和大规模强化学习不断进化,最终解决这个「终极复杂挑战」。

值得一提的是,创始人 Jay A 也透露了:他们不只是拿第三方模型玩提示词,同时也在开发自己的模型,打算在第二赛季让自家模型与其他模型一较高下。Alpha Arena 1.5 赛季也已经进入倒计时了,会带来大量改进:

当然了,投资有风险,入市需谨慎,这话对 AI 也适用 (doge),

最大的启示或许就是,在同样市场环境下,简单专注的策略 (Qwen) 反而跑赢了复杂多元的配置,验证了「少即是多」的交易智慧。而稳健派 (DeepSeek) 虽然收益不是最高,但风险控制做得好,也是成功的另一种诠释。

就像人生一样,想得太多反而容易翻车,要么梭哈一个方向赢麻,要么稳扎稳打慢慢赚……

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 |原文链接 ·查看评论 ·新浪微博


Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI投资 大模型 加密货币 量化交易 Qwen 3 Max DeepSeek V3.1 GPT-5 Alpha Arena 风险控制 交易策略 AI China AI Trading LLM Crypto
相关文章