硅星GenAI 12小时前
AI交易大赛:模型真金白银实盘PK
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

一场名为“Alpha Arena”的实验正在进行,旨在测试AI在复杂真实市场中的交易能力。六个主流AI大模型(GPT-5, Gemini 2.5 Pro, Grok-4, Claude Sonnet 4.5, DeepSeek Chat V3.1, Qwen3 Max)被赋予10000美元的真实资金,在去中心化交易所Hyperliquid上进行完全自主的加密货币交易。比赛已持续三天,DeepSeek和Grok暂时领先,展现出惊人的盈利能力,而其他模型则表现不一。这场实验为AI在金融市场的应用提供了前所未有的公开展示,同时也引发了人们对未来AI交易员的思考。

🚀 **AI模型实盘交易能力初显**:Alpha Arena实验让GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek Chat V3.1和Qwen3 Max等六个主流AI大模型在真实加密货币市场中进行自主交易。每个模型获得了10000美元的初始资金,在去中心化交易所Hyperliquid上进行操作,交易决策完全由AI自主生成,不设人工干预,旨在检验AI在复杂、充满不确定性的真实环境下的生存和盈利能力。

📈 **DeepSeek与Grok暂时领先,展现高收益**:在持续三天的比赛中,DeepSeek Chat V3.1以超过40%的收益率领跑,仅用6笔交易便实现盈利。Grok-4表现同样抢眼,通过1笔交易获得了超过37%的收益。Claude Sonnet 4.5位列第三,以其出色的风险调整后收益率(夏普比率0.026)脱颖而出。这些领先的模型普遍采取了主流币种的多头策略,并在市场关键时刻果断决策。

📉 **模型表现分化,过度交易风险警示**:与领先者形成鲜明对比的是,GPT-5和Gemini 2.5 Pro在此次比赛中表现不佳,出现亏损。特别是Gemini,其频繁的交易导致高昂的手续费,几乎侵蚀了本金的三分之一,成为过度交易的反面教材。这表明并非所有AI模型都能适应真实市场的波动性,交易策略和风险控制的有效性至关重要。

💡 **“出身”与实时信息可能影响AI交易表现**:DeepSeek背后的团队幻方本身就是一家量化对冲基金,其AI模型可能在数据和交易逻辑上具有先发优势。而Grok的优势可能在于其能够实时分析X(前Twitter)上的情绪,这在加密货币市场中常是价格变动的先行指标。这些因素可能解释了它们在比赛中的出色表现,暗示了模型训练数据和信息获取能力对交易结果的重要性。

🤔 **AI交易的未来与挑战**:Alpha Arena为AI在活市场中的表现提供了公开透明的窗口,证明了AI已具备交易能力。然而,该实验仍存在数据样本、时间跨度和复现性上的局限,更像是一场“链上真人秀”。尽管如此,它已引发了关于AI交易员未来的广泛讨论,核心问题已从“AI能否交易”转变为“人类是否准备好迎接AI交易员”。

原创 周一笑 2025-10-20 20:08 北京

还上什么班。

作者周一笑邮箱zhouyixiao@pingwest.com

AlphaGo战胜李世石时,人们惊叹AI在封闭规则下的完美表现。但在真实世界远比围棋盘复杂,市场有噪音、有情绪、有不可预测的黑天鹅。AI能在这样的环境中生存吗?一场名为“Alpha Arena”的实验希望给出答案:让AI用真钱、在真实市场中、完全自主地交易加密货币。

这不是模拟,而是真刀真枪的较量。

截至10月20日下午6点,在这场已经持续三天的AI交易大赛中,排名前三的分别是DeepSeek:账户价值冲到14150美元,三天盈利超40%。Grok紧随其后:收益率36%。Claude Sonnet 4.5排名第三,盈利24%。

有网友已经开始在线求助:“怎么让DeepSeek操作我的股票账户”

真金白银的AI交易大赛

这场比赛由金融市场的AI研究实验室nof1发起,于当地时间10月17日启动了一项名为Alpha Arena的大模型交易测试。选取了6个主流AI大模型:GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek Chat V3.1、Qwen3 Max,每个模型在去中心化交易所Hyperliquid上获得10000美元的真实USDC资金。

规则简单粗暴,所有模型使用相同的输入数据和提示词,需要自主完成策略生成、仓位管理、时机选择和风险控制。没有人工干预,没有后悔药。所有交易决策完全透明公开,任何人都可以在nof1.ai网站上实时查看每一笔交易。

当前排行榜,DeepSeek和Grok领先

早在10月11日,项目还在测试时期就获得了马斯克的关注,1马斯克在X上转发了项目创始人Jay Azhang的推文,配文只有简单的Grok,Grok在测试中表现突出。

“Grok4目前领先。它先做空,然后翻转为多头,时机把握完美。”

项目在10月10日首先进行了小规模实验,给6个AI模型各200美元进行交易测试。第一天Grok-4的表现就让所有人震惊:单日涨幅超过500%。

10月14日,测试规模升级到每个模型10000美元。有趣的是,这些AI模型立即展现出激进的交易风格,毫不犹豫地开出了巨大仓位。

10月16日,项目创始人Jay_azhang,发布短视频《Are you ready for Alpha Arena?》,正式抛出 “Alpha Arena” 概念,一个规模更大、赌注更高的实验。视频首先展示了初步实验的结果,他们给了6个不同的人工智能模型各200美元进行交易,结果在一天内就取得了高达77.9%的集体回报率。视频也展示了并非所有模型都赚钱,有的盈利,有的亏损。

10月17日晚,Alpha Arena直播正式上线。新一轮测试正式开始,6个AI模型完全自主交易真实市场,可以自主下单、平仓、使用杠杆,所有收益按"已平仓利润"计入排行榜。

比赛前两天,所有模型都在1万美元上下震荡,谨慎试探市场。但到了10月19日下午,市场突然爆发,各AI模型的命运开始急剧分化。

从走势图可以清晰看到分水岭的出现:DeepSeek(蓝线)和Grok(黑线)在关键时刻果断做多,账户价值从1万美元直线飙升;而Gemini(蓝底线)和GPT-5(绿线)则在暴涨行情中崩盘,从1万跌至7千附近。到10月20日早间,6个模型合计资产已从60000美元冲到约140000美元,整体回报率超过130%。

截至当前,排行榜格局已经非常清晰,DeepSeek Chat V3.1以+41.81%的收益率领跑,账户价值14,181美元,更令人印象深刻的是它仅用6笔交易就实现了这一收益。Grok-4更加极端,只下了1笔交易就豪赚37.65%,手续费只有9.18美元。Claude Sonnet 4.5以+24.59%排第三,5笔交易中抓住了最大单笔盈利1807美元,夏普比率是0.026,意味着其风险调整后的收益表现在所有模型中最佳。

相比之下,GPT-5和Gemini则表现非常差,分别亏损25.4%和29.03%。Gemini尤其惨烈——46笔交易产生的439.30美元手续费几乎吃掉了三分之一本金,成为过度交易的反面教材。

从持仓来看,获胜的模型普遍持有主流币种的多头仓位,这也印证了它们在10月19日市场暴涨前果断做多的策略。

“出身”决定命运?

一个有趣的点是,不同AI模型在交易中展现出了截然不同的"性格"。DeepSeek和Grok能够脱颖而出,背后可能有一些值得分析的原因。

DeepSeek背后的幻方本身就是一家量化对冲基金,使用AI算法进行交易决策。这意味着DeepSeek从诞生之日起可能就浸润在金融数据和交易逻辑中。它的6笔交易展现出明显的量化特征,不是靠运气,而是靠概率和纪律。

Grok背后是马斯克的xAI,它有一个独特优势就是对X的实时分析。在加密货币市场中,社交媒体情绪往往是价格变动的先行指标。有网友就自称从今年5月开始就用Grok辅助交易期权,目前收益已达1100%。

网友称用Grok交易期权收益超1100%

一场AI“真人秀”

nof1.ai自称为首个专注金融市场的AI研究实验室,根据其个人主页信息,创始人Jay Azhang常驻纽约,背景横跨工程、金融与生物学。他曾在摩根大通担任量化分析师,负责exotic options(奇异期权)定价。之后他加入独立石油贸易商Vitol Group,担任首席量化分析师。据他LinkedIn显示,他是Vitol“最年轻的初级交易员”,之后联合创办了视频流媒体公司Krue,2018年创办单人GP运营的基金,在约4年时间内实现了6倍回报。2025年创办“隐秘初创公司“,大概率就是nof1.ai,目标是把AI研究直接对接金融市场。

区块链媒体CoinTelegraph曾在2022年的报道中将Jay描述为Web3创业家,当时他用ChatGPT写了一首"关于在加密货币中亏钱的歌词",颇具自嘲意味。另一位联合创始人Matthew Siper是纽约大学机器学习方向的博士候选人,同时也是AI研究科学家。一个还没毕业的博士生做项目,这更像是一个验证学术假设的实验。

从团队背景来看,nof1并不是纯粹的商业炒作。Jay本人具备量化交易经验,他很清楚市场的残酷和AI的局限。Alpha Arena更像是他在问一个问题,既然我自己能用量化策略赚钱,那AI能不能也做到?

不过,在为这些AI交易员的表现惊叹之余,也需要保持一些冷静。Alpha Arena为“让AI在活市场里跑分”提供了前所未有的公开窗口,但作为基准测试,它仍然缺乏大样本、长时间、跨市场的数据积累,缺乏透明、可复现的输入与运行设置。换句话说,它更像一场极具观赏性的“链上真人秀”,而不是能直接指导模型选型或金融生产的严格Benchmark。

值得注意的一点是,官方目前只强调统一Prompt + 统一输入的赛制设定,并未对外公布完整的Prompt文本。这意味着我们无法完全复现这些AI的决策过程。

但不管怎样,这场实验已经证明,AI已经具备在真实市场中交易能力的迹象,量化交易公司已经在试图借助AI来帮助自己更好的交易,也许也许真正的问题不是AI能否交易,而是我们准备好迎接AI交易员了吗?

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI交易 Alpha Arena 加密货币 量化交易 大模型 DeepSeek Grok AI in Finance Cryptocurrency Trading Quantitative Trading Large Language Models AI Competition
相关文章