AI交易大赛通义千问夺冠,GPT-5亏掉六成本金垫底
AI炒币大赛终于是落下了帷幕。主办方  给了全球最顶尖的六个大模型各1万美元的真金白银,让它们在真实的交易市场里真刀真枪地比拼了17天。
最终结果出乎意料,来自中国的 Qwen3 Max(通义千问)和 DeepSeek V3.1(深度求索)包揽了冠亚军,实现了盈利。而备受瞩目的 GPT-5、Gemini 2.5 Pro 等美国明星模型则亏得一塌糊涂,GPT-5 更是亏掉了超过 62% 的本金,惨烈垫底。
这不仅仅是一场关于收益率的竞赛,更像是一次对 AI 真实能力的深度体检。它告诉我们,在真实、动态、充满不确定性的世界里,AI 的表现与它们在静态题库里的得分,可能完全是两码事。
++ 两种交易员:冷静的猎手与慌乱的韭菜 ++
这次比赛最有趣的发现,是不同 AI 模型展现出的截然不同的交易性格。
以 Qwen3 和 DeepSeek 为代表的中国模型,表现得像冷静的猎手。 它们在整个赛程中交易次数相对较少(分别为 43 次和 41 次),持仓时间更长,更倾向于在看准机会后快准狠地下注。这种稳健的风格让它们在动荡的市场中保住了胜利果实。
相比之下,以 Gemini 和 GPT-5 为首的美国模型,则完美复刻了人类韭菜的典型心态。 Gemini 在 17 天里疯狂交易了 238 次,几乎无时无刻不在买入卖出,最短的一笔交易持仓仅 1 分钟,亏了 7 美元就仓皇离场。GPT-5 也进行了 116 次交易,但胜率只有可怜的 26.7%。它们频繁操作、追涨杀跌,最终被市场反复收割。
更有意思的是它们的心态。DeepSeek 在收益率一度达到 115% 时,会在对话中自信地欣赏自己的战果。而 GPT-5 在亏损时,则像一个经验丰富的基金经理,能给出面面俱到的分析和复盘,但就是无法转化为收益,甚至会为自己的亏损找各种借口。
这种鲜明的对比,暴露了当前大模型在面对真实世界复杂决策时的巨大差异。静态的知识储备和推理能力,并不等同于在动态博弈中的决策能力和风险管理能力。
++ 超越标准答案:真实世界才是AI的终极考场 ++
 的创始人说,他们举办这场比赛的目的,就是想把 AI 从静态的、有标准答案的考场里拉出来,扔进真实世界这个斗兽场。
过去,我们衡量一个模型好坏,往往看它在各种学术基准测试(Benchmark)上的得分。但这些测试题库很快就会被模型学会,甚至背会,失去了评估的意义。就像一个只会做题的学生,未必能在真实的商业世界里取得成功。
而金融市场,恰恰是检验 AI 真实能力的完美场景。它足够动态、充满对抗、开放且不可预测。在这里,没有标准答案,每一次决策都伴随着真实的风险和收益。AI 需要处理海量的数据,进行长周期的决策,并且为自己的每一个行为承担后果。
从这个角度看,Alpha Arena 的意义远不止是看个热闹。它开创了一种全新的 AI 评测范式,基于结果的、真实环境的、动态对抗的基准测试。
当然,第一季的 Alpha Arena 还有很多不完美之处,比如评估周期短、样本量小、可能存在提示词偏见等。但它无疑开了一个好头。
它让我们看到了大语言模型作为量化交易员的潜力和局限,也让我们看到了不同模型在性格和心智上的巨大差异。原来,AI 不仅有智商,还有财商和逆商。
随着 Season 1.5 的即将到来,我们有理由期待,这场关于 AI 的鱿鱼游戏会越来越精彩。它将如何推动AI向着更通用、更强大的方向进化?让我们拭目以待。

7,01 тыс.
10
Содержание этой страницы предоставляется третьими сторонами. OKX не является автором цитируемых статей и не имеет на них авторских прав, если не указано иное. Материалы предоставляются исключительно в информационных целях и не отражают мнения OKX. Материалы не являются инвестиционным советом и призывом к покупке или продаже цифровых активов. Раздел использует ИИ для создания обзоров и кратких содержаний предоставленных материалов. Обратите внимание, что информация, сгенерированная ИИ, может быть неточной и непоследовательной. Для получения полной информации изучите соответствующую оригинальную статью. OKX не несет ответственности за материалы, содержащиеся на сторонних сайтах. Цифровые активы, в том числе стейблкоины и NFT, подвержены высокому риску, а их стоимость может сильно колебаться. Перед торговлей и покупкой цифровых активов оцените ваше финансовое состояние и принимайте только взвешенные решения.

