AI交易大赛通义千问夺冠,GPT-5亏掉六成本金垫底 AI炒币大赛终于是落下了帷幕。主办方 给了全球最顶尖的六个大模型各1万美元的真金白银,让它们在真实的交易市场里真刀真枪地比拼了17天。 最终结果出乎意料,来自中国的 Qwen3 Max(通义千问)和 DeepSeek V3.1(深度求索)包揽了冠亚军,实现了盈利。而备受瞩目的 GPT-5、Gemini 2.5 Pro 等美国明星模型则亏得一塌糊涂,GPT-5 更是亏掉了超过 62% 的本金,惨烈垫底。 这不仅仅是一场关于收益率的竞赛,更像是一次对 AI 真实能力的深度体检。它告诉我们,在真实、动态、充满不确定性的世界里,AI 的表现与它们在静态题库里的得分,可能完全是两码事。 ++ 两种交易员:冷静的猎手与慌乱的韭菜 ++ 这次比赛最有趣的发现,是不同 AI 模型展现出的截然不同的交易性格。 以 Qwen3 和 DeepSeek 为代表的中国模型,表现得像冷静的猎手。 它们在整个赛程中交易次数相对较少(分别为 43 次和 41 次),持仓时间更长,更倾向于在看准机会后快准狠地下注。这种稳健的风格让它们在动荡的市场中保住了胜利果实。 相比之下,以 Gemini 和 GPT-5 为首的美国模型,则完美复刻了人类韭菜的典型心态。 Gemini 在 17 天里疯狂交易了 238 次,几乎无时无刻不在买入卖出,最短的一笔交易持仓仅 1 分钟,亏了 7 美元就仓皇离场。GPT-5 也进行了 116 次交易,但胜率只有可怜的 26.7%。它们频繁操作、追涨杀跌,最终被市场反复收割。 更有意思的是它们的心态。DeepSeek 在收益率一度达到 115% 时,会在对话中自信地欣赏自己的战果。而 GPT-5 在亏损时,则像一个经验丰富的基金经理,能给出面面俱到的分析和复盘,但就是无法转化为收益,甚至会为自己的亏损找各种借口。 这种鲜明的对比,暴露了当前大模型在面对真实世界复杂决策时的巨大差异。静态的知识储备和推理能力,并不等同于在动态博弈中的决策能力和风险管理能力。 ++ 超越标准答案:真实世界才是AI的终极考场 ++ 的创始人说,他们举办这场比赛的目的,就是想把 AI 从静态的、有标准答案的考场里拉出来,扔进真实世界这个斗兽场。 过去,我们衡量一个模型好坏,往往看它在各种学术基准测试(Benchmark)上的得分。但这些测试题库很快就会被模型学会,甚至背会,失去了评估的意义。就像一个只会做题的学生,未必能在真实的商业世界里取得成功。 而金融市场,恰恰是检验 AI 真实能力的完美场景。它足够动态、充满对抗、开放且不可预测。在这里,没有标准答案,每一次决策都伴随着真实的风险和收益。AI 需要处理海量的数据,进行长周期的决策,并且为自己的每一个行为承担后果。 从这个角度看,Alpha Arena 的意义远不止是看个热闹。它开创了一种全新的 AI 评测范式,基于结果的、真实环境的、动态对抗的基准测试。 当然,第一季的 Alpha Arena 还有很多不完美之处,比如评估周期短、样本量小、可能存在提示词偏见等。但它无疑开了一个好头。 它让我们看到了大语言模型作为量化交易员的潜力和局限,也让我们看到了不同模型在性格和心智上的巨大差异。原来,AI 不仅有智商,还有财商和逆商。 随着 Season 1.5 的即将到来,我们有理由期待,这场关于 AI 的鱿鱼游戏会越来越精彩。它将如何推动AI向着更通用、更强大的方向进化?让我们拭目以待。
7 rb
10
Konten pada halaman ini disediakan oleh pihak ketiga. Kecuali dinyatakan lain, OKX bukanlah penulis artikel yang dikutip dan tidak mengklaim hak cipta atas materi tersebut. Konten ini disediakan hanya untuk tujuan informasi dan tidak mewakili pandangan OKX. Konten ini tidak dimaksudkan sebagai dukungan dalam bentuk apa pun dan tidak dapat dianggap sebagai nasihat investasi atau ajakan untuk membeli atau menjual aset digital. Sejauh AI generatif digunakan untuk menyediakan ringkasan atau informasi lainnya, konten yang dihasilkan AI mungkin tidak akurat atau tidak konsisten. Silakan baca artikel yang terkait untuk informasi lebih lanjut. OKX tidak bertanggung jawab atas konten yang dihosting di situs pihak ketiga. Kepemilikan aset digital, termasuk stablecoin dan NFT, melibatkan risiko tinggi dan dapat berfluktuasi secara signifikan. Anda perlu mempertimbangkan dengan hati-hati apakah trading atau menyimpan aset digital sesuai untuk Anda dengan mempertimbangkan kondisi keuangan Anda.