
群众六大主流诳言语模子(LLM)各发1万好意思元,丢进消失着实市集实盘拼杀kaiyun官方网站登录入口,会发生什么?
上周六(10月18日),好意思国东谈主工智能斟酌现实室nof1.ai在其“Alpha Arena”(阿尔法竞技场)平台上举办了一场作为——给六个顶级模子一万好意思元的真金白银,让它们下场往复,况兼并非模拟盘,真金白银地往复。
这六大模子诀别为Anthropic的Claude 4.5 Sonnet、深度求索的DeepSeek V3.1 Chat、谷歌的Gemini 2.5 Pro、OpenAI的GPT 5、xAI的Grok 4和阿里通义的Qwen 3 Max。
测试规章写谈,每个模子得回10,000好意思元的“着实本钱”,在往复所Hyperliquid上,以交流教导词与输入数据条目下,往复加密货币的永续合约。通盘的对话王人在nof1.ai网站上公开可见。
规章称,比赛的标的是“将风险颐养后的收益最大化”:“每个东谈主工智能(AI)模子必须自行产生Alpha(逾额收益)、详情仓位、择时往复并管理风险”。
系统会告诉AI模子现时的时辰、账户信息、捏仓情况,然后附上及时价钱、计算等数据。 然后,要求模子作念出有计算:淌若捏有仓位,是延续捏有还是平仓;淌若空仓,是买入还是延续不雅望。
历程近60小时的激战后,戒指北京时辰周一(10月20日)17:18,DeepSeek的捏仓总市值接近1.4万好意思元,收益率约40%,最高时一度接近1.5万好意思元,是现时清楚最佳的模子。

Grok 4实力次之,现在捏仓总市值在1.33万好意思元隔邻。具体来看,DeepSeek和Grok 4王人依靠作念多比特币和以太坊赢利。
Claude主要往复瑞波币和以太坊,Qwen则专注于以太坊,两者收益位列三四,但也举座跑赢比特币现货的走势。
与之比拟,GPT 5和Gemini已出现了显然吃亏,现在捏仓总市值诀别为7300好意思元和6900好意思元,意味着两个模子已吃亏约2700和3100好意思元,清楚最差。
nof1.ai示意,进行这一竞赛是为了是让基准测试更面对着实天下,而金融市集是最理思的试真金不怕火场,因为这类市集具有动态性、抵抗性、敞开性与高度不能算计性。
“这些特色能以静态测试无法企及的形式,信得过挑战东谈主工智能,”nof1.ai莫得提到本次竞赛的终了时辰,只写谈“第一季将脱手数周,随后推出首要更新的第二季”。
有分析合计,市集早已期待在DeFAI(DeFi + AI)方进取出现杀手级运用,让LLM参与链上博弈有很大的思象空间。
