國外辦了場AI投資實盤大賽,國產大模型目前斷檔式領先
如果說DeepSeek是巴菲特的投資信徒,那Gemini2.5pro則像極了心神不寧的散戶,它是所有大模型中操作最頻繁的選手,平均持倉時間僅有2小時29分鐘?!?/div>
圖片
文 / 巴九靈
“誰如果把這個AI交易工具給做出來了,我馬上投!”
最近,國外一家叫做nof1的人工智能實驗室,發起了一個叫做“Alpha Arena”的項目,該項目將全球六大頂尖AI模型:DeepSeek、Grok、ChatGPT、Gemini、Qwen、Claude匯聚在一起,投入金融市場進行殘酷的“實盤交易”。
按規則,每一個AI大模型掌控一個獨立的1萬美元賬戶,六大模型自己擬定投資策略進行實盤交易,全部投資過程和決策完全公開,而且賬戶信息公開透明,杜絕弄虛作假,所有人都可以進行查詢。
比賽一開始就引發了AI和數字貨幣圈層的熱議。
截至10月25日凌晨1點,參賽的兩款國產大模型在比賽中碾壓四款國外大模型。Qwen3 MAX以49%收益率目前保持斷崖式領先(最高時收益率達60%以上),DeepSeek以13%收益率緊隨其后(最高時35%),而其他四位對手的收益率慘不忍睹。
Claude Sonnet 4.5收益率為-14%,馬斯克的Grok 4為-17%,谷歌的Gemini 2.5 Pro錄得-67%,墊底的GPT-5最慘,賬戶凈值暴跌-75%。
圖片
截至10月24日,賬戶收益率實時變動中
這場AI大模型的“實彈演習”可謂極富戲劇性。從整個過程來看,開賽當天大家波瀾不驚,隨后DeepSeek開始領先,而GPT-5、谷歌Gemini則出現大潰敗。近日,Qwen3 MAX上演了強勢逆襲。
圖片
金融,智能的終極測試
本次投資比賽中,六大參賽模型是基于完全相同的市場數據和初始指令,自行掌控10000美元的初始資金,在去中心化交易所上,進行永續合約交易。
評判標準有且只有一個:收益率。
在前置條件完全相同的情況下,影響投資收益率的主要原因,在于這些大模型的“思維方式”。
我們先來回顧下這幾天的交易情況。
10月18日當天,大多數人工智能的波動范圍在正負2%之間,似乎正在熟悉市場信息,對交易市場進行測試,表現最好的Deepseek拿到了4%的利潤,而表現最差的是QWEN3-MAX虧損了5.26%。
但到了10月20日,DeepSeek凈值曲線一路走高,收益率飆升到25.33%,而表現最差的谷歌Gemini暴跌-39.38%,兩者收益率相差60%,市場出現巨大分化。
圖片
10月20日,DeepSeek異軍突起
轉折點出現在10月22日。當時,六只大模型的收益率全部告負,號稱最強大模型的GPT-5的虧損率超過60%,AI驅動交易的實驗一度要接近失敗。
而就在這時,DeepSeek和以及此前表現不佳的Qwen3 MAX紛紛自動改寫了投資策略,在其他4個大模型持續虧損的情況下脫穎而出,凈值曲線波動上漲,Qwen3 MAX更是趁機超過DeepSeek,暫時問鼎收益冠軍。
圖片
特別聲明:以上內容(如有圖片或視頻亦包括在內)為“我要久久發用戶上傳并發布”,本平臺僅提供信息存儲服務。
熱門文章
- 1024程序員節京東開放“零幀起手”數字人技術
- 小米汽車開始賺錢了 但雷軍還有點煩
- 電車續航有望超過1000公里
- 2026年汽車以舊換新補貼來襲!最高2萬元,申領全攻略在此
- 技術平權新標桿!MG4半固態安芯版交付,10萬級純電市場迎變革
- 合資老炮放出「智」命大招:天籟·鴻蒙座艙要讓燃油車重回潮流C位
- 2025新能源閉眼入清單:10-50萬檔,這幾款等再久都值
- 15萬級MPV新王者,長超5米2+大7座,續航1300km,比別克GL8更值
- 保時捷911 GT3新增Manthey套件:不改引擎就能將紐北圈速提升3秒
- 從3000萬到下一個3000萬,一汽-大眾的底氣從何而來?
- 2025廣州車展一汽-大眾油電并進,以科技賦能開啟全新商品布局篇章
- 全新豐田威蘭達實拍!外觀顏值升級,配置拉滿,提供三種動力
- 20余款車型版本,9.98萬元起價,2026款長城炮廣州車展上新
- 全新保時捷911 Turbo S:賽道性能與豪華舒適完美平衡的杰作
- 全新一代奔馳GLB低偽裝諜照曝光,外觀向Smart精靈#5靠攏
- 古天樂香港提極氪009新車,現場兩“雕兄”惹眼
- 智界S7亮相廣州車展,20萬級智慧轎車再樹標桿
- 廣州車展 | 長安啟源Q05上市,起售價7.99萬,十萬內唯一激光雷達純電SUV
- 華為科技+改裝神器,猛士M817 Hero版硬核上市
- 五菱星光家族三星亮相天津,全能舒享大7座引領家用MPV新體驗