6月11日報道,四川成都第二屆“一帶一路”科技交流大會現(xiàn)場,騰訊副總裁蔡光忠在接受采訪時表示:起初開發(fā)王者AI,是因為想在王者榮耀玩家掉線的時候用AI頂替。一年后開發(fā)出的AI“絕悟”,會在游戲中自我學習,最終居然可以在游戲中秒殺比賽級玩家了。
此前據(jù)上觀新聞報道,2021年世界人工智能大會騰訊展區(qū),王者榮耀電競職業(yè)選手曾和AI戰(zhàn)隊“王者絕悟”正面對決。
一邊是全國排名前十的5名專業(yè)選手,一邊是空無一人的五張椅子。五局三勝的賽事,AI最終以3:1提前結(jié)束賽事。
在賽后采訪環(huán)節(jié),職業(yè)選手表示,“AI確實太猛了,總能做出異于常人的反應,讓我們招架不住。”已是第二次對戰(zhàn)“王者絕悟”的選手辰鬼也覺得,AI的配合較上一次更為默契。
王者榮耀展區(qū)上的AI席位
“王者絕悟”技術(shù)負責人楊光告訴記者,AI的學習能力于人類而言是碾壓級的,AI一天的訓練量就相當于人類440年的訓練量。
對于“王者絕悟”的訓練始于2017年。起先采用的是“模仿學習”模式,即讓AI模仿人類的打法,但局限在于,人類的最高水平成了AI的“天花板”。2019年之后,AI訓練師改變策略,采用強化學習模式,讓AI之間“互斗”,技藝得以突飛猛進。
從實踐來看,無論是操作的強度還是準度,AI較人類更勝一籌,也呈現(xiàn)出太多出乎意料的打法。“比如人類打法中,多講究兵分多路,各司其職,但AI會一口氣布局4名‘射手’,事實證明,這種人類極少采用的打法居然勝率最高。再如,人類玩家會盡量避免蹭兵線,但AI卻經(jīng)常一哄而上狂蹭兵線,這種打法其實也是AI算出來的全盤收益最大化的打法。”
唯有當AI與人類多次交鋒后形成“套路”,才偶爾會出現(xiàn)漏洞。此時,人類趁虛而入,方有勝利可能。“以前出現(xiàn)過一次,5名人類玩家全部選擇‘射手’角色,且清一色不與AI交鋒,只一路‘推塔’。面對這種正常比賽中絕不可能出現(xiàn)的打法,AI一時無措,結(jié)果人類贏了。”但訓練師會迅速給AI“打補丁”,也就是說,AI經(jīng)此一役,長了記性,以后再出現(xiàn)類似少見戰(zhàn)局,它再不會亂了陣腳。