韩国v欧美v日本v亚洲v,国产偷v国产偷v亚洲高清,99久久精品国产导航

11 月 18 日消息，埃隆?馬斯克（Elon Musk）旗下的人工智能公司 xAI 昨日（11 月 17 日）發(fā)布公告，宣布推出最新大語言模型 Grok 4.1，并已面向、?? 平臺及移動應(yīng)用（iOS 和安卓）所有用戶全面推送。

圖片

本次更新旨在全面提升 Grok 在真實世界場景下的可用性。官方表示，Grok 4.1 不僅繼承了前代模型敏銳的智能與高可靠性，更在創(chuàng)造性、情感理解和協(xié)作互動方面實現(xiàn)了重大改進，讓其能夠更精準(zhǔn)地感知用戶細微意圖，提供更具吸引力和人格連貫性的對話體驗。

圖片

Grok 4.1 的性能實現(xiàn)了業(yè)界頂尖水平。在大型語言模型競技場（LMArena）的文本能力排行榜上，其具備深度思考能力的版本（代號：quasarflux）以 1483 的 Elo 分?jǐn)?shù)高居榜首，領(lǐng)先第二名達 31 分。IT之家附上相關(guān)截圖如下：

圖片

更引人注目的是，其無需深度思考的“即時響應(yīng)”版本也以 1465 的 Elo 分?jǐn)?shù)位列第二，性能甚至超越了其他所有模型的“全推理”模式。這一成績相較于前代 Grok 4（排名第 33 位）實現(xiàn)了巨大飛躍，也印證了其在底層能力上的絕對優(yōu)勢。

圖片

除了在通用能力基準(zhǔn)測試中表現(xiàn)出色，Grok 4.1 還在“軟實力”方面取得了顯著進步。在衡量模型情商的 EQ-Bench3 基準(zhǔn)測試和評估創(chuàng)意能力的 Creative Writing v3 測試中，新模型均表現(xiàn)優(yōu)異。

圖片

在評估情感理解、洞察力和人際交往能力的 EQ-Bench3 基準(zhǔn)測試中，Grok 4.1 的推理與非推理模式包攬了榜單前兩名。

圖片

在創(chuàng)意寫作領(lǐng)域，根據(jù) Creative Writing v3 基準(zhǔn)測試結(jié)果，Grok 4.1 的兩種模式分別位列第二和第三，僅次于早期的 GPT-5.1 模型。

圖片

這意味著 Grok 4.1 不僅能處理復(fù)雜的邏輯推理，還能更好地理解并回應(yīng)帶有人類情感的提示，進行富有想象力的內(nèi)容創(chuàng)作，讓其在人機交互中更具“人情味”。

另一項關(guān)鍵改進在于大幅降低了模型的“幻覺”率。對于配備搜索工具的快速響應(yīng)模型而言，由于推理深度和工具調(diào)用預(yù)算有限，容易出現(xiàn)事實性錯誤。

圖片

在 Grok 4.1 的訓(xùn)練后期，特別針對優(yōu)化信息查詢類提示，專注于減少事實性幻覺。根據(jù)對真實世界查詢樣本的評估，新模型的幻覺率已顯著降低，從而為用戶提供更可靠、更準(zhǔn)確的信息。

亚洲欧美日韩精品,亚洲成aⅴ人片在线影院八,国产1024一区二区你懂的,欧美毛片一级的免费的