高通公司于周一宣布,將推出全新人工智能加速芯片。此舉意味著目前在人工智能半導體市場占據主導地位的英偉達,將迎來新的競爭對手。

截至發稿,高通美股盤中漲近20%。

此次推出人工智能芯片,標志著高通的戰略方向發生轉變。此前,高通的業務重心一直集中在無線通信和移動設備領域的半導體研發,并未涉足大型數據中心相關芯片市場。

高通表示,將于2026年上市的AI200芯片,以及計劃于2027年推出的AI250芯片,均可搭載于一套完整的液冷式服務器機架系統中。

高通此舉正與英偉達、AMD保持一致——后兩家公司均推出了全機架式GPU(圖形處理器)系統,該系統可將多達72顆芯片整合,實現 “多芯合一” 的計算機功能。人工智能實驗室運行最先進的AI模型時,正需要這樣的算力支持。

高通這款數據中心芯片,基于其智能手機芯片中的人工智能核心技術——即 “Hexagon 神經處理單元”(Hexagon NPU)研發而成。

“我們首先希望在其他領域證明自身實力,一旦在這些領域站穩腳跟,再向數據中心級芯片領域邁進就會容易得多。” 高通公司數據中心與邊緣計算業務總經理杜爾加?馬拉迪(Durga Malladi)在上周的記者電話會議中表示。

高通進軍數據中心領域,意味著科技行業增長最快的市場——新型人工智能專用服務器集群設備市場,將迎來新的競爭格局。

據麥肯錫預測,截至2030年,全球數據中心相關資本支出將接近6.7萬億美元,其中大部分資金將投入到以人工智能芯片為核心的系統中。

目前,該行業仍由英偉達主導:其GPU芯片占據了超過90%的市場份額,強勁的芯片銷量也推動英偉達的市值突破4.5萬億美元。此外,OpenAI用于訓練GPT系列大語言模型(即ChatGPT背后的技術核心)的芯片,正是來自英偉達。

不過,以OpenAI為代表的企業已開始尋求替代方案。本月早些時候,這家初創公司宣布計劃從全球第二大GPU制造商AMD采購芯片,且有可能入股AMD。與此同時,谷歌、亞馬遜、微軟等科技巨頭也在為其云服務業務研發專屬的人工智能加速芯片。

高通表示,其芯片的核心定位是 “推理”(即運行 AI 模型),而非 “訓練”(指OpenAI等實驗室通過處理數太字節數據、開發新AI功能的過程)。

這家芯片制造商稱,對于云服務提供商等客戶而言,其機架式系統的運維成本最終將更低;且該機架系統的功耗為160千瓦,與部分英偉達GPU機架的高功耗水平相當。

馬拉迪透露,高通還將單獨銷售其人工智能芯片及其他相關組件,這一模式尤其針對超大規模數據中心運營商等客戶 —— 這類客戶更傾向于自主設計機架系統。他還表示,英偉達、AMD等其他人工智能芯片企業,甚至有可能成為高通數據中心部分組件(如中央處理器 / CPU)的客戶。

“我們一直努力確保客戶擁有靈活選擇的空間:他們既可以選擇整套系統,也可以提出‘自主組合搭配’的需求。” 馬拉迪說道。

對于芯片、板卡及機架的具體定價,以及單個機架可搭載的NPU數量,高通公司暫未作出回應。今年5月,高通宣布與沙特阿拉伯的Humain公司達成合作,將為該地區的數據中心提供人工智能推理芯片;Humain公司已確定成為高通的客戶,并承諾將部署足夠多的系統,使總功耗達到200兆瓦。

高通表示,其人工智能芯片相較于其他加速芯片,在功耗、總擁有成本(指設備全生命周期的成本)以及內存管理新方案三個方面具備優勢。此外,高通稱其AI板卡支持768吉字節的內存容量,這一規格高于英偉達和AMD的同類產品。