4月15日,可靈AI發(fā)布可靈2.0視頻生成模型及可圖2.0圖像生成模型。新模型發(fā)布后被廣泛討論,一方面是因為它已經(jīng)成為一款全球化AIGC產(chǎn)品,在海內(nèi)外都有大量用戶;另一方面也在于,可靈AI也正在給快手帶來更有想象力的新故事。
在前段時間快手的2024年Q4及全年財報中,AI貫穿始終成為了核心的關(guān)鍵詞。在財報發(fā)布后的分析師電話會議中,所有的問題都圍繞AI展開。市場關(guān)心可靈的另一面,也是在好奇快手在AI時代將創(chuàng)造什么樣的新故事。
國產(chǎn)AI視頻持續(xù)彎道超車
從整個行業(yè)層面來看,國產(chǎn)AI視頻正在彎道超車超越海外視頻模型產(chǎn)品。全球著名投資基金、咨詢公司a16z發(fā)布的2025年全球100生成式AI應(yīng)用排行榜中,可靈AI的表現(xiàn)就超過海外的Sora、Midjourney、Runway等海外產(chǎn)品。
一位從業(yè)者告訴藍鯨新聞,“像Sora這類被認為能顛覆行業(yè)的模型,視頻生成效果不如國內(nèi)部分模型,這體現(xiàn)了技術(shù)路線的快速變化和國內(nèi)的追趕速度。”
據(jù)了解,從2024年6月上線以來,至今為止的10個月時間里, 可靈AI已累計完成超20次迭代。快手高級副總裁、社區(qū)科學(xué)線負責(zé)人蓋坤透露:截至目前,全球用戶規(guī)模突破2200萬,客戶涵蓋來自世界各地的超1.5萬開發(fā)者和企業(yè)客戶。
在去年一次活動上,快手副總裁、大模型團隊負責(zé)人張迪曾提到,當(dāng)下可靈發(fā)展最重要的三件事是:保持模型能力全球領(lǐng)先,把握用戶需求,建立商業(yè)循環(huán)。換句話說,就是三個關(guān)鍵詞:模型、產(chǎn)品、商業(yè)化。
這次的發(fā)布活動上,新的可靈AI 2.0圍繞模型、產(chǎn)品有了不一樣的能力,一方面在模型上,此次可靈2.0模型在動態(tài)質(zhì)量、語義響應(yīng)、畫面美學(xué)等維度有了新的能力升級;其次,產(chǎn)品上,可靈AI引入了一種全新的交互理念,并推出了多模態(tài)編輯功能,讓prompt可以用多模態(tài)的方式表示出來,而不純粹是文字。
技術(shù)上, 快手高級副總裁、社區(qū)科學(xué)線負責(zé)人蓋坤介紹,兩款模型在團隊內(nèi)部的多項勝負率評測中,均穩(wěn)居業(yè)內(nèi)第一。在文生視頻領(lǐng)域,可靈2.0對比谷歌Veo2的勝負比為205%,對比Sora的勝負比達367%,在文字相關(guān)性、畫面質(zhì)量、動態(tài)質(zhì)量等維度上顯著超越對手。