亚洲欧美日韩精品,亚洲成aⅴ人片在线影院八,国产1024一区二区你懂的,欧美毛片一级的免费的

首頁 > 實用技巧 > 干貨教程 > OpenAI推出全新推理模型o3、o4-mini,以及一個編程智能體

OpenAI推出全新推理模型o3、o4-mini,以及一個編程智能體

發(fā)布時間:2025-04-17 11:49:33來源: 13041198719

4月17日凌晨,OpenAI正式宣布推出目前OpenAI系列里能力最強的推理模型——o3模型和o4-mini模型。

去年12月,OpenAI就預熱過o3推理模型,當時強調的重點是o3模型在解決困難問題上的能力,要顯著強于OpenAI第一代推理模型o1。

而此次正式發(fā)布中,OpenAI不僅強調了o3模型在能力上的領先性,同時還強調了o3的Agent能力,且強調o3是第一代能夠在思維鏈中使用圖像進行推理的模型。

自主調用工具是Agent能力最重要的體現(xiàn)。OpenAI表示,曾看到o3為了解一個特別難的任務,連續(xù)調用了大約600次工具。

隨著OpenAI的O系列、DeepSeek R1等推理模型日趨成熟,業(yè)內(nèi)普遍認為,只需一條指令即可完成整套任務的AI Agent能力將迎來顯著提升。

相比于Google,Anthropic等從去年就開始宣傳Agent能力,甚至已經(jīng)開始推動MCP、A2A等Agent協(xié)議普及的公司,OpenAI之前在Agent能力上的布局相對缺失。而今天的發(fā)布,證明OpenAI在Agent能力上,仍然有自己的思考和布局。

OpenAI宣布, 從今天開始,Plus、Pro和Team用戶就可以使用o3模型和o4-mini模型了,接下來幾周還會推出o3-pro模型,替代過去的o1-pro模型。

在彩蛋環(huán)節(jié),OpenAI還表示,未來將發(fā)布一系列編程工具,重新定義AI時代的編程,首發(fā)的是一個叫Codex CLI的開源輕量化編程agent。Codex CLI可以直接使用OpenAI的模型(最終包括o3和o4-mini),接管本地計算機終端命令行界面,直接進行代碼編寫和文件移動等等。

OpenAI的展示很有意念編程(vibe coding)的味道了:直接在網(wǎng)頁上截圖了一個別人編程好的效果圖,丟給Codex CLI,跟它說做一個html文件復現(xiàn)這個效果,并做一些改動。很快,Codex CLI就自己寫了代碼,調用了系統(tǒng)工具,復現(xiàn)出了一個類似的效果。

OpenAI今日的發(fā)布大致符合預期——o3和 o4-mini已經(jīng)預熱多時,視覺推理與Agent能力也早已在其他公司的模型中有所體現(xiàn)。

不過,從今天的發(fā)布中仍能看出OpenAI在Agent等前沿方向上的布局節(jié)奏,以及將已有能力產(chǎn)品化的獨特能力。

OpenAI的模型迭代,也再一次重新肯定了后訓練Scaling Law的存在。目前看來,AI模型在接下來幾年,仍然會出現(xiàn)能力的快速進化,還未到達瓶頸。

OpenAI的Agent能力,目前更多的是調用自身的工具

OpenAI此次發(fā)布的一大亮點在于Agent的能力。最初的兩個展示都與工具調用能力有關。

第一個展示是研究員給了OpenAI一個十年前寫過的論文圖片,讓o3模型找到一個特定的結果,并和最新的研究成果進行比較。

o3模型首先利用內(nèi)置的視覺推理能力,放大圖片,找到了研究員想要的特定結果,然后根據(jù)圖片中的內(nèi)容進行推理,算出了論文推導的數(shù)值,然后使用搜索功能,查找了十篇論文,比較了最新研究成果與作者十年前論文的結果的區(qū)別,最后給出了自己的建議。

第二個演示是研究員問OpenAI,根據(jù)我的興趣,讀新聞,告訴我一些我可能感興趣的事情。

這個演示則利用的是OpenAI內(nèi)置的記憶工具——OpenAI幾天前剛剛宣布OpenAI的模型目前有了可以訪問用戶全量記憶的能力。

o3模型先是訪問記憶后,找出用戶喜歡水肺潛水和彈奏音樂,然后利用搜索功能,找到了一條交叉兩條興趣的新聞:研究人員會錄下健康珊瑚礁的聲音,然后用水下?lián)P聲器在海里播放這些聲音,以保護珊瑚。

最后o3模型使用了OpenAI的canvas工具和數(shù)據(jù)分析工具,生成了一個漂亮的博客界面,完成了任務。

可以看到,在OpenAI目前的布局當中,Agent能力更多的是調用OpenAI的內(nèi)部工具。

不過,在基礎的工具調用能力水平存在的情況下,如果想要接入其他工具,似乎也并不是很難。OpenAI今年3月剛剛宣布接入MCP協(xié)議,為之后使用其他工具打下了基礎。

o4-mini 表現(xiàn)出色,RL的Scaling Law仍在起作用

雖然在去年12月OpenAI曾經(jīng)預熱過o3模型的具體能力,這次正式發(fā)布,官方表示因為進行了「對推理成本和實用性做了大量優(yōu)化」,在評測結果上,OpenAI表示可能會有差別。

在發(fā)布會直播中,OpenAI展示了幾組測試結果,o3模型和o4-mini模型在數(shù)學能力、代碼能力和多模態(tài)能力上都表現(xiàn)出色:

干貨教程更多>>

上周去看了一下小鵬MONA M03 Max,去的是萬象前海的店,那里的展車是白色的 蔚來汽車十年虧損1300億,李斌在絕望的邊緣 熱泵上車 冬天多跑100多公里!10萬級最值得買的純電SUV 埃安Y登場 廣汽埃安霸王龍自動駕駛車獲路測牌照 廣汽埃安肖勇:不能把年輕人當智駕小白鼠,否則是不講良心 新款捷達VS7內(nèi)飾諜照曝光 未來將推出捷達VS8車型 熱泵上車 冬天多跑100多公里!10萬級最值得買的純電SUV 埃安Y登場 搭載EA211增程器,純電續(xù)航350km,大眾首款增程SUV來了 長安汽車:深藍、阿維塔在目標人群、產(chǎn)品定位、用戶價值上都有區(qū)隔和側重 小機身卻有大能量!vivo S30 Pro mini 影像性能測評 長城汽車發(fā)布國內(nèi)首個越野技能分級標準 長安皮卡:全球化與數(shù)智化雙翼齊飛,引領未來價值新紀元 長安逸動放大招!主流A級車降至5.09萬起,對比日產(chǎn)軒逸誰更香? 帕薩特不到15萬就能落地?紅旗H5 PHEV車主,現(xiàn)在誰還買燃油車 悅達起亞5月銷量達22,075輛,同比增長15.7% 揚眉吐氣,二代哈弗梟龍MAX五月賣了8000多輛 搭載EA211增程器,純電續(xù)航350km,大眾首款增程SUV來了 李云飛:無論外界再怎么追流量和營銷,比亞迪的信條仍是技術創(chuàng)新 直擊股東大會 | 比亞迪:高端化是必須打贏的一場仗 皮卡新能源化加速推進,吉利雷達再推電混新品 上市半年降18萬,寶馬5系裸車價格跌至26萬 華晨寶馬換帥:寶思齊接任總裁兼CEO 王炸組合!德國精工+華為智駕,一汽奧迪Q6L e-tron重構豪華電動底層邏輯 以人為本才是真豪華,沃爾沃用安全哲學打破參數(shù)崇拜 四款燃油轎車來襲 雷克薩斯ES 200灣曜特別版領銜 長城汽車重組后,阿維塔將推出百萬豪車,最快明年即將上市 問界智享服務再升級 重新定義高端新能源服務標準 仰望U8L鼎級豪華上新!粵港澳車展仰望全車系硬核圈粉 小鵬 × 華為,開啟智能出行新紀元! 小鵬聯(lián)手華為造出世界最好的AR-HUD,新車小鵬G7首發(fā)搭載