在科技界的萬(wàn)眾矚目下,OpenAI于4月17日凌晨通過(guò)一場(chǎng)直播活動(dòng),震撼發(fā)布了其o系列推理模型家族的兩位新成員——o3與o4-mini。據(jù)OpenAI官方宣稱(chēng),這兩款模型代表了他們迄今為止在智能領(lǐng)域的巔峰之作,它們不僅能夠更深入地思考問(wèn)題,還在響應(yīng)速度上實(shí)現(xiàn)了顯著提升。
尤為引人注目的是,o3與o4-mini在工具使用上的智能表現(xiàn)令人贊嘆。它們能夠無(wú)縫集成ChatGPT內(nèi)的各種工具,包括但不限于網(wǎng)絡(luò)搜索、Python數(shù)據(jù)分析、視覺(jué)信息深度解析,甚至圖像生成。這些模型經(jīng)過(guò)特殊訓(xùn)練,能夠自主判斷何時(shí)、以何種方式運(yùn)用這些工具,從而在極短時(shí)間內(nèi)(通常不足一分鐘)給出詳盡且經(jīng)過(guò)深思熟慮的答案,解決復(fù)雜問(wèn)題。
尤為o3與o4-mini是OpenAI首次推出的具備“圖像思考”能力的模型。用戶(hù)只需上傳白板照片、教科書(shū)圖表或手繪草圖,即便圖像質(zhì)量欠佳,這兩款模型也能準(zhǔn)確解讀并進(jìn)行深入分析。更令人驚嘆的是,它們還能實(shí)時(shí)對(duì)圖像進(jìn)行旋轉(zhuǎn)、縮放等操作,以輔助推理過(guò)程。
在性能表現(xiàn)上,o3無(wú)疑成為了OpenAI當(dāng)前最強(qiáng)大的推理模型,其在編碼、數(shù)學(xué)、科學(xué)、視覺(jué)感知等多個(gè)領(lǐng)域均展現(xiàn)出領(lǐng)先實(shí)力。而o4-mini則以其小巧、高效的特點(diǎn),專(zhuān)為追求速度與成本效益的推理任務(wù)而設(shè)計(jì)。在基準(zhǔn)測(cè)試中,o3與o4-mini在數(shù)學(xué)、編碼及視覺(jué)任務(wù)上的卓越表現(xiàn)令人矚目。
除了卓越的推理能力,o3與o4-mini在有害提示的拒絕方面也展現(xiàn)出了高超技巧。OpenAI在訓(xùn)練數(shù)據(jù)中融入了新的拒絕提示,并在系統(tǒng)層面開(kāi)發(fā)了緩解措施,以有效標(biāo)記潛在風(fēng)險(xiǎn)領(lǐng)域的危險(xiǎn)提示。通過(guò)訓(xùn)練一個(gè)推理LLM監(jiān)控器,該監(jiān)控器能夠從人類(lèi)編寫(xiě)的可解釋安全規(guī)范中工作,當(dāng)應(yīng)用于生物風(fēng)險(xiǎn)領(lǐng)域時(shí),成功標(biāo)記了約99%的對(duì)話(huà)。
在用戶(hù)權(quán)限方面,ChatGPT Plus、Pro和Team用戶(hù)將率先體驗(yàn)到o3、o4-mini及o4-mini-high,這些新模型將替代原有的o1、o3-mini及o3-mini-high。而ChatGPT Enterprise和Edu用戶(hù)則將在一周后獲得訪問(wèn)權(quán)限。對(duì)于免費(fèi)用戶(hù)而言,他們可以在提交查詢(xún)前選擇“思考”功能,嘗試使用o4-mini。值得注意的是,所有計(jì)劃中的速率限制均保持不變。
此次更新不僅標(biāo)志著OpenAI在模型發(fā)展上的重要里程碑,也預(yù)示著未來(lái)ChatGPT將朝著更智能、更獨(dú)立執(zhí)行任務(wù)的方向邁進(jìn)。通過(guò)將o系列的專(zhuān)業(yè)推理能力與GPT系列的自然對(duì)話(huà)及工具使用能力相結(jié)合,OpenAI正逐步構(gòu)建一個(gè)更加全面、強(qiáng)大的AI生態(tài)系統(tǒng)。