<ul id="mwmk6"><sup id="mwmk6"></sup></ul>

<ul id="mwmk6"></ul>

<abbr id="mwmk6"></abbr>

<ul id="mwmk6"></ul>

<ul id="mwmk6"><sup id="mwmk6"></sup></ul>

資訊在沃

當前位置：沃資訊 > 科技 > 正文內容

OpenAI新模型性能提升卻頻現“幻覺”，錯誤率為何反增？

發布時間：2025-04-19 08:03 來源：ITBEAR 作者：馮璃月

近期，OpenAI推出了兩款新型模型——o3與o4-mini，這兩款模型在多個領域展示了卓越的性能，然而，它們卻面臨著一個棘手的問題：幻覺現象愈發嚴重。

據TechCrunch報道，幻覺問題一直是生成式AI領域難以攻克的一大難關，即便是業內頂尖的模型也難以完全擺脫其困擾。以往，每一代新模型的發布都會帶來幻覺頻率的小幅降低，但o3與o4-mini卻打破了這一規律。

OpenAI的內部測試結果顯示，作為推理模型的o3與o4-mini，在幻覺問題的出現頻率上不僅超過了前代推理模型o1、o1-mini和o3-mini，甚至高于傳統的“非推理”模型，如GPT-4o。這一現象引發了業內的廣泛關注與討論。

OpenAI在發布的技術報告中指出，隨著推理模型規模的擴大，幻覺問題反而變得更加嚴重，這一原因尚需進一步的研究。盡管o3與o4-mini在編程、數學等任務上的表現有所提升，但由于模型輸出的答案總量增加，導致準確判斷與錯誤、幻覺現象并存。

在OpenAI設計的內部基準測試PersonQA中，o3回答問題時出現幻覺的比例高達33%，幾乎是前代推理模型o1和o3-mini的兩倍。而o4-mini的表現更為糟糕，幻覺率高達48%。這一數據無疑為業界敲響了警鐘。

不僅如此，第三方機構Transluce的測試也證實了這一問題。該非營利AI研究實驗室發現，o3在回答問題時經常會虛構一些“過程操作”。例如，o3曾聲稱在一臺2021款MacBook Pro上“在ChatGPT之外”運行了代碼，并將結果復制進了答案中。然而，實際上o3并不具備執行這種操作的能力。

面對這一問題，OpenAI發言人Niko Felix表示：“解決幻覺問題一直是我們研究的重點方向。我們將繼續努力提升模型的準確性與可靠性，為用戶提供更加優質的AI服務。”盡管面臨挑戰，但OpenAI并未放棄對完美模型的追求。

更多>同類內容

徠卡M11-P Safari特別版發布，72888元售價，藝術品般的精致外觀

05-09

《四海兄弟：故鄉》官宣8月8日發售，沉浸式黑幫故事等你體驗！

05-09

華為鴻蒙電腦震撼發布！老用戶遺憾：不支持升級HarmonyOS 5

05-09

聯想moto新品發布會：小折疊旗艦razr 60 Ultra領銜，價格親民引關注！

05-08

聯想moto razr 60 Ultra AI元啟：超外屏旗艦，拍照合拍新體驗，值得一試！

05-08

理想L7/8/9智能煥新上市，雙腔空懸+新配色，你心動了嗎？

05-08

華為鴻蒙電腦正式登場，全新生態與AI賦能辦公新體驗！

05-08

聯想拯救者創世AI移動工作站震撼發布，4K 3D屏+RTX5090，性能怪獸來襲！

05-08

聯想拯救者AI生態新品發布，拯救者筆記本RTX5070系列國補后僅8999元起

05-08

聯想moto新機大爆發！razr/edge 60系列上市，最低僅售1445元起

05-08

比爾蓋茨新決定：未來20年捐出幾近全部身家，蓋茨基金會2045年關閉

05-08

聯想moto新機razr/edge 60系列登場，折疊直板齊發，最低僅1445元起！

05-08

聯想moto razr 60 Ultra AI元啟：折疊屏新旗艦，AI體驗再升級！

05-08

聯想發布moto buds Clip AI耳機：開放式耳夾，AI助手，499元起售！

05-08

聯想首推個人智能設備AI助手“想幫幫”，AI診修新時代來臨？

05-08

點擊查看更多 +

全站最新

聯想moto razr 60 Ultra震撼發布：驍龍8至尊版小折疊，國補價僅5499元起！

聯想moto razr 60 Ultra震撼發布：驍龍8至尊版小折疊，國補價僅5499元起！

聯想moto razr 60系列發布：Pro版性能強勁，入門版國補價親民！

聯想moto razr 60系列發布：Pro版性能強勁，入門版國補價親民！

徠卡M11-P Safari特別版發布，72888元售價，藝術品般的精致外觀

徠卡M11-P Safari特別版發布，72888元售價，藝術品般的精致外觀

《四海兄弟：故鄉》官宣8月8日發售，沉浸式黑幫故事等你體驗！

《四海兄弟：故鄉》官宣8月8日發售，沉浸式黑幫故事等你體驗！

聯想moto新品大爆發：razr 60系列與edge 60系列全渠道熱售中！

聯想moto新品大爆發：razr 60系列與edge 60系列全渠道熱售中！

華為鴻蒙電腦震撼發布！老用戶遺憾：不支持升級HarmonyOS 5

華為鴻蒙電腦震撼發布！老用戶遺憾：不支持升級HarmonyOS 5

特斯拉廉價版Model Y來襲，14萬起售能否成為新寵？

特斯拉廉價版Model Y來襲，14萬起售能否成為新寵？

海信Vidda貼貼壁紙電視上市，29.9mm超薄設計國補價僅4399元起！

海信Vidda貼貼壁紙電視上市，29.9mm超薄設計國補價僅4399元起！

熱門內容

本欄最新

徠卡M11-P Safari特別版發布，72888元售價，藝術品般的精致外觀

徠卡M11-P Safari特別版發布，72888元售價，藝術品般的精致外觀

《四海兄弟：故鄉》官宣8月8日發售，沉浸式黑幫故事等你體驗！

《四海兄弟：故鄉》官宣8月8日發售，沉浸式黑幫故事等你體驗！

華為鴻蒙電腦震撼發布！老用戶遺憾：不支持升級HarmonyOS 5

華為鴻蒙電腦震撼發布！老用戶遺憾：不支持升級HarmonyOS 5

聯想moto新品發布會：小折疊旗艦razr 60 Ultra領銜，價格親民引關注！

聯想moto新品發布會：小折疊旗艦razr 60 Ultra領銜，價格親民引關注！

聯想moto razr 60 Ultra AI元啟：超外屏旗艦，拍照合拍新體驗，值得一試！

聯想moto razr 60 Ultra AI元啟：超外屏旗艦，拍照合拍新體驗，值得一試！

理想L7/8/9智能煥新上市，雙腔空懸+新配色，你心動了嗎？

理想L7/8/9智能煥新上市，雙腔空懸+新配色，你心動了嗎？

華為鴻蒙電腦正式登場，全新生態與AI賦能辦公新體驗！

華為鴻蒙電腦正式登場，全新生態與AI賦能辦公新體驗！

聯想拯救者創世AI移動工作站震撼發布，4K 3D屏+RTX5090，性能怪獸來襲！

聯想拯救者創世AI移動工作站震撼發布，4K 3D屏+RTX5090，性能怪獸來襲！

沃資訊門戶 · 資訊在沃千萬用戶的默認資訊主頁合作微信：netspread（注明:沃資訊）
Copyright ? wwo.com.cn All rights reserved. 魯ICP備11015305號-23

日韩写真集福利视频| 国内精品一区二区三区在线观看 | 国产精品极品美女自在线观看免费| 国产精品无码一区二区三区免费 | 亚洲精品网站在线观看你懂的| 国产成人精品日本亚洲网站 | 久热爱精品视频在线| 国产精品嫩草视频永久网址| 99热这里只有精品7| 久久国产精品国产自线拍免费| 91精品最新国内在线播放| 成人精品视频在线观看| 日韩免费在线观看视频| 日韩精品一二三区| 国产三级精品三级男人的天堂| 国产精品国产三级国产在线观看| 国模精品一区二区三区视频| 国产乱码精品一区二区三区麻豆| 国产精品久久久久久久久久影院 | 精品国产男人的天堂久久| 日产精品一卡2卡三卡4乱码| 日韩精品无码区免费专区 | 日韩毛片免费一二三| 国产亚洲精品美女久久久久久下载| 国产精品国产三级国快看| 国产成人精品午夜视频'| 国产精品爆乳奶水无码视频| 国产精品亚洲综合一区在线观看| 国产精品无码一区二区三区免费| 国产精品久久久久影视青草| 国产在热线精品视频国产一二| 日韩AV无码不卡网站| 美女内射无套日韩免费播放| 亚洲av日韩av无码| 国产日韩精品一区二区在线观看 | 99视频在线精品免费观看6| www国产精品内射老熟女| 日韩成人国产精品视频| 国产精品亚洲专区无码不卡| 日韩一区二区久久久久久| 久久久无码精品亚洲日韩京东传媒 |