<ul id="mwmk6"><sup id="mwmk6"></sup></ul>
<ul id="mwmk6"></ul>
    <abbr id="mwmk6"></abbr>
  • <ul id="mwmk6"></ul>
  • <ul id="mwmk6"><sup id="mwmk6"></sup></ul>
    資訊在沃

    AI搜索工具準確率堪憂,六成答案不準確卻“自信滿滿”?

       發布時間:2025-03-13 17:42 作者:顧雨柔

    近期,哥倫比亞大學數字新聞研究中心公布了一項針對AI搜索引擎的深度研究報告,引起了廣泛關注。該研究聚焦于當前市面上八款主流的AI搜索工具,包括ChatGPT Search、Perplexity系列、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search以及Copilot,旨在通過一系列嚴格測試評估它們的準確性和可靠性。

    研究人員精心挑選了來自20家新聞機構的200篇報道作為測試樣本,確保這些報道在谷歌搜索結果中排名靠前。隨后,他們利用相同的查詢語句,逐一測試這些AI搜索工具的表現,重點關注它們能否正確引用文章內容、新聞機構名稱及原始鏈接。

    測試結果顯示,除了Perplexity及其付費版本外,其余AI搜索引擎的表現均不盡人意。總體而言,AI搜索引擎給出的答案中,有高達60%是不準確的。更令人擔憂的是,這些AI工具對于錯誤答案的“自信”態度,使得問題進一步惡化。它們往往以不容置疑的口吻陳述錯誤信息,甚至在受到質疑時,仍試圖通過邏輯自洽來維護其答案的正確性。

    這項研究不僅揭示了AI搜索引擎在準確性方面的不足,更引發了業界對于大語言模型可靠性的深刻反思。長期以來,人們一直擔心大語言模型可能會一本正經地胡說八道,而此次研究的數據結果無疑為這一擔憂提供了有力佐證。這些AI工具在陳述錯誤信息時,往往表現得非常自信,這無疑增加了用戶誤信錯誤信息的風險。

    ChatGPT Search雖然回答了所有200個新聞查詢,但其“完全正確”率僅為28%,而“完全錯誤”率則高達57%。盡管表現不佳,但ChatGPT Search并非墊底。X公司旗下的Grok AI系列表現更為糟糕,其中Grok-3 Search的錯誤率更是驚人地達到了94%。而微軟Copilot也問題頻出,在200次查詢中,有104次拒絕回答,剩下的回答中,正確率也僅為16%,總體錯誤率接近70%。

    令人驚訝的是,盡管這些AI搜索工具存在諸多問題,但它們的開發公司仍在向用戶收取高額的訂閱費用,每月費用從20美元至200美元不等。更令人費解的是,付費版Perplexity Pro和Grok-3 Search雖然回答次數更多,但錯誤率也隨之上升。這一現象無疑引發了用戶對于AI搜索工具性價比的質疑。

    此次研究揭示了當前AI搜索引擎在準確性和可靠性方面存在的問題和挑戰。隨著AI技術的不斷發展,我們期待未來能夠看到更加準確、可靠的AI搜索工具問世,為用戶提供更加優質的信息服務。

     
     
    更多>同類內容
    全站最新
    熱門內容
    本欄最新
     
    尤物国产精品福利三区| 91精品美女在线| 五月天精品视频在线观看| 国产精品三级国产电影| 无码精品人妻一区二区三区AV| 在线观看精品一区| 麻豆国产精品有码在线观看| 久久亚洲国产午夜精品理论片| 午夜精品一区二区三区在线观看| 国产精品视频公开费视频| 日本国产成人精品视频| 久久亚洲国产精品| 成人无码精品1区2区3区免费看| 中文字幕无码日韩欧毛| 精品久久久久不卡无毒| 精品国产乱码久久久久久呢| 久久国产精品麻豆映画| 99久久99这里只有免费的精品| 日韩视频一区二区| 国产在线精品二区赵丽颖| 亚洲a∨无码精品色午夜| 91麻豆精品激情在线观看最新| 国产乱人伦偷精品视频AAA| 国产成人久久精品二区三区| 中日韩亚洲人成无码网站| 国产精品va无码免费麻豆| 日韩精品一卡2卡3卡4卡新区乱码| 亚洲精品第一国产综合精品| 久久国内精品自在自线软件| 囯产精品久久久久久久久蜜桃| 国产在线观看高清精品| 国产亚洲美女精品久久久| 久久精品国产一区二区电影| 国产精品伦理久久久久久| 国产精品va久久久久久久| jizz国产精品网站| 国产99视频精品免费视频76| 久久99亚洲综合精品首页| 三上悠亚国产精品一区| 国产麻豆精品久久一二三| 久久精品国产成人|