<ul id="mwmk6"><sup id="mwmk6"></sup></ul>
<ul id="mwmk6"></ul>
    <abbr id="mwmk6"></abbr>
  • <ul id="mwmk6"></ul>
  • <ul id="mwmk6"><sup id="mwmk6"></sup></ul>
    資訊在沃

    蘋果新研究:AI推理遇瓶頸,微調(diào)數(shù)學(xué)題就“翻車”?

       發(fā)布時(shí)間:2024-10-12 23:42 作者:沈瑾瑜

    蘋果公司研究團(tuán)隊(duì)近期發(fā)表了一篇深入探討大型語(yǔ)言模型(LLM)在數(shù)學(xué)推理方面局限性的論文。該論文指出,盡管LLM在生成類似人類的文本方面表現(xiàn)出色,但在處理簡(jiǎn)單數(shù)學(xué)問題時(shí),若對(duì)問題稍作修改,如增添無(wú)關(guān)信息,其表現(xiàn)便會(huì)顯著下降。

    論文中舉了一個(gè)例子,當(dāng)詢問“奧利弗三天內(nèi)共摘了多少個(gè)奇異果”時(shí),LLM能夠正確計(jì)算。然而,一旦加入如“其中5個(gè)奇異果比平均小”這樣的無(wú)關(guān)細(xì)節(jié),LLM便會(huì)給出錯(cuò)誤答案。研究人員對(duì)數(shù)百個(gè)類似問題進(jìn)行了修改,并發(fā)現(xiàn)幾乎所有這些修改都導(dǎo)致LLM的回答成功率大幅降低。

    研究團(tuán)隊(duì)認(rèn)為,這一現(xiàn)象顯示出LLM并未真正理解數(shù)學(xué)問題,而是依賴于訓(xùn)練數(shù)據(jù)中的模式進(jìn)行預(yù)測(cè)。當(dāng)需要進(jìn)行真正的邏輯推理時(shí),模型往往無(wú)法得出合理結(jié)果。這一發(fā)現(xiàn)為人工智能的發(fā)展提供了重要的參考依據(jù)。盡管LLM在多個(gè)領(lǐng)域都表現(xiàn)出色,但其推理能力仍需進(jìn)一步提升。

     
     
    更多>同類內(nèi)容
    全站最新
    熱門內(nèi)容
    本欄最新
     
    久久国产精品视频| 日韩在线观看第一页| 91久久精品一区二区| 国产亚洲色婷婷久久99精品| 精品国产午夜肉伦伦影院| 日韩黄a级成人毛片| 亚洲AV成人精品日韩一区18p | 18国产精品白浆在线观看免费| 99re6在线精品视频免费播放| 久久精品视频免费看| 亚洲精品乱码久久久久久自慰| 久久久久久久久久久免费精品| 国产精品亚洲mnbav网站| www.亚洲精品| 日本免费精品一区二区三区| 日韩免费观看一区| www.日韩在线| 日韩电影一区二区三区| 国产日韩AV免费无码一区二区| 日韩精品免费一线在线观看| 国产精品久久久久久久久齐齐| 久久久久久精品久久久| 国产精品人人妻人人爽| 国产精品久久久久一区二区三区| 亚洲国产精品无码第一区二区三区| 亚洲精品女同中文字幕| 久久亚洲精品11p| 大香视频伊人精品75| 好吊操这里只有精品| 国产精品视频公开费视频| 国产精品主播叶子闺蜜| 国产精品观看在线亚洲人成网 | 人人鲁人人莫人人爱精品 | 久久乐国产综合亚洲精品| 2021国内久久精品| 国产va精品免费观看| 人妻少妇看A偷人无码精品| 精品久久久久久无码中文野结衣 | 日韩在线视频不卡一区二区三区| 亚洲国产日韩a在线播放| 日韩在线视频一区|