<ul id="mwmk6"><sup id="mwmk6"></sup></ul>
<ul id="mwmk6"></ul>
    <abbr id="mwmk6"></abbr>
  • <ul id="mwmk6"></ul>
  • <ul id="mwmk6"><sup id="mwmk6"></sup></ul>
    資訊在沃

    微軟rStar-Math技術(shù)助力,小語(yǔ)言模型數(shù)學(xué)推理能力大飛躍!

       發(fā)布時(shí)間:2025-01-11 12:41 作者:顧雨柔

    微軟亞洲研究院的數(shù)學(xué)與人工智能研究團(tuán)隊(duì)近日取得了一項(xiàng)新的技術(shù)突破,他們專為解決數(shù)學(xué)問(wèn)題設(shè)計(jì)并開(kāi)發(fā)了名為rStar-Math的技術(shù)。這項(xiàng)技術(shù)于1月10日通過(guò)官方博文正式對(duì)外公布。

    與微軟此前推出的Phi-4技術(shù)相比,rStar-Math采用了蒙特卡洛樹(shù)搜索(Monte Carlo Tree Search)進(jìn)行推理。這種方法模擬了人類逐步解決問(wèn)題的思維方式,通過(guò)將復(fù)雜問(wèn)題分解成更小的部分,逐步求解,從而提高了解決數(shù)學(xué)問(wèn)題的效率。

    在開(kāi)發(fā)過(guò)程中,研究團(tuán)隊(duì)要求模型輸出自然語(yǔ)言描述和Python代碼形式的“思維鏈”步驟,并將自然語(yǔ)言作為Python代碼的注釋。他們僅使用Python代碼輸出進(jìn)行訓(xùn)練,這一做法旨在使模型更加清晰地展示其解題過(guò)程。

    為了進(jìn)一步提升模型的性能,研究團(tuán)隊(duì)還訓(xùn)練了一個(gè)“策略模型”來(lái)生成數(shù)學(xué)推理步驟,并使用“過(guò)程偏好模型”(PPM)來(lái)選擇最有希望的解題步驟。這兩個(gè)模型通過(guò)四輪“自我進(jìn)化”相互改進(jìn),不斷優(yōu)化其解題能力。

    在訓(xùn)練過(guò)程中,研究團(tuán)隊(duì)使用了74萬(wàn)道公開(kāi)的數(shù)學(xué)應(yīng)用題及其解答作為初始數(shù)據(jù),并利用上述兩個(gè)模型生成了新的解題步驟。這一做法不僅豐富了訓(xùn)練數(shù)據(jù),還有助于模型更好地理解和解決數(shù)學(xué)問(wèn)題。

    測(cè)試結(jié)果顯示,應(yīng)用rStar-Math技術(shù)后,Qwen2.5-Math-7B模型的準(zhǔn)確率從58.8%躍升至90.0%,Phi3-mini-3.8B模型的準(zhǔn)確率也從41.4%提升到86.4%。與OpenAI的o1-preview模型相比,rStar-Math技術(shù)在兩個(gè)模型上的表現(xiàn)分別高出4.5%和0.9%。

    為了讓其他研究者能夠使用和改進(jìn)rStar-Math技術(shù),研究團(tuán)隊(duì)已在Hugging Face上宣布,他們計(jì)劃將rStar-Math的代碼和數(shù)據(jù)在GitHub上公開(kāi)。這一舉措將促進(jìn)數(shù)學(xué)與人工智能領(lǐng)域的交流與合作,推動(dòng)相關(guān)技術(shù)的進(jìn)一步發(fā)展。

     
     
    更多>同類內(nèi)容
    全站最新
    熱門內(nèi)容
    本欄最新
     
    国产成人精品无码专区| 国产在线精品一区二区中文| 午夜精品在线视频| 色妞妞www精品视频| 99久久99久久久精品久久| 无码精品蜜桃一区二区三区WW| 国产精品亚洲精品观看不卡| 日韩国产精品无码一区二区三区| 国产精品V亚洲精品V日韩精品| 国产精品午夜无码体验区| 国产精品毛片AV久久66| 99久久免费看国产精品| 久久精品中文字幕首页| 国产91精品一区二区麻豆亚洲| 国产精品伦一区二区三级视频 | 久久精品国产99国产精偷| 国产午夜精品福利| 伊人久久精品一区二区三区| 激情亚洲一区国产精品| 亚洲精品成人片在线播放| 精品一区二区三区中文| 日韩成人免费视频| 日韩av片无码一区二区三区不卡| 亚洲首页国产精品丝袜 | 无码国产69精品久久久久网站| 国产精品免费久久久久影院| 一级一级特黄女人精品毛片| 四虎国产精品永免费| 一级做a爰黑人又硬又粗免费看51社区国产精品视 | 国产乱码精品一区二区三区四川人| 久久精品国产网红主播| 人妻精品久久无码专区精东影业| 99久久精品费精品国产一区二区| 男人扒开女人下添高潮日韩视频| 久久久久国产精品免费免费搜索| 亚洲精品中文字幕无码AV| 亚洲精品亚洲人成在线麻豆| 精品亚洲国产成人| 国产精品福利一区二区| 99久久亚洲综合精品成人网 | 国产精品午夜无码AV天美传媒|