<ul id="mwmk6"><sup id="mwmk6"></sup></ul>
<ul id="mwmk6"></ul>
    <abbr id="mwmk6"></abbr>
  • <ul id="mwmk6"></ul>
  • <ul id="mwmk6"><sup id="mwmk6"></sup></ul>
    資訊在沃

    烏鎮(zhèn)“智”新時刻丨大模型面臨高質量數據短缺 國產 AI 數據合成與生產平臺烏鎮(zhèn)“首發(fā)”

       發(fā)布時間:2024-11-19 18:12 作者:陳陽

    記者 張越熙

    11月 19 日下午,行業(yè)大模型、具身智能、算力、芯片、數據合成等10 項首發(fā)成果在烏鎮(zhèn)峰會登臺路演, 其中 AI 數據合成與生產平臺AIGD(AI Generated Data)因聚焦“數據合成”獲廣泛關注。“未來的AI應用需要大量稀缺且難以獲取的長尾數據,如自動駕駛中的極端天氣與極端路況數據,具身智能訓練所需要的復雜場景數據。在此背景下,數據合成成為關鍵。”螞蟻數科AI科技技術負責人、螞蟻天璣實驗室主任李哲現場向記者介紹。

    記者在2024年世界互聯網大會烏鎮(zhèn)峰會了解到,AIGD平臺是由螞蟻數科申報的首發(fā)成果,平臺可通過大規(guī)模合成互聯網所不覆蓋的高質量、高價值垂直語料數據,幫助科技廠商進行 AI 模型訓練。記者了解到,AIGD具備 PB 級數據生產能力,支持數據從生成到訓練全流程自動化處理,自動化率達到 80%,這極大提高了數據處理的效率和質量。平臺自研15 余種數據合成工具,目前可以合成圖片、視頻、3D模型、多模態(tài)圖文視頻對、多輪對話、語音信號、心率腦電信號、結構化交易數據等多模態(tài)數據,以滿足多種應用場景下的 AI 模型訓練需求。

    業(yè)內人士普遍認為,“高質量數據”是 AI 大模型深入到產業(yè)的重要基礎,沒有好的數據做支撐,一切 AI 應用都是空中樓閣。近日,OpenAI員工爆料說,“新模型‘沒有那么大飛躍’”,主要原因之一便是高質量數據不足所導致的。今年 9 月份, OpenAI 發(fā)布推理模型o1,帶來了強化學習訓練新范式,通過自博弈強化學習,將合成數據的形式訓練給大模型,從而大幅增加大模型邏輯推理能力。

    “數據合成”是螞蟻數科 AIGD 平臺的主要功能之一,此外還包括數據標注、質檢等能力。在數據標注方面,通過人機協同進行標注,人工智能算法能夠自動識別和預處理大部分基礎信息,預標注模型依賴人工標注量降低了 70%以上。在數據質檢方面,平臺會根據元信息支持不同粒度的數據質量統計,最大程度理解數據,保證合成及標注后的數據符合預期質量要求。李哲在烏鎮(zhèn)峰會上表示:“我們即將迎來 AI 服務產業(yè)的黃金年代,螞蟻數科將會堅定在 AI ToB 領域投入,讓 AI 深入千行百業(yè)?!?/p>

     
     
    更多>同類內容
    全站最新
    熱門內容
    本欄最新
     
    久久久久人妻精品一区三寸蜜桃| 国产伦精品一区二区三区免费迷| 亚洲国产高清在线精品一区| 久久99精品久久久久久9蜜桃| 日韩精品射精管理在线观看| 国产精品成人一区二区三区| 亚洲国产精品无码久久九九大片| 中文字幕日韩精品有码视频| 九九久久精品国产免费看小说 | 国产成人精品男人的天堂网站| 亚洲国产精品无码久久98 | 久久久久久精品久久久| 亚洲精品二三区伊人久久| 日韩精品无码一区二区中文字幕| 久久99精品国产99久久6男男| 国产在线观看一区精品| 久久精品国产99久久久香蕉| 国产精品男男视频一区二区三区 | 久久久精品人妻一区二区三区| 亚洲码国产精品高潮在线| 日韩精品无码免费专区网站| 久久露脸国产精品| 中文字幕精品1在线| 老司机亚洲精品影视www| 9久久这里只有精品国产| 久久久久国产精品麻豆AR影院| 国产精品视频九九九| 国产成人精品福利网站在线观看| 日韩在线视频免费看| 好吊妞这里有精品| 精品国产日韩亚洲一区在线| 精品国产自在久久| 国产精品无码一区二区三区在| 狠狠色香婷婷久久亚洲精品| 国产国产成人精品久久| 精品一区二区三区免费毛片爱| 91久久精品国产91久久性色tv| 91精品国产自产在线老师啪| 91精品国产综合久久久久| 亚洲精品在线电影| 国产精品亚洲片夜色在线|