<ul id="mwmk6"><sup id="mwmk6"></sup></ul>
<ul id="mwmk6"></ul>
    <abbr id="mwmk6"></abbr>
  • <ul id="mwmk6"></ul>
  • <ul id="mwmk6"><sup id="mwmk6"></sup></ul>
    資訊在沃

    英偉達Blackwell GPU助力AI推理速度飛躍,達成千TPS/用戶新高度

       發布時間:2025-05-24 13:12 作者:朱天宇

    英偉達近日宣布了一項令人矚目的成就:其最新推出的Blackwell GPU在meta的Llama 4 Maverick模型上,成功刷新了大型語言模型(LLM)推理速度的世界紀錄。這一突破發生在周四,當時英偉達正式對外公布了這一消息。

    據悉,為了達到這一里程碑,AI基準測試權威機構Artificial Analysis采用了配置了8塊Blackwell GPU的DGX B200節點。這一配置使得系統每用戶每秒能夠生成高達1000個tokens(TPS),這在之前是難以想象的。

    英偉達的技術團隊通過深度優化TensorRT-LLM軟件棧,并結合EAGLE-3技術,對推測解碼草稿模型進行了訓練。這種加速技術通過小型快速草稿模型預測token序列,再由大型目標LLM進行并行驗證。英偉達表示,這種方法的優勢在于單次迭代可能生成多個token,盡管這需要額外的草稿模型計算開銷。經過這些優化,整套服務器系統在峰值吞吐配置下,每秒能夠處理72,000個tokens。

    英偉達進一步解釋說,Blackwell架構與Llama 4 Maverick級別的超大規模語言模型完美適配,這得益于其專為大型語言模型推理加速設計的EAGLE3軟件架構。這一架構與GPU硬件架構形成了協同效應,從而實現了性能的顯著提升。

    英偉達還強調,他們在提高性能的同時,也確保了響應的準確性。測試結果顯示,使用FP8數據格式的準確性與人工分析的BF16數據格式相當。這意味著,在保持高準確性的前提下,英偉達成功地大幅提高了系統的性能。

    英偉達的這一突破,不僅展示了其在GPU技術領域的領先地位,也為大型語言模型的推理加速提供了新的解決方案。隨著人工智能技術的不斷發展,這一突破將對未來的AI應用產生深遠的影響。

     
     
    更多>同類內容
    全站最新
    熱門內容
    本欄最新
     
    亚洲精品视频久久| 亚洲精品在线网站| 中文字幕日韩视频| 日韩精品无码免费一区二区三区 | 精品久久久久久无码中文字幕漫画| 中文字幕日本精品一区二区三区| 午夜精品福利在线| 亚洲国产成人一区二区精品区 | 国产日韩精品视频| 久久乐国产综合亚洲精品| 成人精品视频一区二区三区不卡| 自拍偷自拍亚洲精品偷一| 97久久超碰成人精品网站| 中文精品99久久国产| 亚洲国产精品成人| 成人啪精品视频免费网站| 色花堂国产精品第一页| 曰韩精品无码一区二区三区| 日韩毛片在线免费观看| 精品日产卡一卡二卡麻豆| 91精品国产高清久久久久久io| 成人精品视频在线观看| 国模吧一区二区三区精品视频| 97精品一区二区视频在线观看 | 97久久超碰国产精品2021| 精品国产a∨无码一区二区三区| 久视频精品免费观看99| 91久久精品国产免费一区| 99re热视频这里只精品| 国产成人精品一区二区三区| 国内精品久久人妻无码不卡| 亚洲精品视频久久| 久久国产精品77777| 久久无码人妻精品一区二区三区| 国产女精品视频在ktv| 国内精品伊人久久久影院| 久久香蕉国产线看精品| 久久99国产精品久久99果冻传媒| 美日韩一区二区三区| 久久99精品久久久久久水蜜桃| 久久精品国产亚洲av高清漫画|