<ul id="mwmk6"><sup id="mwmk6"></sup></ul>
<ul id="mwmk6"></ul>
    <abbr id="mwmk6"></abbr>
  • <ul id="mwmk6"></ul>
  • <ul id="mwmk6"><sup id="mwmk6"></sup></ul>
    資訊在沃

    蘋果英偉達合作開源ReDrafter,LLM推理速度飆升2.7倍!

       發布時間:2024-12-19 08:07 作者:趙云飛

    蘋果公司近期宣布與英偉達攜手合作,共同推出了一項名為Recurrent Drafter(簡稱ReDrafter)的創新技術,這項技術旨在顯著提升人工智能大語言模型(LLM)的推理速度。這一消息是在12月18日通過蘋果公司的官方博文發布的。

    據悉,ReDrafter技術已經成功融入英偉達的TensorRT-LLM推理加速框架中。這一整合使得在英偉達GPU上運行的LLM模型,每秒生成的tokens數量最高可提升2.7倍。這一顯著的性能提升,不僅有效減少了用戶在使用過程中的延遲感受,還大幅度降低了計算成本。

    蘋果公司的機器學習專家強調,隨著LLM在生產應用程序中的廣泛應用,提高推理效率已經成為降低計算成本和減少用戶延遲的關鍵因素。ReDrafter技術的推出,正是對這一需求的積極響應。

    ReDrafter的核心在于其獨特的RNN草稿模型,該模型結合了波束搜索(beam search)和動態樹注意力(dynamic tree attention)技術。這一創新設計使得開源模型在每一步生成過程中最多可以產生3.5個tokens,從而超越了以往推測性解碼技術的性能表現。

    為了將ReDrafter技術應用于實際生產環境,蘋果公司與英偉達展開了深度合作。雙方共同努力,將ReDrafter成功集成到英偉達的TensorRT-LLM框架中。這一合作不僅展現了蘋果與英偉達在技術創新方面的深厚實力,也體現了雙方在推動AI技術發展方面的共同愿景。

    為了支持ReDrafter技術的集成,英偉達對其TensorRT-LLM框架進行了多項優化。這包括添加新的運算符以及公開現有運算符,以增強框架對復雜模型和解碼方法的適應能力。這些優化措施為ReDrafter技術的順利應用提供了有力保障。

    基準測試結果顯示,在使用集成了ReDrafter的TensorRT-LLM框架的英偉達GPU上,數百億參數規模的生產模型的解碼速度得到了顯著提升,最高可達2.7倍。這一成果不僅顯著降低了用戶體驗延遲,還減少了GPU的使用數量和功耗,從而進一步降低了運營成本。

    這一合作成果的發布,標志著蘋果與英偉達在AI技術領域的合作邁出了重要一步。未來,雙方將繼續攜手共進,共同推動AI技術的創新與發展,為更多用戶提供更加高效、智能的服務。

     
     
    更多>同類內容
    全站最新
    熱門內容
    本欄最新
     
    亚洲人成在线精品| 久久精品成人免费观看| 在线日韩日本国产亚洲| 少妇人妻偷人精品视蜜桃| 国产精品久久久久9999高清| 久久精品人人做人人爽电影蜜月 | 国产网红无码精品视频| 国产成人无码精品久久久免费 | 国产一区麻豆剧传媒果冻精品| 人妻偷人精品成人AV| 日韩精品无码人成视频手机| 国产精品久久免费视频| 麻豆亚洲AV成人无码久久精品 | 思思99re66在线精品免费观看| 中文字幕国产精品| 91久久国产精品| 亚洲精品白色在线发布| 久久精品黄AA片一区二区三区| 国产精品区免费视频| 国产啪精品视频网站| 中文国产成人精品久久app| 国产成人精品日本亚洲专区| 亚洲麻豆精品国偷自产在线91| 日韩在线一区二区三区视频| 亚洲国产精品日韩在线| 2019日韩中文字幕MV| 日韩av无码中文无码电影| 日韩精品在线观看| 日韩精品无码熟人妻视频| 日韩精品无码人成视频手机| 国产91成人精品亚洲精品| 精品无码人妻一区二区三区18| 麻豆精品人妻一区二区三区蜜桃| 亚洲色精品VR一区区三区| 亚洲爆乳精品无码一区二区| 99在线精品国自产拍中文字幕 | 久热爱精品视频在线| 亚洲AV无码之国产精品| 成年男女男精品免费视频网站| 欧洲精品在线观看| 国产亚洲情侣久久精品|