<ul id="mwmk6"><sup id="mwmk6"></sup></ul>
<ul id="mwmk6"></ul>
    <abbr id="mwmk6"></abbr>
  • <ul id="mwmk6"></ul>
  • <ul id="mwmk6"><sup id="mwmk6"></sup></ul>
    資訊在沃

    摩爾線程Torch-MUSA v2.0.0升級:全面支持FP8與PyTorch 2.5.0

       發布時間:2025-05-09 23:11 作者:鐘景軒

    摩爾線程公司近期正式揭曉了其面向PyTorch深度學習框架的MUSA擴展庫新版本——Torch-MUSA v2.0.0。此次發布標志著摩爾線程在AI計算領域邁出了重要一步。

    該新版本基于MUSA Compute Capability 3.1計算架構,帶來了多項突破性升級。其中,最引人注目的是原生支持FP8數據類型。FP8作為一種前沿的低精度格式,對于大語言模型(LLM)的訓練至關重要。在支持FP8的GPU上,采用FP8混合精度可以顯著提升GPU的算力,并大幅降低顯存占用。

    摩爾線程的全功能GPU,憑借新一代MUSA Compute Capability 3.1計算架構,原生支持FP8計算。這一底層架構的優勢為Torch-MUSA v2.0.0提供了堅實的基礎,使其能夠充分發揮FP8的計算效能,在大語言模型的訓練和推理中展現出更高的效率。

    除了對FP8的支持外,Torch-MUSA v2.0.0還引入了多項創新功能,以進一步提升深度學習任務的執行效率。其中包括新增的虛擬內存管理支持,該技術能夠有效緩解GPU內存碎片化問題,并降低模型訓練過程中的峰值內存占用。這對于FSDP、DeepSpeed和Megatron-LM等主流大模型訓練框架來說,無疑是一個巨大的福音。

    Torch-MUSA v2.0.0還新增了MUSA Graph支持。MUSA Graph技術將多個MUSA內核整合到一個圖中,通過單次CPU調度大幅減少了啟動開銷,提升了計算效率。同時,該技術還與CUDA Graph接口高效兼容,為開發者提供了更多的選擇和便利。

    在性能優化方面,Torch-MUSA v2.0.0也取得了顯著進展。通過多項針對MUSA計算平臺的性能優化,該版本進一步提升了對AI模型和大規模數據處理的支持能力。這使得開發者能夠在基于MUSA Compute Capability 3.1計算架構的全功能GPU上,無縫運行新版本的PyTorch,并享受更高效的性能表現。

    Torch-MUSA v2.0.0不僅支持PyTorch 2.2.0,還新增了對PyTorch 2.5.0的支持。這意味著開發者可以更加靈活地選擇適合自己項目的PyTorch版本,無需擔心兼容性問題。

    最后,Torch-MUSA v2.0.0已完全開源,開發者可以通過訪問GitHub獲取源代碼。這一舉措無疑將吸引更多的開發者參與到Torch-MUSA的生態建設中來,共同推動AI計算領域的發展。

     
     
    更多>同類內容
    全站最新
    熱門內容
    本欄最新
     
    亚洲精品视频专区| 亚洲色精品aⅴ一区区三区| 九九精品国产亚洲AV日韩| 麻豆一区二区三区精品视频| 国产精品美女一区二区视频| 9久热精品免费观看视频| 成人国产精品高清在线观看| 自拍日韩亚洲一区在线| 国产在线精品一区二区| 杨幂精品国产福利在线| 五月天精品视频在线观看| 国产精品视频yuojizz| 久久精品国产亚洲av麻豆图片| 精品人妻va出轨中文字幕| 无码国产精品一区二区免费3p| 国产精品多人p群无码| 精品亚洲综合在线第一区| 国产午夜无码精品免费看 | 秋霞午夜鲁丝片午夜精品久| a级国产精品片在线观看| 91精品国产综合久久精品| 香蕉在线精品视频在线观看2| 国产伦精品一区二区三区视频猫咪| 日本精品视频在线观看| 四虎精品影库4HUTV四虎| 日韩精品免费一线在线观看| 一级做a爰黑人又硬又粗免费看51社区国产精品视 | 久久久久国产精品免费看| 亚洲Av永久无码精品三区在线| 国产精品亚洲成在人线| 精品国产麻豆免费人成网站| 国产女主播精品大秀系列| 国产成人精品无码片区在线观看 | 国产精品林美惠子在线观看| 精品久久国产视频| 国产精品日韩专区| 国产精品99re| 日韩精品无码一区二区三区| 日韩美女在线观看一区| 日韩精品一二三四区| 国产精品爱搞视频网站 |