<ul id="mwmk6"><sup id="mwmk6"></sup></ul>
<ul id="mwmk6"></ul>
    <abbr id="mwmk6"></abbr>
  • <ul id="mwmk6"></ul>
  • <ul id="mwmk6"><sup id="mwmk6"></sup></ul>
    資訊在沃

    摩爾線程助推國(guó)產(chǎn)GPU創(chuàng)新:高性能計(jì)算庫(kù)MUTLASS開源亮相

       發(fā)布時(shí)間:2024-11-12 19:24 作者:顧青青

    摩爾線程近日宣布,已正式將高性能線性代數(shù)模板庫(kù)MUTLASS開源,旨在助力開發(fā)者更高效地為摩爾線程GPU的MUSA Core與Tensor Core等單元進(jìn)行編程。此舉有望加快基于國(guó)產(chǎn)GPU的算子開發(fā)與算法創(chuàng)新步伐。

    MUTLASS的開源,是摩爾線程在開放技術(shù)資源方面的又一重要舉措。此前,該公司已陸續(xù)開源了OpenCV-MUSA計(jì)算機(jī)視覺(jué)庫(kù)、MooER音頻理解大模型以及vLLM-MUSA大語(yǔ)言模型高速推理框架,顯示出其對(duì)開源社區(qū)的支持與投入。

    在數(shù)值計(jì)算和深度學(xué)習(xí)領(lǐng)域,矩陣乘法及其變種是構(gòu)建上層復(fù)雜應(yīng)用的基礎(chǔ)。然而,為實(shí)現(xiàn)更高的算子融合效率或更創(chuàng)新的算法,開發(fā)者們常需超越標(biāo)準(zhǔn)計(jì)算接口的限制。MUTLASS應(yīng)運(yùn)而生,專為滿足這一需求而設(shè)計(jì)。

    作為摩爾線程針對(duì)自研MUSA架構(gòu)優(yōu)化的高性能計(jì)算庫(kù),MUTLASS基于開源模板庫(kù)CUTLASS進(jìn)行了適配和定制化開發(fā)。它提供了一系列高性能的C++模板組件,并采用分層分解及數(shù)據(jù)搬運(yùn)策略,以確保性能的充分發(fā)揮。

    此次開源的版本中,摩爾線程為CuTe后端庫(kù)增加了第三代MUSA架構(gòu)的MMA計(jì)算原語(yǔ),支持多種數(shù)據(jù)精度,包括TF32、FP16、BF16和INT8。這些功能為開發(fā)者提供了更廣泛的選擇和靈活性。

    借助MUTLASS,開發(fā)者們可以靈活復(fù)用不同層級(jí)的模板組件,并根據(jù)需要修改實(shí)現(xiàn)細(xì)節(jié),以較低的成本實(shí)現(xiàn)定制化的高性能算子。這不僅有助于在摩爾線程全功能GPU上充分釋放性能,還為算法創(chuàng)新提供了更多可能。

    摩爾線程表示,將繼續(xù)致力于優(yōu)化MUTLASS的性能,并不斷引入新功能,以滿足開發(fā)者日益增長(zhǎng)的需求。

     
     
    更多>同類內(nèi)容
    全站最新
    熱門內(nèi)容
    本欄最新
     
    国产精品人人做人人爽| 在线观看91精品国产网站| 四虎永久在线日韩精品观看| 国产成人精品手机在线观看| 国产乱色精品成人免费视频| 99精品国产高清一区二区| 日韩一级电影在线观看| 91精品免费在线观看| 伊人久久国产精品| 国产在线精品国自产拍影院同性 | 久久我们这里只有精品国产4| 日韩精品人妻系列无码专区免费| 精品国产a∨无码一区二区三区 | 国产精品臀控福利在线观看| 久久精品夜夜夜夜夜久久| 国产精品视频色视频| 日韩一区二区免费视频| 日韩久久久久久中文人妻| 亚洲国产精品日韩专区AV| 18国产精品白浆在线观看免费| 伊人久久精品无码二区麻豆| 国产一区二区三区精品久久呦| 国产Av一区二区精品久久| 久久久久久久99精品国产片| 精品人妻一区二区三区四区| 亚洲精品人成网在线播放影院| 91精品国产免费| 三上悠亚精品一区二区久久| 国产精品视频不卡| 国产精品无码专区在线观看| 亚洲国产综合精品中文字幕| 国产精品无码av片在线观看播| 亚洲网红精品大秀在线观看| 国产成人精品999在线| 精品久久国产字幕高潮| 91精品国产高清久久久久久国产嫩草| 日韩精品无码视频一区二区蜜桃| 久久精品综合一区二区三区| 亚洲av日韩综合一区在线观看| 国产免费69成人精品视频| 国产在线观看91精品一区|