加速国产GPU开发!摩尔线程开源高性能计算库MUTLASS
快科技11月12日消息,摩尔线程宣布,正式开源高性能线性代数模板库MUTLASS,以便开发者能够更高效地针对摩尔线程GPU MUSA Core、Tensor Core等单元进行编程,加速基于国产GPU的算子开发以及算法创新。
在此之前,摩尔线程已经相继开源OpenCV-MUSA计算机视觉库、MooER音频理解大模型、vLLM-MUSA大语言模型高速推理框架。
▼ MUTLASS开源地址:
https://github.com/MooreThreads/mutlass
在数值计算和深度学习领域,矩阵乘法(GEMM)及其变种,比如FlashAttention、Convolution,是构建复杂上层应用的基石。
不够,为了追求更高的算子融合效率,或者更创新的算法,开发者们往往需要超越标准化计算接口的限制,如标准BLAS接口以及芯片厂商的计算库接口,以实现高性能的定制化算子。
MUTLASS(MUSA Templates for Linear Algebra Subroutines)正是为满足这一需求而设计。
作为摩尔线程专为自研MUSA架构优化的高性能计算库,MUTLASS是基于开源模板库CUTLASS进行的MUSA适配和定制化开发、优化。
针对矩阵乘法及相关变种,MUTLASS提供了一系列高性能的C++模板组件,并采用了与muDNN库类似的分层分解及数据搬运策略,以确保性能的充分发挥。
在本次开源的版本中,摩尔线程适配了CuTe后端库,为其增加了第三代MUSA架构的MMA计算原语,支持TF32/FP16/BF16/INT8等多种数据精度,并以此为基础,初步实现了矩阵乘法、默认实例库、性能测试器及相关工具包的支持。
借助MUTLASS,开发者们既可以灵活复用不同层级的模板组件,也可以按需修改各种模板组件的实现细节,以较低的开发成本实现定制化的高性能算子,从而在摩尔线程全功能GPU上充分释放性能,并尝试更多的算法创新。
摩尔线程将持续优化MUTLASS的性能,并不断引入新的功能。

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
-
恶行之刃 村正+龙鳞,恶行+野蛮之刃,牌子拳套,哪个更是个PVE盗贼
各位老铁们好,相信很多人对恶行之刃都不是特别的了解,因此呢,今天就来为大家分享下关于恶行之刃以及村正+龙鳞,恶行+野蛮之刃,牌子拳套, [详细] -
天谕捏脸数据 天谕手游好看的捏脸数据大全
大家好,今天来为大家分享天谕捏脸数据的一些知识点,和天谕手游好看的捏脸数据大全的问题解析,大家要是都明白,那么可以忽略,如果不太清 [详细] -
天龙八部3充值 天龙八部马来西亚服充值比例
大家好,如果您还对天龙八部3充值不太了解,没有关系,今天就由本站为大家分享天龙八部3充值的知识,包括天龙八部马来西亚服充值比例的问题 [详细] -
千里传音 千里传音打一动物
本篇文章给大家谈谈千里传音,以及千里传音打一动物对应的知识点,文章可能有点长,但是希望大家可以阅读完,增长自己的知识,*重要的是希 [详细] -
大航海时代3攻略 大航海时代3流程全攻略介绍_大航海时代3流程全攻略是什么
这篇文章给大家聊聊关于大航海时代3攻略,以及大航海时代3流程全攻略介绍_大航海时代3流程全攻略是什么对应的知识点,希望对各位有所帮助, [详细] -
**岛 **岛***做任务怎么邀请队友
大家好,岛相信很多的网友都不是很明白,包括岛做任务怎么邀请队友也是一样,不过没有关系,接下来就来为大家分享关于岛和岛做任务怎么邀请 [详细] -
cf葵 cf新角色葵值得买吗价格多少**如何
大家好,关于cf葵很多朋友都还不太明白,不过没关系,因为今天小编就来为大家分享关于cf新角色葵值得买吗价格多少如何的知识点,相信应该可 [详细] -
水果忍者**中文版 xbox水果忍者如何设置中文
大家好,今天小编来为大家解答水果忍者中文版这个问题,xbox水果忍者如何设置中文很多人还不知道,现在让我们一起来看看吧!水果忍者五周年 [详细] -
lol赵信打野 LOL赵信打野主什么副什么
各位老铁们好,相信很多人对lol赵信打野都不是特别的了解,因此呢,今天就来为大家分享下关于lol赵信打野以及LOL赵信打野主什么副什么的问 [详细] -
化魔 斗争的魔气化魔秘境怎么进
各位老铁们,大家好,今天由我来为大家分享化魔,以及斗争的魔气化魔秘境怎么进的相关问题知识,希望对大家有所帮助。如果可以帮助到大家, [详细]