DeepSeek宣布,DeepGEMM是一个专为简洁高效的FP8通用矩阵乘法,GEMM设计的库,具有细粒度缩放功能,如DeepSeek-V3中所提出。它支持普通和混合专家(MoE)分组的GEMM。该库采用CUDA编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。