文章来源:放心AI网发布时间:2025-04-20 12:45:49
中国人工智能公司DeepSeek在其“开源周”第3天宣布推出DeepGEMM——一款支持FP8通用矩阵乘法(GEMM)的开源库。这一工具专为密集型和混合专家(MoE)矩阵运算设计,为DeepSeek V3和R1模型的训练与推理提供强大支持。官方消息通过X平台发布,迅速引发技术社区的热烈反响。
据DeepSeek官方账号发布的帖子,DeepGEMM在NVIDIA Hopper GPU上可实现高达1350+ TFLOPS的FP8计算性能。其核心逻辑仅约300行代码,却能在大多数矩阵尺寸上超越专家调优的内核,展现了极高的效率和简洁性。该库无需复杂依赖,采用即时编译(Just-In-Time)技术,支持密集布局和两种MoE布局,设计上“像教程一样干净”,便于开发者学习和使用。
X用户@TechBitDaily评论称:“DeepGEMM的发布是DeepSeek开源周的一大亮点,其FP8性能和简洁设计令人印象深刻。”另一位用户@AIObserverCN指出,该库在支持MoE模型的高效训练方面具有显著优势,可能推动AI社区在Hopper架构上的进一步创新。
作为开源周的一部分,DeepGEMM的发布延续了DeepSeek推动AI技术透明化和社区协作的承诺。此前,该公司已在首两天发布了FlashMLA和DeepEP工具,分别聚焦于快速语言模型架构和专家并行通信。此次DeepGEMM的亮相,进一步展示了其在AI基础设施建设上的技术实力。业内人士认为,这款库不仅将提升DeepSeek自家模型的性能,也为全球开发者提供了一个高效、易用的矩阵运算工具,未来应用前景可期。用户现可通过GitHub获取DeepGEMM,探索其在AI训练与推理中的潜力。
项目地址:https://github.com/deepseek-ai/DeepGEMM
相关攻略 更多
最新资讯 更多
DeepSeek开源周第3天:发布DeepGEMM,FP8GEMM库助力AI训练与推理
更新时间:2025-04-20
阿里全面开源文生视频模型万相2.1:14B和1.3B双版本上线
更新时间:2025-04-20
从AI主播到无障碍交互:YY深度整合DeepSeek推出“YYDS”
更新时间:2025-04-20
92%英国大学生依赖AI完成作业,大学评估面临新挑战!
更新时间:2025-04-20
AI料理“神还原”引爆全网网友:8888元卖给上海人!
更新时间:2025-04-20
报道称字节跳动旗下AI产品“即梦”考虑接入DeepSeek
更新时间:2025-04-20
萌翻全网!AI“魔法”让校园地标秒变毛绒玩偶,创意特效火爆出圈!
更新时间:2025-04-20
Anthropic称Claude3.7Sonnet训练成本数千万美元,远低于部分竞品
更新时间:2025-04-20
武汉启动“AI+”行动:单个项目最高可获得2000万元资金支持
更新时间:2025-04-20
15万级“智驾卷王”来了?!零跑B10汽车3月10日开启预售:首搭激光雷达+DeepSeek通义千问双AI大模型!
更新时间:2025-04-20