当前位置:首页 > 科技资讯 > 正文

DeepSeek V3.2揭秘:TileLang语言引热议

DeepSeek v3.2的更新列表中,有一项未在论文中提及,却在官方公告中惊鸿一瞥,却引发强烈关注。

开源TileLang版本算子的受关注度甚至超越了新引入的稀疏注意力机制DSA,从转发和讨论的次数便可见一斑。

DeepSeek V3.2揭秘:TileLang语言引热议 TileLang GPU内核 领域专用语言 第1张

海外社区也注意到DeepSeek选择了TileLang而非OpenAI的Triton语言。

有开发者赞叹,TileLang是一种极为优雅的语言,仅用不到100行代码,就能实现比Flash Attention 2原版快30%的注意力机制。

DeepSeek V3.2揭秘:TileLang语言引热议 TileLang GPU内核 领域专用语言 第2张

那么,究竟何为TileLang,又为何它能成为焦点?

首先,TileLang是一种专为开发GPU内核设计的领域专用语言,性能上可媲美英伟达CUDA。DeepSeek官方推荐此版本进行实验,因其便于调试和快速迭代。

更重要的是,TileLang与国产算力生态兼容,连华为昇腾都迅速宣布对TileLang的支持。

DeepSeek V3.2揭秘:TileLang语言引热议 TileLang GPU内核 领域专用语言 第3张

在几周前的华为全联接大会2025开发者日上,TileLang团队成员董宇骐介绍了用TileLang实现FlashAttention算子开发,代码量从500+行减少至80行,性能却与官方版本持平。

此外,TileLang团队成员王磊沐曦集成电路高级总监董兆华也在同一场圆桌沙龙上,讨论了沐曦GPU与TileLang的适配。

DeepSeek为何选择TileLang

DeepSeek与TileLang的首次合作,实则在6月的北京智元大会。

曾在DeepSeek实习的北大博士袁境阳在报告中提到,“TileLang的算子实现会更快一些”。

TileLang的发起人之一,北大博士研究生王磊当时还特地发帖感谢DeepSeek尝试他们的语言。

DeepSeek V3.2揭秘:TileLang语言引热议 TileLang GPU内核 领域专用语言 第4张

TileLang由北大团队主导开发,核心成员除王磊、董宇骐外,还有北大计算机学院的副研究员、博士生导师杨智

DeepSeek V3.2揭秘:TileLang语言引热议 TileLang GPU内核 领域专用语言 第5张

2025年1月,TileLang在GitHub上正式开源,至今已获得1.9k星标。

DeepSeek V3.2揭秘:TileLang语言引热议 TileLang GPU内核 领域专用语言 第6张

简而言之,TileLang是一种简洁的领域专用语言,旨在简化高性能GPU/CPU内核的开发。它采用Python式语法,基于TVM构建底层编译器基础设施,使开发者能专注于提升生产力,同时不牺牲性能优化。

阿里云服务器