当前位置:首页 > 科技资讯 > 正文

CUDA Tile:革新AI编程,重塑护城河

【导读】揭秘CUDA Tile:重塑AI编程的未来。

英伟达CUDA迎来20年里程碑更新,重塑AI编程版图!

CUDA Tile:革新AI编程,重塑护城河 Tile  AI编程 护城河 NVIDIA 第1张

其中,最颠覆性更新为CUDA Tile,让开发者能用Python替代C++编写内核代码。

CUDA 13.1引入CUDA Tile技术,革新显卡代码编写方式,简化流程,提升未来适应性。

通过抽象化底层硬件(如Tensor Cores),降低开发门槛,如指挥乐团演奏般便捷。

CUDA Tile:革新AI编程,重塑护城河 Tile  AI编程 护城河 NVIDIA 第2张

此更新引发芯片界传奇人物、Tenstorrent CEO Jim Keller的关注与质疑:

Jim Keller提出观点:这次更新是否终结了CUDA的护城河?

CUDA Tile:革新AI编程,重塑护城河 Tile  AI编程 护城河 NVIDIA 第3张

他认为当GPU转向Tile瓦片结构,AI内核将更易移植。

CUDA Tile:革新AI编程,重塑护城河 Tile  AI编程 护城河 NVIDIA 第4张

但事实并非如此简单。需探讨两个问题:

1. Jim Keller背景为何?他的话为何有分量

2. CUDA Tile与CUDA护城河是什么

Jim Keller是芯片界代表性CPU/SoC架构师之一,被誉为「传奇架构师」、「芯片圈GOAT之一」。

他深刻影响了CPU发展路线,是近二十多年x86、移动SoC、AI芯片发展的幕后推手。

CUDA Tile:革新AI编程,重塑护城河 Tile  AI编程 护城河 NVIDIA 第5张

更细来说:

  • x86-64时代奠基人之一:

作为x86-64指令集和HyperTransport共同作者,影响今天几乎所有桌面、服务器CPU。

  • 多次带队完成「公司级」翻身战:

AMD Athlon/K8时代正面硬刚Intel。Zen让AMD重生。Apple A系列开启自研SoC路线。

  • 跨CPU、手机SoC、自动驾驶、AI加速器「全栈」架构师:

在通用CPU、移动SoC、车载SoC、AI加速器上均做过一线设计和架构决策。

CUDA Tile:革新AI编程,重塑护城河 Tile  AI编程 护城河 NVIDIA 第6张

回顾CUDA历史,早在2006年,英伟达发布G80架构和CUDA,开启通用GPU计算黄金时代。

CUDA Tile:革新AI编程,重塑护城河 Tile  AI编程 护城河 NVIDIA 第7张

二十年来,「单指令多线程」(SIMT)模型一直是GPU计算「圣经」。

开发者习惯从单个线程视角出发,映射成千上万个线程到数据上。

然而,现代AI计算核心是矩阵乘法。

重构技术:CUDA Tile与SIMT的范式断裂

CUDA Tile:革新AI编程,重塑护城河 Tile  AI编程 护城河 NVIDIA 第8张

SIMT模型核心假设:

程序员编写串行代码(Kernel),GPU实例化成千上万线程。

CUDA Tile:革新AI编程,重塑护城河 Tile  AI编程 护城河 NVIDIA 第9张

CUDA Tile:瓦片化计算的诞生

核心概念:什么是Tile?

CUDA Tile:革新AI编程,重塑护城河 Tile  AI编程 护城河 NVIDIA 第10张

架构支撑:CUDA Tile IR

CUDA Tile:革新AI编程,重塑护城河 Tile  AI编程 护城河 NVIDIA 第11张

CUDA Tile对抗的是谁?

CUDA Tile:革新AI编程,重塑护城河 Tile  AI编程 护城河 NVIDIA 第12张

总结:NVIDIA的护城河重塑