12 月 4 日,NVIDIA 开源了 CUDA Tile IR,这是 GPU 编程的中间表示形式。该公司根据 Apache 2.0 许可证在 GitHub 上发布了代码,可供开发人员和研究人员使用、修改和分发。在此之前,NVIDIA 于 12 月 4 日推出了 CUDA 13.1 的 CUDA Tile GPU 编程范例,标志着该平台自 2006 年推出以来最全面的功能扩展。此举符合 NVIDIA 最近针对 CUDA 生态系统的开放战略,撤销了 CUDA Tile IR 的专有许可。 CUDA Tile IR 基于 LLVM 项目的 MLIR(多级中间表示)框架构建。 MLIR 已在人工智能和高性能计算领域得到广泛采用,包括 AMD 的计算和人工智能软件堆栈、谷歌支持多个硬件平台的 IREE 项目以及英特尔针对其硬件的 XeVM MLIR 方言。其他 IR 框架(例如 ONNX-MLIR、Torch-MLIR 和 MLIRE-AIE)也使用 MLIR 系统。 MLIR基础有可能允许CUDA Tile IR转换到其他后端,为在非NVIDIA GPU或加速器环境中支持相关计算模型提供技术基础。开源 CUDA Tile IR 预计将推进兼容性和移植项目,包括 ZLUDA。开源 CUDA Tile 项目包括 Tile MLIR 方言、本机 Python API 绑定、字节码表示和一致性测试套件。 NVIDIA 表示,CUDA Tile IR 是“一种基于 MLIR 的中间表示和编译器基础设施,用于 CUDA 内核优化,重点支持基于图块的计算模式,并针对 NVIDIA Tensor Core 单元进行了优化。”该公司补充说,该项目“提供了一个完整的生态系统,用于表达和优化 NVIDIA GPU 的平铺计算,旨在通过提供常见平铺模式、内存层次结构管理和 GPU 特定优化的抽象来简化高性能 CUDA 内核的开发。”





