AI 编译器 (AI Compiler)
2025年夏季InfiniTensor大模型与人工智能系统训练营
专业阶段
介绍传统编译器和AI编译器的区别,AI编译器的核心流程,一些主流的AI编译器生态介绍,探讨介绍AI编译器流程中前端部分。
讲师: 张允泽、杨德睿、段晨婕
课程内容简介
介绍传统编译器和AI编译器的区别,AI编译器的核心流程,一些主流的AI编译器生态介绍,探讨介绍AI编译器流程中前端部分,包含模型导入及其可以做的图优化,从 PyTorch 的核心设计理念——动态计算图出发,梳理图优化技术体系的演进历程,包括三条代表性技术路线:早期的 TorchScript(包含 jit.trace 和 jit.script);中期的 torch.fx 图重写机制;以及 PyTorch 2.0 引入的统一编译入口 torch.compile,并深入分析其核心组件 TorchDynamo、AOTAutograd 以及 TorchInductor 后端的设计原理与亮点,最后探讨并介绍AI编译器流程中后端部分,包含运行时、算子调用以及在此阶段可以做的优化方法。
课程预期目标
本课程旨在帮助学生深入理解AI编译器的核心原理与设计方法,系统掌握现代AI编译技术栈的关键组件和优化手段,培养开发高性能、可移植AI模型编译优化的工程实践能力。课程结束后,学生将能够深入理解AI编译器的核心流程和技术体系:
- 掌握从高层计算图(如PyTorch FX Graph/ONNX)到底层硬件代码的全链路编译流程;
- 学习计算图优化技术,包括常量折叠、冗余节点消除、算子融合等基础优化;
- 熟悉内存优化策略,涵盖内存分配、布局转换、内存复用等关键技术。
学时
共 4 小时
课程依赖
无
预备知识
建议学生具备以下基础:
- 编程基础:熟悉Python和C++,了解基本的算法与数据结构;
- 机器学习基础:理解神经网络模型(如CNN/Transformer)的结构与推理流程;
- 编译原理入门:了解词法分析、语法分析、中间表示(IR)等基本概念;
- 硬件基础(可选):对CPU/GPU/TPU的架构特性有基本认知,有助于理解后端优化。
授课方式
- 讲课
- 实验/实践
课程详情
第一课时. “AI编译器概述”
课时:1小时
前置依赖:无
第二课时. “AI编译器中的前端优化”
课时:1小时
前置依赖:无
第三课时. “PyTorch中图优化”
课时:1小时
前置依赖:无
第四课时. “AI编译器中的后端优化”
课时:1小时
前置依赖:无