AI 编译器 (AI Compiler)
2025年夏季InfiniTensor大模型与人工智能系统训练营
专业阶段
介绍传统编译器和AI编译器的区别,AI编译器的核心流程,一些主流的AI编译器生态介绍,探讨介绍AI编译器流程中前端部分。
讲师: 张允泽、杨德睿、段晨婕

  课程内容简介

介绍传统编译器和AI编译器的区别,AI编译器的核心流程,一些主流的AI编译器生态介绍,探讨介绍AI编译器流程中前端部分,包含模型导入及其可以做的图优化,从 PyTorch 的核心设计理念——动态计算图出发,梳理图优化技术体系的演进历程,包括三条代表性技术路线:早期的 TorchScript(包含 jit.trace 和 jit.script);中期的 torch.fx 图重写机制;以及 PyTorch 2.0 引入的统一编译入口 torch.compile,并深入分析其核心组件 TorchDynamo、AOTAutograd 以及 TorchInductor 后端的设计原理与亮点,最后探讨并介绍AI编译器流程中后端部分,包含运行时、算子调用以及在此阶段可以做的优化方法。


  课程预期目标

本课程旨在帮助学生深入理解AI编译器的核心原理与设计方法,系统掌握现代AI编译技术栈的关键组件和优化手段,培养开发高性能、可移植AI模型编译优化的工程实践能力。课程结束后,学生将能够深入理解AI编译器的核心流程和技术体系:

  • 掌握从高层计算图(如PyTorch FX Graph/ONNX)到底层硬件代码的全链路编译流程;
  • 学习计算图优化技术,包括常量折叠、冗余节点消除、算子融合等基础优化;
  • 熟悉内存优化策略,涵盖内存分配、布局转换、内存复用等关键技术。


  学时

4 小时


  课程依赖


  预备知识

建议学生具备以下基础:

  • 编程基础:熟悉Python和C++,了解基本的算法与数据结构;
  • 机器学习基础:理解神经网络模型(如CNN/Transformer)的结构与推理流程;
  • 编译原理入门:了解词法分析、语法分析、中间表示(IR)等基本概念;
  • 硬件基础(可选):对CPU/GPU/TPU的架构特性有基本认知,有助于理解后端优化。


  授课方式

  • 讲课
  • 实验/实践


  课程详情


第一课时. “AI编译器概述”

课时:1小时

前置依赖:无


第二课时. “AI编译器中的前端优化”

课时:1小时

前置依赖:无


第三课时. “PyTorch中图优化”

课时:1小时

前置依赖:无


第四课时. “AI编译器中的后端优化”

课时:1小时

前置依赖:无