大赛信息
大赛相关单位
大赛主办:启元实验室
大赛承办:国家超级计算郑州中心
大赛赞助:河南湃孚信息科技有限公司
大赛时间
报名时间:2025年7月7日-7月21日
赛题发布 & 算力开放:2025 年7月14日
作品提交截止:2025年8月10日24:00
结果公示 & 颁奖时间:2025年8月22日(暂定)
大赛内容
启元人工智能大赛由启元实验室主办,其中系统赛道基于启元实验室九源软件栈的相关开源项目,通过拉动开源社区力量,一方面促进国产智能计算生态的发展,另一方面也为人工智能系统方向的学生及从业者提供一个实践平台。本期大赛设置两条赛道:
(1)九源统一智能计算架构(InfiniCore) 算子开发赛道:包含九源统一智能计算架构在国际算力和国产算力平台上的算子设计与开发。给定算子列表,接口定义,测试集,测试方法。选取出性能最优的参赛者给予奖励。
(2)九源大模型推理引擎(InfiniLM, InfiniCore-Infer) 开发赛道:包含三个方向,分别是命题模型推理适配,命题模型调优(End-to-End) 和 命题模型量化推理。由举办方给定模型及模型文件作为题目,在九源大模型推理引擎上进行开发,选取出端到端推理性能最优的参赛者给予奖励。
参赛对象
面向社会开放报名,同时定向邀请高校科研团队及往期大模型与人工智能系统训练营优秀学员。
赛道及赛题
赛道一:九源统一智能计算架构算子开发大赛
赛题简介
本赛道聚焦AI底层算力核心——算子开发能力,要求参赛者在国际算力和国产算力平台上 ,完成算子功能实现、精度优化与极致性能调优任务。通过实战锤炼开发者对硬件架构、并行编程、内存调度等关键技术的跨平台迁移能力,推动国产AI硬件生态人才储备与技术创新。
参赛要求:
所有作品需基于九源统一智能计算架构(InfiniCore)的算子库进行开发,作品需符合文档提出的标准进行开发。
赛道介绍:
- 报名:报名选手(或队伍)填写报名表,在算子列表中选择算子赛题报名,报名信息通过大赛官方网站公开;
- 比赛内容:分为算子设计、国际算力和国产算力平台算子开发、测试三个部分;
- 提交方式:报名选手分别 fork 算子库代码仓库以及文档仓库,并将更改以 pull request(两个仓库各一份)链接的形式提交,代码 pull request 需附上测试通过的截图;
- 评审:三个部分全部完成的选手可以进入最终评审环节,评审会综合算子设计合理性、代码质量、算子性能、测试质量等多个方面。

评审项目 | 评审要求 |
---|---|
设计 | 基本要求:算子定义正确;文档格式正确;接口设计合理、能覆盖主流的使用场景; 加分项:文档美观;解释说明充分、清晰、简洁;设计更加通用、能够覆盖更多的使用场景。 |
代码 | 基本要求:代码能够在所有算力平台上正确编译、运行;算子计算结果正确;代码与设计文档一致;代码书写格式正确; 加分项:良好的代码风格、有清晰的注释;算子实现性能表现优异。 |
测试 | 基本要求:代码能够正确地测试算子的精度和性能;测例能够覆盖具有代表性的场景; 加分项:拥有丰富的测例,能够覆盖多种输入输出的形状、数据类型、数据排布。 |
- 加赛:如果提前完成报名的算子赛题,可以向主办申请后继续开发其它算子赛题。加赛不分阶段,大赛结束时截止,奖励可以累加。
- 奖励:算子按难度分为若干个等级,奖励递增,(比如:简单1x,中等2x,困难5x)。当有多个人同时开发同一个算子时,奖励会在保证完整性和正确性的基础上,给评审得分最高的选手。
赛道二: 九源大模型推理引擎开发大赛
赛题简介
人工智能系统是承载和驱动大模型高效运行的核心平台,如同智能时代的“操作系统”。大模型作为当前AI能力的巅峰体现,其强大的认知与生成能力依赖于海量计算资源。而人工智能芯片正是提供这一算力的基石引擎,通过其无与伦比的并行处理能力支撑着大模型从训练到推理的每一个环节。理解并优化“智能芯片 - 人工智能系统 - 大模型”这一黄金三角的协同关系,是释放AI潜力、推动技术创新的关键。本次大赛聚焦人工智能系统中的关键模块——大模型推理引擎的设计与优化,旨在探索如何更高效地驾驭算力,赋能大模型,解决真实世界挑战。
本题的目标是: 在国际算力和国产算力平台上,对九源大模型推理引擎(InfiniLM, Infinicore-Infer)进行适配和优化。细分为三条赛道,命题模型推理适配、命题模型调优、命题模型量化推理。每题独立设置奖励,细节将在赛道简介里面呈现。
参赛要求:
所有作品需基于“InfiniLM”或“Infinicore-Infer“框架完成(任选一框架,并以最终性能为标准)。
赛道介绍:
- 报名:报名选手(或队伍)填写报名表,任选推理赛道的任意赛题报名,报名结果通过官方网站公开;
- 比赛内容:分为技术选型设计、国际算力和国产算力平台推理引擎开发和适配、国际算力和国产算力平台推理引擎性能测试三个部分;
- 提交方式:报名选手分别 fork 推理框架代码仓库,并将更改以 pull request 链接的形式提交,代码 pull request 需附上测试通过的截图,同时将对应的 pull request 链接和文档文件;
- 评审:比赛会提供统一的测试脚本,以测试端到端正确性及性能为基准,选出最优的提交结果;
- 额外奖励:评审组会根据文档选出新颖的技术/代码,合并进入主分支之后给予额外奖励,以鼓励端到端性能没那么优,但代码/作品的技术很优秀的参赛队伍/队员。

命题模型推理适配:
根据大赛主办方给定的模型列表,通过算子开发、运行时管理、模型架构适配、国产芯片模型适配等完成赛题,每个模型根据难度设立奖金。
命题模型调优(End-to-End)
根据大赛主办方给定的模型列表,通过算子调优、服务层调度、推理技术(投机,批量化等任何性能提升技术)等方法进行推理性能优化,不限制技术手段,以任何方式提升端到端性能,给予冠军奖励。同时对于新颖的技术会由专家组进行评判,只要进行了收录,也都会给与参赛者奖金。
命题模型量化推理:
根据大赛主办方给定的模型列表,通过模型量化、算子开发、模型架构适配、国产芯片适配等完成赛题,每个模型根据难度设立奖金。
可能的工作内容: 量化、算子开发、模型架构适配、国产化。
每个模型根据难度设立奖金。
需要提交内容
源代码、README、测试脚本、设计说明( 包括方案设计、技术路线分析和具体实现)、结果验证分析报告。
环境说明
性能终测的硬件环境为英伟达A100环境,沐曦C550,天数Bi150上进行测试,根据模型大小确定使用的显卡数量,进行端到端测试。