AI芯片算子开发实习生
工作职责:
职位描述:
我们正在寻找对人工智能系统底层优化充满热情的实习生加入团队!您将有机会参与到前沿AI加速技术的研究与开发中,在资深工程师的指导下,学习并实践如何为特定硬件平台(如GPU/AI加速卡)设计和优化高性能计算算子(Kernel),直接助力提升深度学习模型的运行效率。
实习职责:
参与算子库开发支持: 在导师指导下,协助开发和测试用于深度学习模型的高性能计算算子(Kernel)。
辅助性能分析与优化: 学习使用性能分析工具,协助定位模型在特定硬件(如GPU/NPU)上的计算瓶颈。
学习与探索优化技术: 探索并尝试应用针对特定硬件架构(如CUDA核心、Tensor Core、专用AI指令)的高性能编程和优化技术。
工具链与框架熟悉: 熟悉并学习使用团队内部的算子开发工具链、测试框架以及相关的AI框架(如PyTorch, TensorFlow等)接口。
文档与测试: 协助编写代码注释、开发文档,并参与算子功能的单元测试和性能测试。
岗位要求:
任职要求:
扎实的编程基础: 熟练掌握 C++ 或 Python 中的至少一种,具备良好的编程习惯和调试能力。
计算机基础: 了解计算机体系结构、操作系统原理、数据结构和算法等基础知识。
对AI的兴趣: 对深度学习有基本了解,对主流AI框架(如PyTorch/TensorFlow)或模型有使用或学习经验。
学习能力与主动性: 强烈的求知欲和学习能力,能够快速掌握新技术和复杂概念,积极主动地解决问题。
沟通与协作: 良好的沟通能力和团队协作精神。
在校身份: 计算机科学、软件工程、电子工程、人工智能、数学或相关专业的本科高年级或研究生在读学生。
具有以下经验者优先考虑:
高性能计算入门: 对并行计算、GPU编程(CUDA)、或特定AI硬件编程(如华为昇腾ATB、NVIDIA Triton)有初步了解或有浓厚兴趣和学习意愿。
AI实践经验: 接触过深度学习模型的训练、推理或简单调优。
竞赛或项目: 参与过编程竞赛(如ACM, Kaggle等)或相关课程项目/研究项目,并取得一定成果。
工具了解: 了解过AI编译器或优化工具(如TVM, MLIR, Triton)。
对大模型的兴趣: 对大型语言模型(LLM)或其他大模型的原理、训练或推理优化有兴趣。
你将收获:
深入AI系统底层: 获得在AI基础设施核心领域——高性能算子开发的宝贵实践经验。
前沿技术实战: 接触并学习最先进的AI硬件加速技术(GPU/NPU)和优化方法。
专家导师指导: 在经验丰富的工程师一对一的指导下快速成长。
提升工程能力: 大幅提升在复杂系统环境下进行高性能编程、调试和优化的能力。
有竞争力的实习待遇与转正机会: 表现优秀者将有机会获得全职工作offer。