基础模型研究工程师 – Shanda

工作职责：

为前沿探索成果规模化为业界领先的下一代模型提供大规模训练数据获取，强化学习环境构建，训练效率极致优化等关键支撑；
为下一代模型提供全面细致的自动化评测系统，推动对模型能力边界的理解，引导未来研究优先级的设立；
将理论突破应用于现实世界的真实产品挑战，推动 AI 的应用和影响。

任职要求：

具备扎实的编程能力，能够熟练使用 Linux 环境下的 Python 和 C/C++ 等语言，熟悉 PyTorch，熟悉主流大模型训练与微调框架，能独立实现复杂的深度学习模型与系统模块，具备高效调试、性能优化能力；
有大规模数据预处理、数据生成、数据增强能力；了解数据驱动下的模型迭代工作流程；
熟悉大模型训练流程，包括分布式训练、模型并行、训练效率调优；
出色的问题分析能力，良好的合作心态与沟通技巧。

加分项：

熟悉 CUDA/Triton/Cutlass 等高性能算子框架；
熟悉 veRL / OpenRLHF / Ray 等强化学习分布式计算框架；
熟悉 browser / computer use / code sandbox 大规模强化学习环境构建；
熟悉 Megatron-Core / DeepSpeed 等分布式训练框架，有多节点训练效率调优经验，能分析优化模型计算与通信重叠效率；
有优异编程竞赛成绩（ACM/ICPC，NOI/IOI，Codeforces，Topcoder）；
参与知名大模型开源项目或在相关竞赛取得优胜成绩。

如您对该职位感兴趣，请将简历与求职信发送至 shandahr@0331155.com。ag真人也欢迎来自招聘机构的推荐。