1、负责大模型的微调、强化学习训练、推理优化;
2、参与构建高吞吐、低延迟的企业级AI应用,包括RAG系统、多模态交互、智能体和工作流插件等;
3、参与大模型相关工具链开发,包括数据采集和预处理、任务调度、指标监控等;
4、结合业务需求,持续优化大模型在意图理解、实体抽取、自动化操作、搜索推荐等任务上的应用效果。
1、国内外高校硕士以上学历,计算机、人工智能、统计等相关专业;
2、3年以上相关工作经验,能编写高质量、可维护的 Python/Java/C++/Rust 代码,遵循工程化规范(模块化、单元测试、CI/CD);
3、熟悉大模型训练与部署全流程,有千亿参数模型相关经验优先;
4、熟悉大模型开发框架与生态工具PyTorch/DeepSpeed/vLLM/SGLang/Ollama等;
5、掌握 Docker,了解Kubernetes,熟悉向量数据库与检索系统(Milvus/Faiss/ES)、消息队列(Kafka/RabbitMQ)、缓存与数据库(Redis/MySql);
6、加分项:有开源项目贡献、发表过顶会论文。