模型工程师 | UTC GROUP

【关于我们】

我们是一家领先的量化交易公司和流动性提供商，致力于提供卓越的风险调整后回报。通过结合全面的数学分析、广泛的金融市场知识和尖端的人工智能技术解决方案，我们的交易模型经受住了时间的考验。在系统化决策、算法执行和主动风险管理方面，我们是市场领域的先锋。我们的团队由来自顶级投资银行（如摩根士丹利/美林（美国银行）/瑞银/麦格理）的经验丰富的人才组成，以及来自伦敦政治经济学院/牛津大学/南洋理工大学/新加坡国立大学等优秀学术背景的毕业生。

【职责】

设计和开发大规模语言模型，包括模型预训练、高效微调和性能优化
开发和优化模型训练框架，实现分布式训练、参数高效微调(PEFT)等关键技术
构建LLM评估体系，设计专业领域的评测基准
优化模型推理性能，实现模型量化、剪枝和部署优化

【要求】

计算机科学或相关领域的硕士及以上学位
2年以上深度学习项目开发经验，其中包含大规模模型训练实践
扎实的机器学习算法基础
优秀的实验设计和结果分析能力
良好的代码规范和文档编写能力
大模型开发：
精通LLM训练技术(如LoRA, QLoRA, Adapter等PEFT方法)
深入理解Transformer架构和主流预训练模型(如LLaMA, Mistral等)的原理和实现
熟悉Flash Attention、随机梯度压缩等底层优化技术
具备模型量化和压缩经验(如INT4/INT8量化、模型剪枝、知识蒸馏)
具备推理性能优化经验，理解vLLM、TensorRT-LLM等推理加速框架的原理和使用
分布式训练：
精通PyTorch，深入理解DistributedDataParallel、FSDP等分布式训练机制
熟悉DeepSpeed、Megatron-LM等大规模训练框架的原理和使用
掌握3D并行(数据并行、张量并行、流水线并行)训练技术
具备多GPU/多机训练系统的设计和性能调优经验
熟悉gradient checkpointing、混合精度训练等显存优化方法
系统优化：
精通Linux系统和CUDA编程
深入理解GPU架构和内存管理
具备训练和推理性能分析与优化能力
熟悉分布式存储系统(如S3, HDFS)
模型评估：
精通模型性能和效果评估方法
熟悉A/B测试和统计分析技术
具备模型可解释性分析经验
基础技术：
精通Python数据处理(numpy, pandas, scikit-learn等)
熟练使用PySpark处理大规模数据
具备设计和实现自定义loss function的能力
熟悉数据可视化和实验分析工具

【加分项】

有大模型相关论文发表或开源项目贡献
熟悉Transformer等核心架构的底层实现
具有金融机构或量化投资相关从业经验
理解金融市场机制和交易策略

【福利】

每周可远程工作2天，每年可在国外远程工作长达25天
具有竞争力的基本工资和奖金
扁平化结构，积极的团队氛围
每年多次公司海外旅行
休闲活动，如体育运动、桌游等

【工作地点】

上海

Blog

模型工程师 December 6, 2024 admin Careers2

Add comment Cancel