【关于我们】
我们是一家领先的量化交易公司和流动性提供商,致力于提供卓越的风险调整后回报。通过结合全面的数学分析、广泛的金融市场知识和尖端的人工智能技术解决方案,我们的交易模型经受住了时间的考验。在系统化决策、算法执行和主动风险管理方面,我们是市场领域的先锋。我们的团队由来自顶级投资银行(如摩根士丹利/美林(美国银行)/瑞银/麦格理)的经验丰富的人才组成,以及来自伦敦政治经济学院/牛津大学/南洋理工大学/新加坡国立大学等优秀学术背景的毕业生。
【职责】
- 设计和开发大规模语言模型,包括模型预训练、高效微调和性能优化
- 开发和优化模型训练框架,实现分布式训练、参数高效微调(PEFT)等关键技术
- 构建LLM评估体系,设计专业领域的评测基准
- 优化模型推理性能,实现模型量化、剪枝和部署优化
【要求】
- 计算机科学或相关领域的硕士及以上学位
- 2年以上深度学习项目开发经验,其中包含大规模模型训练实践
- 扎实的机器学习算法基础
- 优秀的实验设计和结果分析能力
- 良好的代码规范和文档编写能力
- 大模型开发:
- 精通LLM训练技术(如LoRA, QLoRA, Adapter等PEFT方法)
- 深入理解Transformer架构和主流预训练模型(如LLaMA, Mistral等)的原理和实现
- 熟悉Flash Attention、随机梯度压缩等底层优化技术
- 具备模型量化和压缩经验(如INT4/INT8量化、模型剪枝、知识蒸馏)
- 具备推理性能优化经验,理解vLLM、TensorRT-LLM等推理加速框架的原理和使用
- 分布式训练:
- 精通PyTorch,深入理解DistributedDataParallel、FSDP等分布式训练机制
- 熟悉DeepSpeed、Megatron-LM等大规模训练框架的原理和使用
- 掌握3D并行(数据并行、张量并行、流水线并行)训练技术
- 具备多GPU/多机训练系统的设计和性能调优经验
- 熟悉gradient checkpointing、混合精度训练等显存优化方法
- 系统优化:
- 精通Linux系统和CUDA编程
- 深入理解GPU架构和内存管理
- 具备训练和推理性能分析与优化能力
- 熟悉分布式存储系统(如S3, HDFS)
- 模型评估:
- 精通模型性能和效果评估方法
- 熟悉A/B测试和统计分析技术
- 具备模型可解释性分析经验
- 基础技术:
- 精通Python数据处理(numpy, pandas, scikit-learn等)
- 熟练使用PySpark处理大规模数据
- 具备设计和实现自定义loss function的能力
- 熟悉数据可视化和实验分析工具
【加分项】
- 有大模型相关论文发表或开源项目贡献
- 熟悉Transformer等核心架构的底层实现
- 具有金融机构或量化投资相关从业经验
- 理解金融市场机制和交易策略
【福利】
- 每周可远程工作2天,每年可在国外远程工作长达25天
- 具有竞争力的基本工资和奖金
- 扁平化结构,积极的团队氛围
- 每年多次公司海外旅行
- 休闲活动,如体育运动、桌游等
【工作地点】
上海