Blog

模型工程师

【关于我们】

我们是一家领先的量化交易公司和流动性提供商,致力于提供卓越的风险调整后回报。通过结合全面的数学分析、广泛的金融市场知识和尖端的人工智能技术解决方案,我们的交易模型经受住了时间的考验。在系统化决策、算法执行和主动风险管理方面,我们是市场领域的先锋。我们的团队由来自顶级投资银行(如摩根士丹利/美林(美国银行)/瑞银/麦格理)的经验丰富的人才组成,以及来自伦敦政治经济学院/牛津大学/南洋理工大学/新加坡国立大学等优秀学术背景的毕业生。

 

【职责】

  • 设计和开发大规模语言模型,包括模型预训练、高效微调和性能优化
  • 开发和优化模型训练框架,实现分布式训练、参数高效微调(PEFT)等关键技术
  • 构建LLM评估体系,设计专业领域的评测基准
  • 优化模型推理性能,实现模型量化、剪枝和部署优化

 

【要求】

  • 计算机科学或相关领域的硕士及以上学位
  • 2年以上深度学习项目开发经验,其中包含大规模模型训练实践
  • 扎实的机器学习算法基础
  • 优秀的实验设计和结果分析能力
  • 良好的代码规范和文档编写能力
  • 大模型开发:
  • 精通LLM训练技术(如LoRA, QLoRA, Adapter等PEFT方法)
  • 深入理解Transformer架构和主流预训练模型(如LLaMA, Mistral等)的原理和实现
  • 熟悉Flash Attention、随机梯度压缩等底层优化技术
  • 具备模型量化和压缩经验(如INT4/INT8量化、模型剪枝、知识蒸馏)
  • 具备推理性能优化经验,理解vLLM、TensorRT-LLM等推理加速框架的原理和使用
  • 分布式训练:
  • 精通PyTorch,深入理解DistributedDataParallel、FSDP等分布式训练机制
  • 熟悉DeepSpeed、Megatron-LM等大规模训练框架的原理和使用
  • 掌握3D并行(数据并行、张量并行、流水线并行)训练技术
  • 具备多GPU/多机训练系统的设计和性能调优经验
  • 熟悉gradient checkpointing、混合精度训练等显存优化方法
  • 系统优化:
  • 精通Linux系统和CUDA编程
  • 深入理解GPU架构和内存管理
  • 具备训练和推理性能分析与优化能力
  • 熟悉分布式存储系统(如S3, HDFS)
  • 模型评估:
  • 精通模型性能和效果评估方法
  • 熟悉A/B测试和统计分析技术
  • 具备模型可解释性分析经验
  • 基础技术:
  • 精通Python数据处理(numpy, pandas, scikit-learn等)
  • 熟练使用PySpark处理大规模数据
  • 具备设计和实现自定义loss function的能力
  • 熟悉数据可视化和实验分析工具

 

【加分项】

  • 有大模型相关论文发表或开源项目贡献
  • 熟悉Transformer等核心架构的底层实现
  • 具有金融机构或量化投资相关从业经验
  • 理解金融市场机制和交易策略

 

【福利】

  • 每周可远程工作2天,每年可在国外远程工作长达25天
  • 具有竞争力的基本工资和奖金
  • 扁平化结构,积极的团队氛围
  • 每年多次公司海外旅行
  • 休闲活动,如体育运动、桌游等

 

【工作地点】

上海

 

Add comment