【关于我们】 我们是一家领先的量化交易公司和流动性提供商,致力于提供卓越的风险调整后回报。通过结合全面的数学分析、广泛的金融市场知识和尖端的人工智能技术解决方案,我们的交易模型经受住了时间的考验。在系统化决策、算法执行和主动风险管理方面,我们是市场领域的先锋。我们的团队由来自顶级投资银行(如摩根士丹利/美林(美国银行)/瑞银/麦格理)的经验丰富的人才组成,以及来自伦敦政治经济学院/牛津大学/南洋理工大学/新加坡国立大学等优秀学术背景的毕业生。 【职责】 设计和开发大规模语言模型,包括模型预训练、高效微调和性能优化 开发和优化模型训练框架,实现分布式训练、参数高效微调(PEFT)等关键技术 构建LLM评估体系,设计专业领域的评测基准 优化模型推理性能,实现模型量化、剪枝和部署优化 【要求】 计算机科学或相关领域的硕士及以上学位 2年以上深度学习项目开发经验,其中包含大规模模型训练实践 扎实的机器学习算法基础 优秀的实验设计和结果分析能力 良好的代码规范和文档编写能力 大模型开发: 精通LLM训练技术(如LoRA, QLoRA, Adapter等PEFT方法) 深入理解Transformer架构和主流预训练模型(如LLaMA, Mistral等)的原理和实现 熟悉Flash Attention、随机梯度压缩等底层优化技术 具备模型量化和压缩经验(如INT4/INT8量化、模型剪枝、知识蒸馏) 具备推理性能优化经验,理解vLLM、TensorRT-LLM等推理加速框架的原理和使用 分布式训练: 精通PyTorch,深入理解DistributedDataParallel、FSDP等分布式训练机制 熟悉DeepSpeed、Megatron-LM等大规模训练框架的原理和使用 掌握3D并行(数据并行、张量并行、流水线并行)训练技术 具备多GPU/多机训练系统的设计和性能调优经验 熟悉gradient checkpointing、混合精度训练等显存优化方法 系统优化: 精通Linux系统和CUDA编程 深入理解GPU架构和内存管理 具备训练和推理性能分析与优化能力 熟悉分布式存储系统(如S3, HDFS) 模型评估: 精通模型性能和效果评估方法 熟悉A/B测试和统计分析技术 具备模型可解释性分析经验 基础技术: 精通Python数据处理(numpy, pandas, scikit-learn等) 熟练使用PySpark处理大规模数据 具备设计和实现自定义loss function的能力 熟悉数据可视化和实验分析工具 【加分项】 有大模型相关论文发表或开源项目贡献 熟悉Transformer等核心架构的底层实现 具有金融机构或量化投资相关从业经验 […]
Read More