您当前的位置：首页 > 职位列表 > 职位详情

多模态算法研发工程师

2.5-3.5万元/月

投递简历

北京-海淀区

5-10年发表算法相关优秀论文 · 机器学习 · 深度学习 · 目标检测 · 大模型算法 · 多模态算法 · 图像处理库（OpenCV等） · 图像生成 · 人像算法 · OCR · Python · 模型加速/性能优化

2025-10-28 17:44:54 更新被浏览：746 次

奇瑞汽车股份有限公司

最近在线时间：2025-10-28 17:44:54

电话：152********

地址：安徽省芜湖市经济技术开发区长春路8号

职位描述

岗位职责：
1.主导车载多模态大模型的技术研发：聚焦视觉与语言的深度协同，构建能够精准感知舱内环境（如乘客状态、手势动作、物品识别）及舱外场景（如道路建筑、天气情况）的多模态预训练体系
2.推进多模态交互功能落地：设计并实现面向智能座舱的视觉问答（VQA）、图像/视频描述生成、多模态对话系统，支持用户通过自然语言结合视觉内容进行高效交互（例如，“这个按钮是做什么的？”或“带我导航到图片中的位置”）
3.研发前沿AIGC与视频理解能力：将文本生成图像/视频（AIGC）技术应用于车载娱乐、个性化氛围呈现等场景；同时开发视频理解算法，用于行车记录或舱内监控分析，提升驾驶安全性与座舱智能化程度
4.攻关多模态表征学习与融合架构：深入探索跨模态特征表示与注意力融合机制，持续优化模型在图文匹配、跨模态检索等基础任务中的表现，为上层应用提供稳定可靠的技术支撑
5.推动模型端侧部署与性能调优：与工程团队密切配合，完成多模态模型在车规级硬件平台的高效部署，采用量化、剪枝、知识蒸馏等手段，保障低延迟、实时性的感知与交互体验

任职要求：
1.计算机、电子工程、自动化等相关专业硕士及以上学历，具备5年以上工作经验，其中至少2年专注于多模态算法研发
2.熟练掌握至少一类主流多模态模型（如CLIP/BLIP系列、Flamingo/LLaVA系列）或生成式模型（如StableDiffusion,Sora-like），深入理解其核心架构与原理
具备扎实的编程能力，熟练使用PyTorch/TensorFlow框架，并熟悉HuggingFace、OpenMMLab（如MMPreTrain）等多模态开源工具库
3.掌握对比学习、跨模态融合、扩散模型（DiffusionModel）等核心技术，具有实际项目落地经验
4.熟悉OpenCV、FFmpeg等常用多媒体处理与分析工具，具备较强的工程实现能力

求职提醒：求职过程请勿缴纳费用，谨防诈骗！若信息不实请举报。

该公司的其他职位

BMS应用软件研发

2-4万元/月

北京-海淀区

2025-10-28 17:44:51

投递简历

Framework中间件开发工程师

2.5-4万元/月

北京-海淀区

2025-10-28 17:44:51

投递简历