您当前的位置: 首页 > 职位列表 > 职位详情

多模态算法研发工程师

2.5-3.5万元/月
投递简历
北京-海淀区
5-10年 发表算法相关优秀论文 · 机器学习 · 深度学习 · 目标检测 · 大模型算法 · 多模态算法 · 图像处理库(OpenCV等) · 图像生成 · 人像算法 · OCR · Python · 模型加速/性能优化
2025-10-28 17:44:54 更新 被浏览:746 次
奇瑞汽车股份有限公司
最近在线时间:2025-10-28 17:44:54
电话:152********
地址:安徽省芜湖市经济技术开发区长春路8号
职位描述

岗位职责:
1.主导车载多模态大模型的技术研发:聚焦视觉与语言的深度协同,构建能够精准感知舱内环境(如乘客状态、手势动作、物品识别)及舱外场景(如道路建筑、天气情况)的多模态预训练体系
2.推进多模态交互功能落地:设计并实现面向智能座舱的视觉问答(VQA)、图像/视频描述生成、多模态对话系统,支持用户通过自然语言结合视觉内容进行高效交互(例如,“这个按钮是做什么的?”或“带我导航到图片中的位置”)
3.研发前沿AIGC与视频理解能力:将文本生成图像/视频(AIGC)技术应用于车载娱乐、个性化氛围呈现等场景;同时开发视频理解算法,用于行车记录或舱内监控分析,提升驾驶安全性与座舱智能化程度
4.攻关多模态表征学习与融合架构:深入探索跨模态特征表示与注意力融合机制,持续优化模型在图文匹配、跨模态检索等基础任务中的表现,为上层应用提供稳定可靠的技术支撑
5.推动模型端侧部署与性能调优:与工程团队密切配合,完成多模态模型在车规级硬件平台的高效部署,采用量化、剪枝、知识蒸馏等手段,保障低延迟、实时性的感知与交互体验

任职要求:
1.计算机、电子工程、自动化等相关专业硕士及以上学历,具备5年以上工作经验,其中至少2年专注于多模态算法研发
2.熟练掌握至少一类主流多模态模型(如CLIP/BLIP系列、Flamingo/LLaVA系列)或生成式模型(如StableDiffusion,Sora-like),深入理解其核心架构与原理
具备扎实的编程能力,熟练使用PyTorch/TensorFlow框架,并熟悉HuggingFace、OpenMMLab(如MMPreTrain)等多模态开源工具库
3.掌握对比学习、跨模态融合、扩散模型(DiffusionModel)等核心技术,具有实际项目落地经验
4.熟悉OpenCV、FFmpeg等常用多媒体处理与分析工具,具备较强的工程实现能力

求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
BMS应用软件研发
2-4万元/月
北京-海淀区
2025-10-28 17:44:51
投递简历
Framework中间件开发工程师
2.5-4万元/月
北京-海淀区
2025-10-28 17:44:51
投递简历
智能座舱显示系统开发专家
2.5-3.5万元/月
北京-海淀区
2025-10-28 17:44:47
投递简历
合肥包河区招产品认证工程师
1.5-3万元/月
安徽-合肥
2025-10-28 09:54:13
投递简历
整车集成项目管理
1.2-1.8万元/月
安徽-合肥
2025-10-28 09:54:12
投递简历
整车密封系统设计工程师
1.4-2.5万元/月
安徽-合肥
2025-10-28 09:54:10
投递简历
数据分发工程师(J20543)
1.5-2.5万元/月
安徽-合肥
2025-10-28 09:54:08
投递简历
汽车底盘结构设计
1.2-2万元/月
安徽-合肥
2025-10-28 09:54:08
投递简历
汽车项目协调管理
1.7-2.1万元/月
安徽-合肥
2025-10-28 09:54:06
投递简历
汽车整车布局设计工程师
1.2-2.4万元/月
安徽-合肥
2025-10-28 09:54:06
投递简历
推荐企业 职位专题
奇瑞汽车股份有限公司
公司主页 >
微信求职找工作
手机扫一扫
手机扫一扫
随时随地找工作

海量高薪岗位在线免费直招 招聘者/求职者电话直聊

微信小程序
手机也能找工作