多模态算法研发工程师
2.5-3.5万元/月岗位职责:
1.主导车载多模态大模型的技术研发:聚焦视觉与语言的深度协同,构建能够精准感知舱内环境(如乘客状态、手势动作、物品识别)及舱外场景(如道路建筑、天气情况)的多模态预训练体系
2.推进多模态交互功能落地:设计并实现面向智能座舱的视觉问答(VQA)、图像/视频描述生成、多模态对话系统,支持用户通过自然语言结合视觉内容进行高效交互(例如,“这个按钮是做什么的?”或“带我导航到图片中的位置”)
3.研发前沿AIGC与视频理解能力:将文本生成图像/视频(AIGC)技术应用于车载娱乐、个性化氛围呈现等场景;同时开发视频理解算法,用于行车记录或舱内监控分析,提升驾驶安全性与座舱智能化程度
4.攻关多模态表征学习与融合架构:深入探索跨模态特征表示与注意力融合机制,持续优化模型在图文匹配、跨模态检索等基础任务中的表现,为上层应用提供稳定可靠的技术支撑
5.推动模型端侧部署与性能调优:与工程团队密切配合,完成多模态模型在车规级硬件平台的高效部署,采用量化、剪枝、知识蒸馏等手段,保障低延迟、实时性的感知与交互体验
任职要求:
1.计算机、电子工程、自动化等相关专业硕士及以上学历,具备5年以上工作经验,其中至少2年专注于多模态算法研发
2.熟练掌握至少一类主流多模态模型(如CLIP/BLIP系列、Flamingo/LLaVA系列)或生成式模型(如StableDiffusion,Sora-like),深入理解其核心架构与原理
具备扎实的编程能力,熟练使用PyTorch/TensorFlow框架,并熟悉HuggingFace、OpenMMLab(如MMPreTrain)等多模态开源工具库
3.掌握对比学习、跨模态融合、扩散模型(DiffusionModel)等核心技术,具有实际项目落地经验
4.熟悉OpenCV、FFmpeg等常用多媒体处理与分析工具,具备较强的工程实现能力
-
烧结工
4000-8000/元投递简历
-
销售代表(武隆)
5000-7000/元投递简历
-
心电图/脑电图
2000-4000/元投递简历
-
一级注册消防工程师(成都及周边)
7000-12000/元投递简历
-
核医学技师
面议投递简历
-
应届生岗位
面议投递简历
-
穴位注射医生
面议投递简历
-
安全渗透测试工程师
20000/元投递简历
-
南坪客服早九晚六5K
5000-8000/元投递简历