封面新闻记者 孟梅
9月24日,2025云栖大会在杭州开幕,这场以“云智一体·碳硅共生”为主题的科技盛会汇聚了来自50多个国家的2000余位嘉宾,共同探讨AI、云计算与产业应用的最新趋势。
聚焦于通义多模态前沿技术,在9月24日下午的通义多模态交互技术论坛上,来自阿里通义实验室与斑马智行、联想、云希谷等企业的专家或高管,分别带来了多模态感知与交互、多模态融合理解、端云协同等核心方向上的技术分享。
多模态大模型通过融合视觉、语言、音频等多种信息模态,让AI能够以更接近人类的方式感知和认知世界。斑马智行首席技术官司罗指出,当前多模态大模型发展正呈现三大趋势:统一架构与原生多模态融合、推理能力的深化,以及模型部署的两极化。
而在汽车智能化领域,多模态大模型的应用正在推进智能座舱架构的演进。
传统“流水线”架构依赖预设规则与分散感知,难以处理复杂场景;而新一代“端到端”架构基于原生多模态大模型,能够实现感知—认知—决策的闭环,真正具备情境理解与主动服务能力。
同时,在信息安全的需求下,端到端架构也逐渐从融合到端侧演进,不仅解决了数据隐私和延迟问题,更通过本地化处理实现了真正的实时智能响应。
基于这些技术趋势,斑马智行宣布率先融合接入阿里云Qwen3-Omni模型,这也是该原生端到端全模态AI大模型首次被采用。
9月26日,斑马智行将联合阿里云与高通,正式发布端到端全模态端侧大模型解决方案Auto Omni。据介绍,该方案基于阿里云Qwen Omni及高通骁龙8397芯片平台打造,在业内率先采用端到端技术架构,具有主动智能、断网可用、隐私无忧三大特点,能够实现从指令式交互到Always on主动智能的代际提升。
通过两大场景,司罗展示了智能座舱基于Auto Omni实现的主动智能能力,如通过多模态感知乘员状态及车内外环境差异,自动开启空调并避免吹到车主的脸;实时解析车内对话语义,结合情景理解主动参与对话并提供服务等。
据了解,首批搭载高通8397芯片的车型将在2026年量产,采用Auto Omni全模态端侧大模型解决方案的第一批AI智能座舱也将届时面世。
在分享中司罗谈道,斑马智行在AI in All战略之下,希望与客户及合作伙伴共赴AGI时代。通过全球首个智能座舱全模态端侧大模型实车方案,斑马智行正在引领汽车智能座舱率先迈入阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭所定义的“自主行动”新阶段。
从云端到终端,从单模态到全模态,智能汽车的AI进化之路正在提速。而当汽车真正开始“读懂人心”,我们的出行生活,也将迎来一场静悄悄却深刻的革命。