谷歌发布最高质量音频模型Gemini 3.1 Flash Live,低延迟、高精度响应,打造实时语音交互新范式 谷歌Gemini3.0商用 谷歌发布gemini3电脑版
创始人
2026-03-27 08:42:51
0

在生成式AI竞争加速向“实时交互”演进之际,谷歌正式推出Gemini 3.1 Flash Live模型。这一主打音频与语音实时能力的新模型,不仅强化低延迟对话体验,还进一步扩展至开发者生态,标志着Gemini体系正从“多模态理解”迈向“实时智能代理”的关键一步。

谷歌将Gemini 3.1 Flash Live誉为其“迄今为止质量最高的音频与语音模型”,称它可帮助开发者和企业构建能够大规模执行复杂任务的“语音优先”智能体。

在大模型竞争进入下半场之际,Gemini 3.1 Flash Live的发布,标志着谷歌正试图定义下一代人机交互方式——不再是输入与输出,而是“实时对话”。

对于市场而言,这一模型的意义主要体现在两方面。对开发者而言,它可低门槛构建语音AI应用,缩短产品迭代周期,对企业客户而言,它有望让客服、销售、教育等场景快速实现自动化升级与此同时,随着实时语音能力成为标配,AI竞争正从“谁更聪明”转向“谁更自然、谁更即时”。

实时语音交互能力升级 主打实时对话+连续理解

根据谷歌官方博客及媒体报道,Gemini 3.1 Flash Live是一款专为实时音频和语音交互设计的模型,核心能力集中在“实时对话”和“连续理解”。

该模型具备以下关键特征:

实时语音对话能力:支持用户与AI进行持续、低延迟的语音交流更高响应精度:在复杂语音理解任务中表现更稳定长上下文处理能力:可在多轮语音互动中保持上下文一致性

性能方面,在专用于评估包含多种约束条件的多步函数调用基准测试——ComplexFuncBench Audio中,Gemini 3.1 Flash Live取得约90.8%的成绩,远超2.5版本的前代,在多步骤语音任务理解与调用能力上表现突出。

此外,在Scale AI的音频复杂任务测试中,模型在启用“thinking”(推理)模式后,能够更好处理现实环境中的干扰与长时任务。

向开发者全面开放:API与多场景接入

谷歌此次强调,该模型并非仅用于终端产品,而是优先服务开发者生态

通过Gemini Live API在Google AI Studio中开放支持企业侧通过Vertex AI与Gemini Enterprise调用同步嵌入Search Live、Gemini Live等消费级产品

这意味着开发者可以直接构建如下应用场景:

实时语音助手(客服、销售、教育)语音驱动的智能代理(Agent)多模态交互应用(语音+文本+视觉融合)

媒体指出,这种“API优先”的策略与当前AI行业趋势一致,即通过工具链绑定开发者,从而扩大生态壁垒。

Gemini 3.1体系持续扩张:从“理解”到“实时行动”

Gemini 3.1 Flash Live并非孤立产品,而是Gemini 3.1系列的重要组成:

Gemini 3.1 Pro:强化复杂推理能力Gemini 3.1 Flash / Flash-Lite:强调速度与成本效率Flash Live:补齐实时语音与交互能力

例如,Flash-Lite主打高性价比与高并发场景,在速度和成本上显著优于上一代模型,并支持开发者控制“思考深度”(thinking levels)。

整体来看,谷歌正通过“分层模型体系”覆盖不同需求:

模型类型 核心定位 Pro 高复杂度推理 Flash 高速响应 Flash-Lite 低成本大规模调用 Flash Live 实时语音交互 战略意图:抢占“实时AI入口”,对标下一代交互范式

从行业趋势看,Gemini 3.1 Flash Live的推出具有明显战略意义:

对标实时AI助手赛道
实时语音交互正成为AI竞争新焦点,从文本聊天走向“类人对话”。推动AI Agent落地
实时语音+函数调用能力,使模型具备执行任务的基础。强化生态闭环
从模型→API→应用(Search、Gemini App),谷歌正在构建端到端AI平台。

结合此前Gemini在多模态(文本、图像、视频)领域的布局,Flash Live补上了“实时交互”这一关键拼图,意味着谷歌正加速向“全栈AI平台”转型。

相关内容

热门资讯

独家 | 三百家机构,盯上一个... 3月,《求是》杂志刊发习总书记文章《推动海洋经济高质量发展》。他提出,发展海洋经济,大的思路上,要更...
AIDC风口上的双登股份:去年... 2025年AI潮起,算力规模扩张催生了巨大的电力需求。在对电力调度灵活性要求持续提升的背景下,储能电...
《精灵宝可梦Go》开发商Nia... 3月13日消息,沙特控股的游戏开发商Scopely同意斥资35亿美元收购《精灵宝可梦Go》开发商Ni...
吉利系整合后续:领克员工已搬至... 3月13日消息,在极氪官宣完成对领克的收购及注资事项后,双品牌的内部管理调整在持续。据悉,继研发体系...
香港明确指数型万用寿险产品监管... 3月13日消息,据彭博社,香港当局放宽了规定,允许高净值个人购买一种在新加坡和美国日益受欢迎的保险产...
海关、移民、民航多部门协同发力... 3月13日消息,海关总署近日会同国家移民局、中国民航局等部门统筹发展和安全,联合出台关于进一步促进航...
沪深京三市成交额突破1万亿元,... 3月13日消息,截至目前,沪深京三市成交额突破1万亿元,较上日此时放量超100亿元,其中沪市成交额3...
为长期绑定顶流王一博,乐华娱乐... 为寻求维持与艺人王一博的长期合作,港股“艺人经纪第一股”乐华娱乐(02306.HK)计划向其授出价值...
泰林生物:2025年实现营收3... 3月26日,泰林生物(300813.SZ)发布2025年年度报告,全年实现营业收入3.40亿元,归属...
深成指跌逾1%,下跌个股近45... 3月13日消息,深成指下挫跌逾1.00%,沪指跌0.42%,创业板指跌0.96%。机器人、泛AI、半...