谷歌发布Gemini 3.5 Flash,推理速度较同级前沿模型快4倍

打印派   2026-05-20 08:37:59

谷歌在5月19日的Google I/O 2026大会上,将AI的战略重心从“回答问题”进一步推向“完成任务”。公司发布了迄今速度最快的轻量级模型Gemini 3.5 Flash,并首次展示了个人AI代理Gemini Spark和多模态视频生成模型Gemini Omni,试图将Gemini打造成覆盖消费、企业和开发者的完整AI生态。

旗舰新品Gemini 3.5 Flash即日起在Gemini应用和谷歌搜索AI模式中上线,而Gemini 3.5 Pro仍处于内部测试,计划下月推出。谷歌将这款新模型定位为迄今最先进的Flash系列,瞄准编程、推理和长周期任务执行三大方向。与此前轻量模型常在能力上妥协不同,谷歌称该模型在保持顶级推理水平的同时,输出速度达到同级前沿模型的4倍,成本通常不到其一半。

谷歌发布Gemini 3.5 Flash,推理速度较同级前沿模型快4倍

基准测试数据佐证了这一说法。Gemini 3.5 Flash在Terminal-Bench 2.1、GDPval-AA和MCP Atlas等多个编程与代理能力评估中超越了自家上一代旗舰Gemini 3.1 Pro,在CharXiv多模态推理基准上也表现强劲。谷歌借此强调,该模型已具备胜任应用开发、大型软件项目维护和金融文档准备等复杂任务的能力。

值得关注的是,谷歌将“长周期代理任务”作为此次发布的核心关键词。在官方产品页上,公司形容该模型系列“将前沿智能与行动结合”,是“构建更强大、更智能的代理的重大一步”。

与模型同步推出的,还有代理开发平台Google Antigravity的更新版本。该平台允许开发者部署协同工作的子代理,同时执行工作流和编码任务。谷歌表示,系统在监督下运行复杂多步骤操作时仍能保持高性能,并支持更丰富的网页界面和交互图形生成。开发者可通过Google AI Studio、Android Studio、Gemini API和Antigravity访问该模型,企业客户则通过Gemini Enterprise体系获得入口。

本次大会还首次揭开Gemini Spark和Gemini Omni的面纱。Gemini Spark定位为个人AI代理,可跨谷歌服务协助用户处理任务与工作流;Gemini Omni则是一款多模态视频生成模型,能从不同形式的输入生成高质量视频。尽管谷歌在主题演讲中未披露两者的详细技术规格,但双线发布本身已透露出其与微软Copilot、OpenAI视频生成方向全面对位的意图。

外界注意到,Gemini 3.5 Flash的发布节点距离Gemini 3.1 Pro推出仅隔数月。这种加速迭代的节奏,折射出当下AI基础模型竞争的激烈程度。谷歌正尝试用“速度+代理执行”的组合拳,在消费者和企业的AI心智争夺中抢回更多主动权。


0

46 0

发表评论

登陆后参与评论