谷歌发布Gemini 3.5 Flash，推理速度较同级前沿模型快4倍

打印派 2026-05-20 08:37:59

谷歌在5月19日的Google I/O 2026大会上，将AI的战略重心从“回答问题”进一步推向“完成任务”。公司发布了迄今速度最快的轻量级模型Gemini 3.5 Flash，并首次展示了个人AI代理Gemini Spark和多模态视频生成模型Gemini Omni，试图将Gemini打造成覆盖消费、企业和开发者的完整AI生态。

旗舰新品Gemini 3.5 Flash即日起在Gemini应用和谷歌搜索AI模式中上线，而Gemini 3.5 Pro仍处于内部测试，计划下月推出。谷歌将这款新模型定位为迄今最先进的Flash系列，瞄准编程、推理和长周期任务执行三大方向。与此前轻量模型常在能力上妥协不同，谷歌称该模型在保持顶级推理水平的同时，输出速度达到同级前沿模型的4倍，成本通常不到其一半。

基准测试数据佐证了这一说法。Gemini 3.5 Flash在Terminal-Bench 2.1、GDPval-AA和MCP Atlas等多个编程与代理能力评估中超越了自家上一代旗舰Gemini 3.1 Pro，在CharXiv多模态推理基准上也表现强劲。谷歌借此强调，该模型已具备胜任应用开发、大型软件项目维护和金融文档准备等复杂任务的能力。

值得关注的是，谷歌将“长周期代理任务”作为此次发布的核心关键词。在官方产品页上，公司形容该模型系列“将前沿智能与行动结合”，是“构建更强大、更智能的代理的重大一步”。

与模型同步推出的，还有代理开发平台Google Antigravity的更新版本。该平台允许开发者部署协同工作的子代理，同时执行工作流和编码任务。谷歌表示，系统在监督下运行复杂多步骤操作时仍能保持高性能，并支持更丰富的网页界面和交互图形生成。开发者可通过Google AI Studio、Android Studio、Gemini API和Antigravity访问该模型，企业客户则通过Gemini Enterprise体系获得入口。

本次大会还首次揭开Gemini Spark和Gemini Omni的面纱。Gemini Spark定位为个人AI代理，可跨谷歌服务协助用户处理任务与工作流；Gemini Omni则是一款多模态视频生成模型，能从不同形式的输入生成高质量视频。尽管谷歌在主题演讲中未披露两者的详细技术规格，但双线发布本身已透露出其与微软Copilot、OpenAI视频生成方向全面对位的意图。

外界注意到，Gemini 3.5 Flash的发布节点距离Gemini 3.1 Pro推出仅隔数月。这种加速迭代的节奏，折射出当下AI基础模型竞争的激烈程度。谷歌正尝试用“速度+代理执行”的组合拳，在消费者和企业的AI心智争夺中抢回更多主动权。

238 0

发表评论

登陆后参与评论