连月挑战OpenAI！谷歌发布更高效Gemini 3 Flash，App默认模型，上线即加持搜索

2025/12/18 00:03

来源：华尔街见闻（Wallstreetcn）

作者：李丹

发布： 2025年12月18日 00:03（北京时间）

核心要点

评估代理编程能力的基准测试中，Gemini 3 Flash的得分甚至高于Gemini 3 Pro
新Flash模型保持了接近Gemini 3 Pro的推理能力，同时运行速度达到Gemini 2.5 Pro的三倍，成本仅为Gemini 3 Pro的四分之一
定价0.5美元/百万输入token 、3.00美元/百万输出token，略高于Gemini 2.5 Flash，但性能超越2.5 Pro，速度是后者三倍

评估代理编程能力的基准测试中，Gemini 3 Flash的得分甚至高于Gemini 3 Pro。新Flash模型保持了接近Gemini 3 Pro的推理能力，同时运行速度达到Gemini 2.5 Pro的三倍，成本仅为Gemini 3 Pro的四分之一；定价0.5美元/百万输入token 、3.00美元/百万输出token，略高于Gemini 2.5 Flash，但性能超越2.5 Pro，速度是后者三倍。

旗下最强模型Gemini 3 Pro发布才过一个月，谷歌就进一步向OpenAI发起挑战。

美东时间17日周三，谷歌宣布推出Gemini 3家族的新成员Flash。这款主打快速高效的新模型发布当天即取代Gemini 2.5 Flash成为Gemini App的默认模型，并同步成为谷歌搜索AI模式的默认驱动系统，标志着谷歌在AI竞赛中的分发优势正转化为实质性的市场攻势。

谷歌正将其最强AI能力以更低成本、更快速度推向全球数百万用户。谷歌DeepMind的Gemini产品管理高级总监Tulsee Doshi称，谷歌将Flash定位为老黄牛式的模型。该模型保持了接近Gemini 3 Pro的推理能力，同时运行速度达到Gemini 2.5 Pro的三倍，成本仅为Gemini 3 Pro的四分之一。

Doshi表示："几周前我们发布了Pro，对市场反响感到兴奋。通过Gemini 3 Flash，我们将这个模型带给所有人。" 他还提到，评估代理编程能力的基准测试SWE-bench Verified显示，Gemini 3 Flash性能还优于Gemini 3 Pro。

Gemini 3 Flash的发布正值谷歌与OpenAI竞争的日趋白热化。谷歌11月18日发布的Gemini 3系列促使OpenAI本月初拉响红色警报。上周报道称，Gemini在每周移动应用下载量、月活跃用户和全球网站访问量等指标上的增长率最近均超过ChatGPT，但ChatGPT 11月下旬仍垄断90%的移动端会话。上周OpenAI推出GPT-5.2迎战，本周二又发布新的图像生成模型GPT Image 1.5。

业内人士认为，这场日益演变为谷歌与OpenAI二元对抗的AI竞赛不仅对人工智能（AI）技术本身，也对整个经济产生重大影响。这种持续不断的发布周期反映了模型竞赛前沿领域残酷的竞争本质，任何公司都可能迅速从领先者沦为陪跑者。虽然OpenAI拥有先发优势，但Gemini在搜索和谷歌核心应用中的分发能力更为广泛。自Gemini 3发布以来，谷歌API每天处理的token数量已超过1万亿。

性能持平旗舰模型编程能力超越同门Pro

Gemini 3 Flash在多项基准测试中展现出接近甚至超越更大型模型的表现。

在SWE-bench Verified基准测试中，Gemini 3 Flash的解决率达到78%，仅次于GPT-5.2的80%，不仅超越Gemini 2.5系列，甚至优于同门的Gemini 3 Pro，Pro的准确率为76.2%。

在跨领域专业知识测试Humanity's Last Exam中，Gemini 3 Flash在不使用工具的情况下得分33.7%，虽低于Gemini 3 Pro的37.5%和GPT-5.2的34.5%，但远超Gemini 2.5 Flash的11%。

在多模态推理基准测试MMMU-Pro中，Gemini 3 Flash以81.2%的得分超越包括Gemini 2.5和Gemini 3 Pro在内的所有竞争对手。

在博士级推理和知识基准GPQA Diamond上，Gemini 3 Flash的得分为90.4%。虽然低于GPT-5.2的92.4%和Gemini 3 Pro的91.9%，但其他对手得分还都不到90%。

Doshi对媒体表示：“我们将Flash定位为更像老黄牛的模型。从输入和输出价格来看，Flash从成本角度来说是便宜得多的产品，这实际上允许许多公司进行批量任务。”

成本优势明显速度是2.5 Pro三倍

Gemini 3 Flash的定价为每100万输入token 0.50美元，每100万输出token 3.00美元。虽然略高于Gemini 2.5 Flash的每100万输入token 0.30美元和输出token 2.50美元，但谷歌表示，新一代Flash模型性能超越Gemini 2.5 Pro，速度却达到其三倍。

更重要的是，在处理需要思考的任务时，Gemini 3 Flash平均使用的token数量比2.5 Pro少30%。这意味着尽管单位价格略高，但在某些任务中用户的总体token消耗量会减少，最终实现成本节约。

Gemini 3 Flash在Gemini API和Vertex AI平台中还配备标准上下文缓存功能，能够在重复使用token达到一定阈值的应用中实现高达90%的成本削减。

谷歌强调，Gemini 3 Flash能够以不到Gemini 3 Pro四分之一的成本支持AI代理工作流，同时提供更高的速率限制。

全面覆盖产品线桥水、Salesforce等企业客户已“尝鲜”

Gemini 3 Flash即日起面向全球用户推出，覆盖消费者、开发者和企业三大群体。在Gemini App中，所有全球用户可免费使用该模型，用户仍可从模型选择器中切换至Pro模型处理数学和编程问题。在谷歌搜索的AI模式中，Gemini 3 Flash成为默认模型，美国用户还可访问更强大的Gemini 3 Pro进行深度思考任务。

对于开发者，该模型已通过Google AI Studio、Gemini CLI、Vertex AI和上月发布的新代码工具Antigravity提供预览版本，也可通过Android Studio等开发工具访问。企业用户可通过Vertex AI和Gemini Enterprise获取服务。

谷歌介绍，多家知名企业已开始使用Gemini 3 Flash进行业务转型，并得到他们的热烈反响，这些企业认可该模型的推理速度、效率和推理能力，认为它与更大的模型不相上下。

据谷歌，软件开发公司JetBrains AI工具生态系统负责人Denis Shiryaev表示："在我们的JetBrains AI Chat和Junie代理编程评估中，Gemini 3 Flash提供了接近Gemini 3 Pro的质量，同时推理延迟和成本显著降低。"

全球最大对冲基金桥水（Bridgewater Associates）的AIA Labs负责人兼首席科学家Jasjeet Sekhon表示：“在桥水，我们需要能够在不牺牲概念理解的情况下处理大量非结构化多模态数据集的模型。Gemini 3 Flash是第一个以我们工作流程所需的速度和规模提供Pro级深度的模型。”

Salesforce、Workday、Figma、Cursor、Harvey和Latitude等公司也已采用该模型。谷歌搜索产品副总裁Robby Stein表示，新Flash模型将帮助用户处理具有多个条件的更精细搜索，例如查找适合有幼儿的父母的晚间活动。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

连月挑战OpenAI！谷歌发布更高效Gemini 3 Flash，App默认模型，上线即加持搜索

核心要点

性能持平旗舰模型编程能力超越同门Pro

成本优势明显速度是2.5 Pro三倍

全面覆盖产品线桥水、Salesforce等企业客户已“尝鲜”

谷歌要放大招? Gemini 3.5 Pro传7月17日发布，前端碾压Fable 5

刚刚OpenRouter发布2026最值得关注的“开源F4”，开源追上闭源了，差距只剩3到6个月

算力告急：谷歌悄然对Meta实施Gemini使用上限

40天不睡、5人死磕，DeepMind主管爆Gemini大战DeepSeek惨烈内幕

秘密会议、高管出局、押注谷歌Gemini——新Siri能否救赎库克的最后一战？

核心要点

性能持平旗舰模型 编程能力超越同门Pro

成本优势明显 速度是2.5 Pro三倍

全面覆盖产品线 桥水、Salesforce等企业客户已“尝鲜”

谷歌要放大招? Gemini 3.5 Pro传7月17日发布，前端碾压Fable 5

刚刚OpenRouter发布2026最值得关注的“开源F4”，开源追上闭源了，差距只剩3到6个月

算力告急：谷歌悄然对Meta实施Gemini使用上限

40天不睡、5人死磕，DeepMind主管爆Gemini大战DeepSeek惨烈内幕

秘密会议、高管出局、押注谷歌Gemini——新Siri能否救赎库克的最后一战？

性能持平旗舰模型编程能力超越同门Pro

成本优势明显速度是2.5 Pro三倍

全面覆盖产品线桥水、Salesforce等企业客户已“尝鲜”