
根据 www.Todayusstock.com 报道,美东时间12月17日周三,谷歌正式推出Gemini 3家族新成员——Gemini 3 Flash。这款主打高效快速的轻量级模型发布当天即取代Gemini 2.5 Flash,成为Gemini App和谷歌搜索AI模式的默认驱动模型,标志着谷歌正加速将其最先进AI能力以更低门槛推向全球数亿用户。
谷歌DeepMind Gemini产品管理高级总监Tulsee Doshi将Flash定位为“老黄牛式”模型,强调其在保持接近Gemini 3 Pro推理能力的同时,实现显著的速度提升和成本下降。这距离Gemini 3 Pro发布仅一个月,显示谷歌在AI竞赛中采取高频迭代策略,向OpenAI发起更猛烈挑战。
Gemini 3 Flash在多项权威基准测试中表现出色,不仅大幅超越前代Gemini 2.5系列,甚至在部分领域优于旗舰级Gemini 3 Pro。
特别是在评估代理编程能力的SWE-bench Verified基准中,Gemini 3 Flash解决率达到78%,高于Gemini 3 Pro的76.2%,仅次于GPT-5.2的80%。在多模态推理基准MMMU-Pro中,Flash得分81.2%,领先包括Gemini 3 Pro在内的所有竞争对手。
| 基准测试 | Gemini 3 Flash | Gemini 3 Pro | Gemini 2.5 Flash | GPT-5.2 | 备注 |
|---|---|---|---|---|---|
| SWE-bench Verified(编程能力) | 78% | 76.2% | 显著低于 | 80% | Flash超越同门Pro |
| Humanity's Last Exam(无工具) | 33.7% | 37.5% | 11% | 34.5% | 跨领域专业知识 |
| MMMU-Pro(多模态推理) | 81.2% | 低于Flash | 低于Flash | - | Flash领先所有对手 |
| GPQA Diamond(博士级推理) | 90.4% | 91.9% | 低于90% | 92.4% | Flash接近顶级水平 |
Gemini 3 Flash定价为输入0.50美元/百万token、输出3.00美元/百万token,虽略高于Gemini 2.5 Flash,但性能已超越Gemini 2.5 Pro,且运行速度达到后者的三倍。谷歌强调,在需要深度思考的任务中,Flash平均token消耗比2.5 Pro少30%,实际使用成本更低。
模型还支持上下文缓存功能,在重复任务场景下可实现高达90%的成本削减。Tulsee Doshi表示:“Flash从成本角度是便宜得多的产品,这将允许许多公司大规模开展批量AI任务。”整体来看,Flash以不到Gemini 3 Pro四分之一的成本,提供接近旗舰级的推理能力和更高吞吐量。
Gemini 3 Flash即日起面向全球消费者、开发者和企业用户开放。在Gemini App中成为免费默认模型,用户仍可切换至Pro处理复杂数学或编程问题。谷歌搜索AI模式同样默认采用Flash,美国用户可访问更强大Pro版本进行深度任务。
开发者可通过Google AI Studio、Vertex AI、Antigravity等工具访问,企业客户包括桥水基金、Salesforce、Workday、Figma等已开始部署。桥水AIA Labs负责人Jasjeet Sekhon表示:“Gemini 3 Flash是第一个以我们所需速度和规模提供Pro级深度的模型。”
Gemini 3 Flash的快速推出加剧了谷歌与OpenAI的二元对抗。Gemini 3系列发布后,谷歌API日处理token量已超1万亿,移动端下载量、月活和网站访问增长率近期均超过ChatGPT。OpenAI上周推出GPT-5.2、本周二发布GPT Image 1.5应对。
谷歌凭借搜索和核心应用的庞大分发渠道,将先进AI能力更快转化为用户规模优势。这种高频发布周期反映AI前沿竞争的残酷性,任何领先者都可能迅速被超越。业内认为,这场竞赛不仅推动技术进步,也将对全球经济产生深远影响。
Gemini 3 Flash的发布体现了谷歌在AI效率与性价比领域的重大突破,以远低于旗舰模型的成本和更高速度,提供接近顶级推理能力,尤其在编程和多模态任务中表现突出。该模型快速取代前代成为默认选项,结合谷歌生态分发优势,有望显著扩大市场份额并加速AI应用落地。短期内将进一步压缩OpenAI领先空间,长期看将推动整个行业向更高效、更可规模化的模型架构演进。投资者可关注谷歌母公司Alphabet在AI变现层面的潜在增长机会。
问题1:Gemini 3 Flash与Gemini 3 Pro相比有哪些核心优势?Gemini 3 Flash在保持接近Gemini 3 Pro推理能力的同时,运行速度大幅提升,成本仅为后者的四分之一。在SWE-bench Verified编程基准中,Flash甚至以78%的解决率超越Pro的76.2%。其定位为高效“老黄牛”模型,适合大规模批量任务和日常应用,而Pro更适合极复杂深度推理场景。
问题2:Gemini 3 Flash的定价为什么看似高于2.5 Flash却更具成本优势?虽然单位定价略高(输入0.50美元/百万token vs 0.30美元,输出3.00美元 vs 2.50美元),但Flash性能超越2.5 Pro、速度为其三倍,且在思考任务中平均token消耗少30%。结合上下文缓存可节省高达90%成本,实际使用场景下总体支出更低,性价比显著优于前代。
问题3:Gemini 3 Flash如何体现谷歌在AI竞争中的分发优势?发布当天即成为Gemini App和谷歌搜索AI模式的默认模型,直接面向全球数亿用户免费开放。这种生态整合能力远超OpenAI,使谷歌能迅速将最新技术转化为用户规模和数据反馈优势。自Gemini 3系列推出以来,谷歌API日处理token量已超1万亿,移动端多项指标增长率近期领先ChatGPT。
问题4:企业客户对Gemini 3 Flash的反馈如何?多家头部企业已快速采用并给予高度评价。桥水基金首席科学家Jasjeet Sekhon称其是首个以所需速度和规模提供Pro级深度的模型。JetBrains负责人Denis Shiryaev表示,在AI聊天和代理编程评估中,Flash质量接近Pro,但延迟和成本显著降低。Salesforce、Workday、Figma等公司也在积极部署。
问题5:Gemini 3 Flash发布对AI行业竞争格局有何影响?此次发布仅距Gemini 3 Pro一个月,体现谷歌高频迭代策略,加剧与OpenAI的白热化竞争。Flash以极高性价比快速普及,将推动行业向高效轻量模型倾斜,可能压缩纯前沿模型的溢价空间。长期看,这种竞赛将加速AI技术民主化和经济影响扩散,但也增加领先者快速被超越的风险。
来源:今日美股网