谷歌发布Gemini 3 Flash:性能媲美顶级模型成本大幅降低

大语言模型发布周期持续加速。在过去30天内,我们见证了谷歌Gemini 3 Pro、Anthropic的Opus 4.5以及OpenAI的GPT-5.2的相继发布。除此之外,A2AI、DeepSeek、Grok、Mistral、Nvidia等公司也推出了各自的模型。今天轮到谷歌再次出手,推出Gemini 3的更小更快版本:Gemini 3 Flash。

正如我们在谷歌和其他前沿模型开发商的小型模型中所见,Gemini 3 Flash在能力方面与其Pro版本相差不远。在开启思考模式的情况下,Gemini 3 Flash在大多数基准测试中接近Gemini 3 Pro、Anthropic的Sonnet 4.5和OpenAI的GPT-5.2的表现,有时甚至超越它们。与前代产品一样,它也提供100万Token的上下文窗口。

为了更好地理解Gemini 3 Flash的性能表现,仅在几周前,Flash 3还能在大多数前沿模型基准测试中位居榜首。

谷歌在今日的公告中写道:"长期以来,AI让我们面临一个选择:要么是缓慢昂贵的大型模型,要么是能力较弱的高速模型。Gemini 3 Flash结束了这种妥协。Gemini 3 Flash既提供了智能又保证了速度。"

与上一代Flash模型(Gemini 2.5 Flash)相比,Gemini 3 Flash实现了显著提升,这对开发者来说尤为重要,因为Flash长期以来一直被认为是性价比最佳的模型。

谷歌在多模态推理领域一直处于领先地位,其模型能够对文本、图像、音频文件和视频进行推理。最近,Gemini模型在即时构建可视化方面也变得相当出色,谷歌也为这个新模型强调了这一点。实际上,Gemini 3 Flash在多模态MMMU-Pro基准测试中甚至超越了Gemini 3 Pro,尽管仅高出0.2%。

谷歌模型最近取得进展的另一个领域是编程。在SWE-Bench Verified基准测试中,Gemini 3 Flash也超越了Gemini 3 Pro,甚至领先于Sonnet 4.5(尽管GPT-5.2在这里仍是最佳表现者)。

Warp公司创始人兼首席执行官扎克·劳埃德表示:"Gemini 3 Flash仍然是Warp建议代码差异功能的最佳选择,在这里低延迟和成本效率是硬性约束。通过这次发布,它能解决更广泛的常见命令行错误,同时保持快速和经济。在我们的内部评估中,我们看到修复准确性提升了8%。"

我们最近看到的一个趋势是,即使是这些较小的模型,开发者通过API使用的成本也在上升,Gemini 3 Flash现在每百万输入/输出Token的成本为0.5美元/3美元,高于之前的0.3美元/2.5美元。但这仍然比Anthropic的Claude Sonnet(3美元/5美元)或甚至更小且能力较弱的Claude Haiku(1美元/5美元)模型便宜得多。

不过,谷歌表示,平均而言,与Gemini 2.5 Flash相比,Gemini 3 Flash在生成答案时使用的Token减少了30%,同时速度也更快。谷歌只将这个新模型与较旧的2.5 Pro模型进行了比较,在这种比较下,它的速度快了3倍。

新模型现在可通过Google AI Studio和Vertex AI的API使用,也可在公司新的AI编程工具Antigravity、Gemini CLI和Android Studio中使用。当然,谷歌的合作伙伴也会将其集成到自己的工具中。

对于消费者来说,Gemini 3 Flash现在将为Google搜索的AI模式提供支持(Pro模型仍然是一个选项),以及Gemini应用中的"快速"和"思考"模式(Pro模式仍然可用)。

Q&A

Q1:Gemini 3 Flash相比前代产品有什么改进?

A:与Gemini 2.5 Flash相比,Gemini 3 Flash实现了显著性能提升,平均使用的Token减少了30%,速度更快。在能力方面接近顶级模型如Gemini 3 Pro、Sonnet 4.5和GPT-5.2的表现,有时甚至超越它们。同时保持100万Token的上下文窗口。

Q2:Gemini 3 Flash的定价如何?

A:Gemini 3 Flash每百万输入/输出Token的成本为0.5美元/3美元,虽然比前代的0.3美元/2.5美元有所上涨,但仍然比Anthropic的Claude Sonnet(3美元/5美元)或Claude Haiku(1美元/5美元)便宜得多,保持了最佳性价比。

Q3:开发者和普通用户如何使用Gemini 3 Flash?

A:开发者可以通过Google AI Studio和Vertex AI的API使用,也可在Antigravity、Gemini CLI和Android Studio等AI编程工具中使用。普通用户可以通过Google搜索的AI模式和Gemini应用中的"快速"和"思考"模式体验这项技术。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1155351.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

又一车企和鸿蒙强强联手!华为出手很及时,其他企业要提前准备!

图源网络,侵删很多人第一反应是:车企怎么突然都往华为这边靠?但如果再细想,你会发现这波合作是一种更现实的选择。甚至可以说,这是传统车企真正进入下一阶段竞争的信号。图源网络,侵删鸿蒙生态,…

重新定义面向AI驱动企业的API管理

多年来,API管理一直舒适地位于企业架构的"连接性"范畴中。团队专注于构建、公开和保护API,以便移动应用程序、合作伙伴生态系统和后端系统能够以可预测的方式交换信息。API网关执行流量规则,开发者门户推动消费,监控工具…

相邻千年,却不曾接壤的两个省!

在中国的地理版图上,有一对特殊的“邻居”——山西与陕西。 两省名字相近、地域相邻,却有着一个令人惊奇的现实:在约600公里的边界线上,它们没有一寸土地直接接壤。 这一切的“阻隔”都源于中华民族的母亲河——黄河。 黄河从北…

年龄只是数字,51岁破界绽放的林志玲与科兰黎共证长久美丽

提起林志玲,很多人的第一印象还停留在软糯娃娃音、自带娇憨的模样,或是《赤壁》里那句被调侃多年的“萌萌,站起来”。这些标签像一层滤镜,让大众轻易忽略了她皮囊之下的力量,直到她以科兰黎卓越大使的身份亮相&#xf…

漏洞扫描 VS 渗透测试:2026年企业安全防护的选择策略与实战指南

漏洞扫描与渗透测试的核心差异漏洞扫描:自动化工具快速识别已知漏洞(如CVE列表),覆盖范围广但深度有限,适合周期性批量检测。典型工具包括Nessus、OpenVAS、Qualys等。渗透测试:模拟黑客攻击的手动自动化测…

SaaS企业如何在2026年从AI炒作转向实际投资回报

在与创始人、产品负责人和首席技术官的交流中,我仍然听到了很多对AI的质疑声音。信任度、复杂性和合规性问题继续阻碍着AI的普及。2026年必将成为我们从炒作性AI转向务实的、以投资回报为导向的AI的一年。对于软件即服务(SaaS)创始人和产品负责人而言,深…

2026年暴露面检测 vs 漏洞扫描:本质差异与协同防御实战指南

暴露面检测与漏洞扫描的本质差异目标范围不同 暴露面检测聚焦于识别所有面向互联网的资产(如IP、域名、API、云服务),包括未知或影子IT资产,强调攻击面的广度。漏洞扫描针对已知资产的已知漏洞(如CVE编号漏洞&#xff…

彼得林奇的“行业领导者“转型能力评估

彼得林奇的“行业领导者”转型能力评估关键词:彼得林奇、行业领导者、转型能力评估、投资分析、企业战略摘要:本文围绕彼得林奇提出的“行业领导者”转型能力评估展开深入探讨。在当今快速变化的商业环境中,行业领导者能否成功转型至关重要。…

Process Lasso 系统性能优化软件

一、背景 1. 系统性能管理的核心痛点 Windows系统默认调度机制存在缺陷,当单个CPU密集型进程以普通优先级运行时,易占用大量CPU资源,导致系统响应迟缓、卡顿甚至假死。同时,多核与大小核CPU普及后,进程调度不合理问题…

英伟达推出基础上下文内存扩展基础设施

为了更好地了解英伟达基础KV缓存扩展基础设施——ICMSP(推理上下文内存存储平台),我们向英伟达询问了关于Vera Rubin Pod机架的问题,整理出ICMSP方案的初步概况。上方图像截取自黄仁勋在2026年CES演讲中约1小时20分钟处&#xff0…

康迪科技携核心电动产品亮相AIMExpo,渠道拓展再提速

近日,北美最具影响力的动力运动行业专业展会AIMExpo(American International Motorcycle Expo)在美国加利福尼亚州阿纳海姆会展中心盛大举办。据「TMT星球」了解,作为北美动力运动领域新品发布、渠道拓展与行业交流的核心平台&…

特朗普持续不断的威胁,让丹麦首相忍无可忍

荷兰主流媒体《人民报》近日在其网站刊登分析文章认为,美国总统特朗普正把北约带到“以内部胁迫外交和怪诞场景为标志的未知之域”。 文章摘编如下:特朗普声称要得到格陵兰岛,而这是美国坚定盟友之一丹麦的自治领土。 他的所作所为已不仅仅…

Python中Optional类型的作用解析

这行代码是在定义 __init__ 方法的参数,让我详细解释一下: 代码作用 log_file: Optional[str] None这行代码定义了一个名为 log_file 的参数,它有两个特点: 1. 默认值为 NoneNone如果没有提供这个参数,它会自动设置为…

Nodejs和vue框架的短剧推荐系统设计与实现--论文

目录 摘要 关于博主开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式! 摘要 随着短视频和网络剧的快速发展,用户对个性化推荐系统的需求日益增长。本文基于Node.js和Vue框架设计并…

消费增值模式:1200万用户主动参与的秘诀

在电商获客成本持续攀升的今天,一个平台如何能不靠烧钱补贴,就吸引超过1200万用户主动参与?提供的答案值得每个商家深思。一、直面商家三大核心痛点当前实体和线上商家普遍面临:流量瓶颈:传统平台流量见顶,…

免费喝出2000万沙棘汁逆袭秘诀

近期,行业内一个沙棘汁品牌因其独特的用户参与模式,在较短时间内实现了显著的市场增长。该案例常被概括为"免费喝",但其背后蕴含着一套系统性的用户参与与市场扩展逻辑。在当前的商业环境下,用户触达成本持续上升&#…

Python文件读取代码中strip()的作用

这行代码 line.strip() 的作用是: 主要功能 去除字符串 line 两端的空白字符。 具体会去除的字符包括: 空格 (space, )换行符 (newline, \n)回车符 (carriage return, \r)制表符 (tab, \t)其他空白字符(如垂直制表符等) 在这个具…

Nodejs和vue框架的社区外来务工人员管理系统数据分析可视化大屏系统

目录社区外来务工人员管理系统数据分析可视化大屏系统摘要关于博主开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!社区外来务工人员管理系统数据分析可视化大屏系统摘要 该系统基于Node.js…

特朗普:必须拥有整个格陵兰岛

据央视新闻消息,记者当地时间1月8日获悉,美国总统特朗普表示,美国必须“拥有”整个格陵兰,而不仅仅是依据现有条约在当地行使军事和防务权利。 特朗普称,所有权本身具有无法通过租赁或条约获得的战略价值。 据悉&…

2026企业微信社群运营工具推荐:微盛·企微管家功能全解析

企业微信社群运营的三大难题与解决路径 2025年,企业微信社群数量较去年激增53%,但据行业调研,80%企业正面临三大核心挑战:群活跃度不足导致用户流失、转化链路断裂难以追踪、人工运营成本同比上涨40%且响应效率下降28%。这些问题的…