指数
A Google 周二(19日)宣布, 双子座3.5闪存 在年度会议期间 谷歌I / O 2026该研究在山景城进行。新的人工智能模型有望带来更优异的性能。 双子座3.1专业版 在编程和自主代理方面,其运行速度比其他前沿模型快四倍。该公司还公布了该应用程序的全面重新设计。 双子座个人代理人 双子星火花视频创作模型 双子座全能 订阅计划也有所变更。详情如下。
什么是 Gemini 3.5 闪光灯?
O 双子座3.5闪存 这是该系列新车型的首款产品。 双子座3.5 它已经取代之前的模型,成为该应用程序的默认模型。 双子座 做 人工智能模式 寻找 Google 全球范围内。实际上,任何使用 双子座 从今天起,即使是该应用程序的免费版本也将与之交互。
为了理解发生了哪些变化,简要解释一下很有必要。在人工智能模型领域,模型有不同的“规模”。最大的模型(称为专业版或高级版) 旗舰 通常来说,它们功能更强大,但速度也更慢,价格也更贵。而体积较小的型号(例如 Flash 系列)速度更快、价格更低,但画质可能不如大型型号。
呸呸呸 Google 肯定 3.5 Flash 两者之间的差距已经大幅缩小(至少在下一代Pro机型推出之前是这样)。这款机型的性能可以与同一厂商生产的更大、更贵的机型相媲美。 Google 有多少竞争对手喜欢 OpenAI 和 人类的保持 Flash 线的速度。
据该公司称, 3.5 Flash 它是最强的模型 Google 在两个具体方面。首先是代码编写能力,即编写、纠错和维护程序代码的能力。其次是智能体任务,即人工智能不仅能回答问题,还能采取一系列行动来解决完整的问题。
一个实际的例子是,让人工智能分析财务电子表格,找出不一致之处,将其与电子邮件数据进行交叉引用,并生成最终报告,所有这些步骤都不需要人工干预。
该模型具有一个上下文窗口 1万个代币 (相当于一次性处理约 750 万字,大约十本书),支持多模态输入(文本、图像、音频和视频),并且已经可以通过以下方式在全球范围内使用: 双子座API, 谷歌人工智能工作室, Android Studio代理平台 Google Antigravity e 双子座企业.
基准测试性能
为了支持这些说法, Google 已公布的结果 基准这些是业界用于衡量人工智能模型在特定任务中性能的标准化测试。最相关的测试包括: 双子座3.5闪存 他们专注于编程和自动化。
公司公布的主要数据如下: 76,2% 没有 终端工作台 2.1 (一项测试,用于衡量人工智能在编程终端中解决实际任务的能力,例如安装软件包、修复错误和操作文件) 83,6% 没有 MCP 地图 (评估人工智能代理对多种工具的协调使用) 84,2% 没有 CharXiv 推理 (测试对科学文章中图表理解能力)
该模型也达到了 1.656 埃洛 没有 GDPval-AA,一个模拟具有实际经济价值的任务的基准测试,例如财务文件的分析。
据该网站 法学硕士统计数据该模型超越了 双子座3.1专业版 在类似于真实世界工作的基准测试中,例如编程、工具使用和财务自动化。然而, 3.5 Flash 它在后面 3.1临 在纯粹学术推理的基准测试中,例如 人类的最后考试 (40,2% 对 44,4%) ARC-AGI-2 (72,1% 对 77,1%)。
实际上,这意味着对于科学或抽象数学中的复杂问题,Pro 模型仍然更胜一筹;但对于日常工作任务,例如编写代码或自动化流程,Pro 模型则更胜一筹。 3.5 Flash 利用。
此外,该 Google 他强调该模型可以生成文本。 速度提高四倍 与其他市场上的顶级型号相比
竞争环境
此次发布正值公司面临压力之际。 Google尽管该公司拥有远超竞争对手的雄厚财力,但在人工智能应用于商业领域的竞赛中却落后了。据…… 金融时报分析师估计…… Google 介于 10%和15% 市场的 开发者和人工智能自动化而规模较小的竞争对手 人类的 e OpenAI 大约占主导地位 40% 在一起。
A 人类的, 的创造者 克劳德并告知投资者,公司正按计划实现盈利。 年化45亿美元与去年年底相比增长了五倍,这主要得益于其编码工具的受欢迎程度。
已经申请 ChatGPT因为 OpenAI, 有 每周 900 英里, 而 双子座 用户数量也达到了同样的水平。 每月这表明每次会话的参与度较低。
o CEO 达 Google, 孙大信桑达在会议上,该公司直接谈到了这一点,并表示该公司 希望将代理的使用范围扩大到企业和开发者以外的群体。观看演示的人注意到…… Google 是 下注并加倍下注 现在有代理商了。
开发人员需要花费多少成本(价格发生了哪些变化)?
A Google 定位 双子座3.5闪存 对于公司而言,这是一种经济高效的选择,因为它能够执行代理任务。 “价格不到其他顶级型号的一半”但这种比较需要重要的背景信息。
首先,做一个简单的解释。 令牌 这些是人工智能模型处理的文本单元。在葡萄牙语中,每个单词大约相当于 1,5 个词元。当公司使用 Gemini API(允许将人工智能集成到自身系统的接口)时,需要按处理的词元数量付费,包括输入(发送给模型的内容)和输出(模型的响应)。
价格 双子座3.5闪存 在 API 中,它来自 每百万入场券 1,50 美元 e 每百万退出代币 9 美元🇧🇷 相比 双子座3.1专业版 (2,50美元/15美元),新款实际上是…… 便宜 40% 两个方向。
然而,当我们将其与之前的 Flash 版本进行比较时,在这种情况下…… 双子座3闪存目前许多开发人员在生产环境中使用它,成本很高。 每百万入场券 0,30 美元 e 每百万退出代币 3,00 美元.
因此,对于已经使用以下技术的团队来说: 2.5 Flash 在大规模管道中,迁移到 3.5 Flash 虽然性能大幅提升,但这却意味着成本的显著增加。
| 型号 | 参赛资格(每1万代币) | 输出(每百万代币) |
|---|---|---|
| 双子座2.5闪存 | 美元0,30 | 美元2,50 |
| 双子座3.5闪存 | 美元1,50 | 美元9,00 |
| 双子座3.1专业版 | 美元2,50 | 美元15,00 |
Antigravity 2.0 和“运行 Doom”的演示版
亮点之一 谷歌I / O 这是关于……的演讲 反重力 2.0谷歌的开发平台,从一开始就旨在创建和协调 人工智能代理.
瓦伦莫汉平台负责人登台亮相,并以一项雄心勃勃的提案展示了系统的强大功能,团队也随之提出了…… 反引力 及其代理商从零开始构建操作系统的核心。
公布的数据 Google 在这个过程中,他们给人留下了深刻的印象。他们创建了所使用的操作系统。 93名次级代理人 (较小的代理,每个代理负责特定的任务,例如编写系统模块、测试组件或解决依赖关系)并行工作。
根据 Google人工智能代理生成的 2,6亿个代币 并完成了操作系统的功能核心。 约12小时,与 预计成本低于1.000美元在现场演示过程中,由于缺少键盘驱动程序,系统最初无法运行游戏《毁灭战士》,但该问题被工作人员实时修复。 反引力使得游戏可以实时进行。
值得注意的是,据消息人士透露,所开发的操作系统与……并不相同。 Windows ou Linux 这是一个完整的系统。它仅仅是一个实验系统的功能核心,足以演示启动和执行。
同样,这里展示的“Doom”更像是系统原始代码的克隆版,而非原始可执行文件。尽管如此,这个演示确实令人印象深刻。
Gemini Spark 和应用程序的全新界面。
除了模型之外, Google 它为用户体验带来了显著的变化。该应用程序 双子座 现在拥有超过 月活跃用户达900亿 在超过230个国家和地区,使用70多种语言,是报告的400亿的两倍多。 I / O 与去年相比,皮查伊表示,同期每日就诊量增加了七倍。
神经表达:新设计
该应用程序的重新设计采用了一种名为“视觉语言”的视觉语言。 神经表达Gemini 最显著的变化在于其响应方式,包括流畅的动画、改进的字体、鲜艳的色彩和触觉反馈。
此前,用户体验与其他人工智能聊天机器人类似,回复内容都是一大段连续的文本。然而,随着…… 神经表达Gemini 随后会根据问题的类型生成视觉上量身定制的答案,至少谷歌是这么承诺的。
例如,如果用户询问最佳旅游目的地,答案可能包括…… 集成图像, 交互式地图 e 旁白视频它不只是列出姓名,而是将最重要的信息突出显示在顶部,其余信息则以可视化图层的形式组织起来,用户可以根据需要进行浏览。
O 双子座现场语音聊天功能也已直接集成到主聊天界面中。现在用户无需切换屏幕即可在文字输入和语音聊天之间切换。谷歌还宣布未来将支持…… 地区方言 用双子座的声音。重新设计后的版本现已在全球范围内推出。 安卓, iOS 和 卷筒纸.
Gemini Spark:全天候私人代理
O 双子星火花 这可能是本次展会上面向普通消费者最具雄心的新产品。它是一款运行……的人工智能个人助理。 每天24小时 在专用虚拟机中 Google Cloud, 使用 双子座3.5闪存 就像引擎一样 反引力 作为一个执行平台。与目前Gemini在被问及时才做出响应不同, 火花 以某种方式运作 积极主动的 并且持续地在用户指示下在后台执行任务。
用户可以设置重复性任务,例如询问…… 火花 为 每月自动分析您的信用卡账单。 并标记新增费用或隐藏费用。
也可以教他如何监控自己的收件箱。 孩子们学校的最新消息提取重要截止日期,并每日向用户和合作伙伴发送汇总摘要。
在更复杂的流程中, 火花 可以 交叉核对散落在电子邮件和聊天记录中的会议记录。创建一份有条理的文档 谷歌文档 甚至还要起草项目后续邮件。
O 火花 它最初与公司自身的服务集成。 Google如 Gmail的, 文档 以及其他应用程序 工作区并且应该扩展到第三方工具 MCP (模型上下文协议)贯穿整个夏季。
在移动设备上,代理将拥有一个名为“专用界面”的界面。 Android Halo它会显示实时更新和正在进行的任务进度。 Google 报告指出,诸如发送电子邮件或进行购物等高影响力行为, 这些操作需要用户确认后才能执行。
该代理程序将于本周开始向受信任的测试人员推出,并应在…… 测试 适用于订阅用户 谷歌AI超级 下周在美国。
Gemini Omni 和视频创作
同时宣布的另一项新功能 3.5 Flash 这是 双子座全能Omni 是一款专注于在 Gemini 应用内直接创建和编辑视频的模型。Omni 将 Gemini 的智能与生成式媒体模型相结合,从而实现变革…… 文字、图片和视频 高质量的视觉内容。
实际上,用户可以发送用手机录制的视频片段,并使用语音或文字命令进行编辑,应用诸如电影级缩放、场景切换或光线调整等特效。谷歌还演示了如何创建…… 个性化人工智能化身 它可以复制用户的外貌和声音,使用户能够被插入到生成的场景中。
O 双子座全能 从今天起,订阅用户即可开始使用。 AI Plus, 专业版 e 超级 世界各地。
面向消费者的新订阅方式和价格
另一个值得注意的新功能是…… Google 已对其订阅计划进行了调整。主要新变化是推出了一项新计划。 AI Ultra 每月 100 美元此方案面向高级开发者和创作者,使用量上限是专业版方案的五倍。旧方案 艾超成本 美元250这落到了…… 每月$ 200保持比专业版高 20 倍的限值, Project Genie, YouTube Premium e 30 TB 存储空间.
这一变化使 Google 与竞争对手处于直接平等地位。 OpenAI 高级计划收费200美元。 ChatGPT和 人类的 较高价位的产品收费分别为 100 美元和 200 美元。 克劳德区别在于…… Google 套餐包含额外服务,例如 YouTube 以及云存储。
没有 巴西新价格已反映在页面上。 Google One. 奥普莱诺 艾超 现在它以两首曲目的形式出现: $ 779,90 /月 (配备 20 TB 存储空间) $ 999,90 /月 (含30TB存储空间),数值如下 R $ 1.209,90 之前仅收取单项套餐费用。其他套餐在该国仍然可用: AI Plus 由 $ 24,99 /月, 高级人工智能 由 $ 49,99 /月 e 人工智能专业版 从 $ 96,99 /月.
该公司还用一种名为“每日提示限额”的系统取代了每日提示限额。 “计算使用量“这种方法衡量的是每个请求的复杂度,而不是消息数量。简单的查询消耗的配额很少,而视频生成或长时间的编程会话消耗的配额更多。这些限制每隔[时间段]更新一次。 五个小时如果用户在大型号机型中用完了配额,系统会自动迁移到小型号机型,而不是阻止访问。
对于那些不想付费的人来说, 双子座3.5闪存 它也可以在 Gemini 应用和 Google 搜索的 AI 模式中免费使用,但使用限制更为严格。
强化安全
A Google 还重点强调了以下方面的改进 安全防护 do 双子座3.5该模型是根据以下原则开发的: 前沿安全框架 公司方面加强了相关机制,以防止在这些区域产生有害物质。 控制论 e CBRN (化学的、生物的、放射性的和核的)。
该公司表示,新的保护措施包括以下工具: 可解释性实际上,这使得工程师能够在人工智能给出答案之前“查看”其推理过程,从而验证该模型是否遵循安全的思路。
目标是减少有害内容的产生以及…… 错误拒绝 安全问题,这是以前型号中常见的问题,有时会因为过度谨慎而拒绝回答无害的问题。
Gemini 3.5 Pro 将于下个月上市。
A Google 也证实了这一点 双子座3.5专业版新系列中尺寸更大、功能更强大的型号目前已在公司内部供员工使用。预计新型号将于[年]向公众发布。 六月2026.
O 3.5临 应该在需要执行的任务中表现更佳 深刻的推理 e 理解长远语境某些地区 3.5 Flash 虽然它为了速度做出了一些妥协,但它仍然令人印象深刻。
结论
总之,很明显…… 双子座3.5闪存 这标志着在以下方面迈出了重要一步: Google 在人工智能模型竞赛中,尤其是在以下情况下: 人工智能辅助编程 e 自治机构 它们已成为企业间的主要战场。
尽管市场份额仍然低于竞争对手,例如 OpenAI e 人类的 在这个领域,谷歌寄希望于速度、与专业机型相比具有竞争力的价格,以及与其数十亿用户生态系统的整合,以重新夺回市场份额。
演示 反重力 2.0 Gemini 3.5 闪光灯的其他用途也相当令人印象深刻,对于使用该设备的普通父母来说,这款型号可能会非常有帮助。 双子座通过应用程序,甚至使用谷歌最基本的套餐。
然而,与API相比,其价格上涨了。 2.5 Flash 这是开发人员在迁移之前应该仔细评估的一点,尤其考虑到最近发布的…… DeepSeek V4 Pro 和 Flash考虑到模型的规模,每个代币的价格低得离谱。
你试过新的那个了吗? 双子座3.5闪存你觉得速度和新功能怎么样?请在评论区和我们的社交媒体上告诉我们! 秀美科技!
附资料: 谷歌博客 | 瘾科技 | Android的局 | 一触即发 | 金融时报 | 印度今天 | 9to5Google | 法学硕士统计数据
另请参阅:
了解更多关于秀美科技
注册以通过电子邮件接收我们的最新消息。