

作家:王兆洋和他的 Kimi 2.5 Agent 集群
Gemini 3.1 来了
2026 年 2 月 19 日,Google 发布 Gemini 3.1 Pro。这是 Google 初度以 ".1" 当作版块增量发布 Gemini 模子——此前的版块迭代均为 0.5 递进(1.0 → 1.5 → 2.0 → 2.5 → 3.0)。
Google 将这次更新定位为 " 中枢推贤惠力的朝上 "(a step forward in core reasoning),那时代基础是上周 Gemini 3 Deep Think 更新中引入的 " 中枢智能 "(core intelligence)架构。
在两项要害基准测试中,Gemini 3.1 Pro 呈现显耀性能普及。ARC-AGI-2 测试得分 77.1%,较 Gemini 3 Pro 的 31.1% 普及杰出一倍。在 Humanity's Last Exam 测试中,Gemini 3.1 Pro 得分 44.4%,高于 Gemini 3 Pro 的 37.5% 和 GPT-5.2 的 34.5%。

Artificial Analysis 孤独评测走漏:举座智能维度 Gemini 3.1 Pro 以 57 分居首,Claude Opus 4.6 以 53 分位列第二;编码智力 Gemini 3.1 Pro 以 56 分排名第一;Agentic 任务方面 Claude Opus 4.6 以 68 分开头,Gemini 3.1 Pro 为 59 分。

造访渠谈已同步通达。开导者可通过 Gemini API、Google AI Studio、Gemini CLI、Google Antigravity 及 Android Studio(预览版)调用;企业用户可使用 Vertex AI 和 Gemini Enterprise;庸碌破费者可在 Gemini App 和 NotebookLM 中使用,其中 Pro 和 Ultra 订阅用户享有更高额度。
这次更新最"吓东谈主"的场合是,Google 一个"超等小"版块的迭代,达到了其他家模子大迭代的恶果。
虽然版块号核定定,但这个信号背后,Google 这么处理版号计谋的治愈——从 0.5 增量改为 0.1 增量——班师意味着 Google 将加速模子迭代节拍,以更细粒度的样子推送智力雠校。
也便是,此前一段时期若干还比较淡定的 Google,也要开卷了!
官方给出的惊艳案例:更智能,更好意思,更全面
在官方发布的演示中,四个案例展示了 Gemini 3.1 Pro 的代码生成智力。
第一个案例是将文体立场漂泊为网站绸缪。系统以《呼啸山庄》为灵感,假定书中扮装是一位征象照相师,生成了一套竣工的个东谈主作品集网站。视觉上,网站采选了与演义氛围相符的色斡旋排版,将文体田地班师映射为界面元素。
第二个案例是 3D 椋鸟群飞模拟。用户不错通过界面交互放胆鸟群的畅通标的,鸟群的飞动动态会及时生成对应的音景,声息随鸟群密度和畅通气象变化。这是一个将视觉、交互和音频整合在一皆的竣工演示。
第三个案例是国外空间站位置可视化。系统生成了一个 HTML 仪容盘,集成了第三方 API 获得的及时数据,在舆图上走漏空间站确现时位置和运行轨迹。这展示了模子处理外部数据接口的智力。
第四个案例是动画 SVG 生成。模子班师输出了可在网页中使用的动画 SVG 文献,这种矢量面孔不错恣意缩放而不赔本画质,妥当需要响应式绸缪的名堂。
这些案例的共同特质是:它们都是竣工的、可班师运行的代码产物,而非片断或伪代码。从文体作品到交互模拟,从数据可视化到图形生成,躲闪了不同的诓骗场景。模子在这些任务中的推崇奈何,读者不错自行判断。
Gemini 3.1 Pro 的时代迭代,体现了一条求实的旅途:在颠覆式重构不太会频繁出现后,要追求对现存架构的紧密化打磨。


架构层面持续了 MoE(夹杂巨匠)门路,100 万 token 的陡立文窗口和 64,000 token 的输出上限保管不变。这个范围在现时的模子梯队中仍属头部,足以复古长文档分析、代码库贯通等场景。真偶合得可贵的,是推理机制的重构。
三层念念考模式(Low/Medium/High)的引入,本体上是对 " 计较 - 质料 - 资本 " 三角联系的显式化处置。Low 模式追求响应速率,妥当高并发场景;High 模式则调用竣工推贤惠力,处理复杂问题可能需要数分钟——这种绸缪让用户能够笔据任务难度主动衡量资本,而非被迫继承同一计价。Medium 层级的加入填补了此前的空缺,为平常任务提供了更经济的中间选项。
同期,Deep Think 时代也出现了"下放",上周 Gemini 3 Deep Think 在 ARC-AGI-2 测试中取得 84.6% 收货所依赖的 " 并行念念考时代 ",已被整合进基础模子。这意味着模子能够同期探索多条解题旅途,再通过里面评估筛选最优解。与此同期,本来用于 Flash 模子的强化学习时代也被迁徙至 Pro 版块,这种时代栈的横向买通,比单纯的参数堆叠更有价值。
幻觉放胆方面的朝上也很要害。AA-Omniscience Index 从 13 分跃升至 30 分,在主流模子中排名第一。这一主见测度的是模子对自身常识鸿沟的分解智力——知谈 " 不知谈什么 ",比知谈 " 知谈什么 " 更难,也更热切。
总体而言,Gemini 3.1 Pro 的升级逻辑了了:不追求单名堂标的惊艳,而是在可控资本下,系统性地普及模子的可用性和可靠性。
榜单以外,更热切是 Google 也开动卷了
Gemini 3.1 Pro 发布后,时代社区的声息呈现出显着的分化。
乐不雅派将眼神投向了数据。ARC-AGI-2 基准 77.1% 的得分被视为实质性冲突——这不仅是上一代 31.1% 的两倍以上,也意味着模子在处理全新逻辑模式时的智力跃升。
幻觉抗性主见(AA-Omniscience Index)从 Gemini 3 Pro 的 13 跃升至 30,远超 Claude Opus 4.6 的 11,这一朝上被开导者群体频繁说起。三层念念考模式的绸缪也受到好评——让用户笔据任务复杂度自主选拔 " 快速 / 深度 / 深度 +" 模式,被以为是对放胆权的合理让渡。
但质疑声一样值得倾听。Gartner 分析师 William McKeon-White 的评价代表了一种审慎立场:" 这是好的握续朝上,但莫得什么根人性的游戏章程篡改者。" 华盛顿大学栽培 Chirag Shah 则建议了更深层的问题:更好的推贤惠力如实是处理复杂任务的必要要求,但并非充分要求—— " 更并且,' 复杂 ' 自己的界说就不解确。"LMArena 的盲测数据也提供了另一种视角:3.1 Pro 比拟 Gemini 3 Pro 的普及幅度有限,在膨胀文本和代码任务上仍逾期于 Claude。
中立不雅察者更可贵宏不雅趋势。AI 模子名次榜被描画为 " 抢椅子游戏 " —— Claude、Gemini、GPT 轮替登顶,每次开头周期惟罕有周。发布节拍的密集一样引东谈主防护:Anthropic Sonnet 4.6 于 2 月 17 日发布,Google Gemini 3.1 Pro 紧随自后于 2 月 19 日登场。一个被反复说起的不雅察是:基准分数与确凿用户体验之间存在落差,名次榜上的开头不等于践诺责任流中的上风。
其实,比拟于在榜单上几个少量点的普及,更热切的是 Google 我方计谋的愈加激进化。
Gemini 3.1 Pro 的发布,开头标记着 Google 居品计谋的隐秘转向。初度采选 ".1" 版块号,意味着从曩昔追求 " 大版块颠簸 " 的发布节拍,转向更逼近工程践诺的握续迭代模式。
这种转念自己诠释:AI 竞赛已插足长跑阶段,单次爆发的窗口期正在收窄。在高端推理市集,Google 终于拿出了与 GPT-5.2 和 Claude 正面交锋的居品,而其确凿的护城河大略不在于模子自己,而在于 Cloud 和 Workspace 组成的企业基础按序——这是 OpenAI 和 Anthropic 短期内难以复制的。
从行业视角看,推贤惠力正在成为模子竞争的新高地。Gemini 3.1 Pro 与 Anthropic 的发布每每代隔仅两天,这种以天为单元的跟进速率,反应露面部厂商的时代差距正在收窄。更具信号真谛真谛的是订价计谋:最高性能模子的价钱反而更低,这意味着价钱战已从 " 性价比竞争 " 升级为 " 性能溢价隐没 " 的新阶段。
Gemini 3.1 Pro 订价为 $4.50/ 百万 token(夹杂价钱),低于 GPT-5.2 的 $4.80、Claude Sonnet 4.6 的 $6 和 Claude Opus 4.6 的 $10。API 订价分档:≤ 200K tokens 时输入 $2、输出 $12;>200K tokens 时输入 $4、输出 $18。
免用度户可班师在 Gemini Web UI 使用 Gemini 3.1 Pro股票配资知识网-实盘交易结构与平台执行效率说明,无需订阅 Gemini Advanced。
股票配资知识网-实盘交易结构与平台执行效率说明提示:本文来自互联网,不代表本网站观点。