当前位置：首页 > 科技资讯 > 正文

谷歌Gemini新突破：聚焦长上下文与成本革命

谷歌在AI领域又有新动向？

近期，Google DeepMind的Gemini预训练负责人Sebastian Borgeaud在接受采访时透露了重要信息——未来一年，大模型预训练领域将在「长上下文处理效率」和「上下文长度扩展」方面迎来重大技术创新。

值得一提的是，Google Gemini的三巨头——Jeff Dean、Oriol Vinyals和Noam Shazeer罕见同台，他们的观点与Sebastian不谋而合，展现了惊人的共识。

这些高瞻远瞩的智慧让人深思，谷歌依然走在科技前沿。

谷歌大佬预言：已破解大模型核心

Sebastian Borgeaud在访谈中表示，未来一年内，针对提升长上下文处理效率及扩展模型上下文长度的预训练技术，将会有重大创新。

谷歌Gemini新突破：聚焦长上下文与成本革命 Gemini预训练长上下文处理注意力机制成本革命第1张

此外，他还透露，在注意力机制方面取得了一些有趣的发现，这可能在未来几个月内重塑研究方向。

对此，他感到非常兴奋，并指出Scaling Law并未消亡，只是正在演变。

Sebastian Borgeaud作为Gemini 3的预训练负责人，首次接受博客采访，带我们深入了解Gemini 3背后的实验室思维——变化究竟发生在哪里，以及为何现在的工作不再是「训练模型」，而是构建一个完整的系统。

一次意外的飞跃后，一个系统诞生了。

「如果对自己诚实的话，我想……我们比我认为我们能达到的地方，走得更远了。」Sebastian Borgeaud语气平静，但这句话却激起无限涟漪。

为何Gemini 3能实现如此巨大的性能飞跃？Sebastian的回答很简单：「更好的预训练和更好的后期训练」。

然而，这背后是一个根本性的认知转变。

谷歌Gemini新突破：聚焦长上下文与成本革命 Gemini预训练长上下文处理注意力机制成本革命第2张

「我们不再仅仅是在构建一个模型了，」他缓缓说道，「我认为，在这一点上，我们真正在构建的是一个系统。」

而这，正是Gemini 3颠覆性进步的关键。

人们常想象从Gemini一个版本到下一个版本总有石破天惊的「秘密武器」，但Sebastian揭示的真相是：进步源于无数细微改进的聚合。

展望未来几年的技术前沿，Sebastian指出了激动人心的方向，它们将共同塑造下一代AI的能力与形态。

谷歌Gemini新突破：聚焦长上下文与成本革命 Gemini预训练长上下文处理注意力机制成本革命第3张

1. 长上下文：从「短记忆」到「海量工作台」

Gemini 1.5带来的超长上下文能力已经是一场变革。Sebastian预测，这方面的创新将持续加速。

谷歌Gemini新突破：聚焦长上下文与成本革命 Gemini预训练长上下文处理注意力机制成本革命第4张

4. 效率与成本的「革命」

一个日益凸显的挑战是：随着用户激增，模型的部署和服务成本变得至关重要。未来的研究将不再只追求性能峰值，还必须关注如何让强大模型变得「便宜又好用」。

采访尾声，当我们拉回这位站在AI浪潮之巅的研究者时，Sebastian的回答透露出沉静的乐观与纯粹的热情。

谷歌Gemini新突破：聚焦长上下文与成本革命 Gemini预训练长上下文处理注意力机制成本革命第5张

谷歌Gemini新突破：聚焦长上下文与成本革命 Gemini预训练长上下文处理注意力机制成本革命第6张

在会议中，Noam不再是那个激进派。

他很少谈论「颠覆」，反而多次谈到研发节奏、系统稳定性及长期运行。

作为Transformer的开创者，他曾引领大模型发展；如今，他却警告大模型自我检查次数太少。

Noam提到「慢思考」，不只是放慢研发速度，而是反复追问值不值、贵不贵、能否被规模化复制。

在这场对谈里，「System」高频出现。Noam和Jeff在描述Gemini时，刻意避开「更强的模型」，而强调它是一个可以长期运行、不断迭代的「系统」。

本文由主机测评网于2026-05-30发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260546724.html