当前位置:首页 > 科技资讯 > 正文

谷歌Gemini 3发布:携手全球用户,共筑下一代智能系统

谷歌AI新纪元:Gemini 3震撼发布,全球顶尖专家携手并进,深度剖析AI工程新境界。

随着Gemini 3的盛大发布,谷歌在AI领域的霸主地位再度巩固!

一度被视为“后来者”的谷歌,如今正以技术、战略及资源上的优势,奋力争夺生成式AI时代的领导席位。

近期,谷歌DeepMind的CTO Koray Kavukcuoglu与谷歌AI Studio负责人Logan Kilpatrick,共同剖析了Gemini 3发布的盛况、AI前沿创新及AGI的宏伟蓝图。

谷歌Gemini 3发布:携手全球用户,共筑下一代智能系统 Gemini 3 AI AGI 工程协作 第1张

全程45分钟,聚焦模型优化、工程协作与生成媒体的崛起,揭示了谷歌AI的战略蓝图。

此次升级,不仅仅是“又多了一个大模型”,更是谷歌向世界宣告——

我们要与全球用户携手,共建下一代智能系统。

与用户共创新篇章,征途才刚刚开始

Gemini 3的发布,标志着AI界迈入“共建AGI”的新纪元。

“我对目前的进展感到无比兴奋。”在现场,Koray Kavukcuoglu难掩激动之情,

我们确实在多个维度推进了技术边界。这就是构建AGI的方式:脚踏实地,全力以赴。

这并非闭门造车的科研成果,而是一场面向全球用户的“共建实验”。

谷歌Gemini 3发布:携手全球用户,共筑下一代智能系统 Gemini 3 AI AGI 工程协作 第2张

“我们正与用户一起,共同打造AGI。世界已变,新技术正重塑人们的期待。”

他微笑着补充:“突然之间,更多人都能成为创造者。让一切成真。”我们正处于一个激动人心的时代。

Koray表示,许多人对AGI的想象仍停留在实验室的“象牙塔”模式中。但现实恰恰相反——

“我们并非闭门研究,而是在与全世界共同构建AGI。”

他指出,AGI是可靠的系统工程。要构建稳定、安全、可靠的系统,必须从底层开始打基础。

谷歌采用工程师的思维方式,提前考虑这些因素。

他介绍道,在Gemini的训练过程中,安全团队、安全技术乃至每位模型研发成员,都直接参与了模型训练的后期过程。“我们不会等到模型完成再来检测安全性,而是将安全性视为核心目标,与模型能力的迭代同步进行。”

从2.5到3.0:Gemini不断加速

主持人Logan Kilpatrick是DeepMind团队的一员。上次两人坐在一起还是Gemini 2.5发布时,他们在I/O大会上聆听Dennis和Sergey谈论AI。

当时,Logan就觉得进展神速——现在看来,速度丝毫未减。

Koray对研究进展兴奋不已。他表示,从数据处理、预训练到后训练,一切都离不开创新:

越贴近真实世界,模型的接触面越广,反馈信号越丰富,从中诞生的想法就越多。

我们面临的问题会越来越复杂,而正是这些挑战推动我们一步步走向智能的本质。

落地才是AGI的关键

如今,AI基准测试种类繁多。到底要在哪些方面持续发力?

谷歌一直重点关注以下两大领域。

  • 指令遵循(instruction following)——模型必须能理解用户请求,并按要求回应。
  • 国际化“谷歌是全球化公司,我们必须确保模型适用于全球用户。”

谈到更技术性的领域时,Koray特别提到几个关键词:

  • 函数调用、工具调用、智能体行为、编程能力……

“AI模型不仅能自然调用各种工具和函数,更能自己编写这些工具。某种意义上,模型本身就是一种工具。”

统一架构:我们正接近“万能模型”

谈到多模态发展时,Logan提到Gemini V3、Nano Banana模型等图像与视频生成模型的进展并好奇:“视频模型真的是构建AGI的一部分吗?”

  • “最早的生成模型集中在图像上,是因为图像更容易观察和理解世界中的物理规律。”
  • “过去大家认为文本进展会慢,但事实证明文本是最容易突破的领域。”
  • “现在图像、视频、音频等多模态模型的能力正在回归。它们和文本模型的架构也在趋同。”

诚实面对挑战,是唯一的出路

  • “加入谷歌初期时,Logan有种‘谷歌是AI界的挑战者’的感觉。虽然有技术底子但外界并不看好。”
  • “规模不是阻碍而是独特的力量源泉。”
  • “我们的目标一直很清晰——构建真正的智能。我们会把全部的心思、创新力和资源投入到这条路上行稳致远。”

Gemini下一阶段永远在前线也永远准备革新