- AI进步的关键在于其能否赋能现实世界,而非仅仅在基准测试中取得高分
- Gemini 3聚焦于精准意图理解、全球化服务及工具化创造能力的提升
- “氛围编程”正打破创意与实现的界限,让创新触手可及
- AGI的实现需通过真实世界的持续交互,而非封闭实验室研究
- 文本与视觉模型的融合,正创造更人性化的交互体验
- 统一模型架构的挑战在于平衡文本的结构化信号与图像生成的精确性
“我们距离顶尖水平还有很长的路要走。”两年半前,当谷歌DeepMind启动Gemini项目时,首席技术官兼首席AI架构师科雷·卡武克乔格鲁在内部会议上直言不讳。
当时的谷歌,在大模型领域明显落后,AI Studio仅有3万用户且没有收入,团队承受着巨大的竞争压力。
从坦诚落后到Gemini 3引爆市场,谷歌完成了一场令人瞩目的逆袭。这场逆袭的背后,是三个关键转变:
第一, 从实验室思维转向战场思维,建立“每六个月重大迭代”的更新节奏;
第二, 聚焦三大核心优势,让模型真正理解人类意图、服务全球用户、具备使用和创造工具的能力;
第三, 调动全球专家资源,实现从芯片层到亿级产品的端到端协同。
在这场关乎未来的AI竞赛中,卡武克乔格鲁首次揭示了逆袭背后的真实故事。
问:Gemini 3发布后市场反响积极,如何评价这一代模型的突破?
卡武克乔格鲁:Gemini 3不仅在基准测试和预发布验证中表现出色,更在真实应用场景中获得了用户认可。虽然仍有改进空间,但目前的反馈令人鼓舞。
问:从Gemini 2.5到Gemini 3.0,技术进步为何持续加速?
卡武克乔格鲁:当前AI领域的创新节奏惊人。技术在实际场景中产生价值时,会获得更多反馈,进而催生新的创新思路。
问:基准测试在技术发展中的作用是什么?
卡武克乔格鲁:基准测试与模型开发相辅相成。例如,HLE基准测试从早期的1%或2%提升到如今的40%。
问:GPQA等基准测试的进展是否意味着需要重新定义技术前沿?
卡武克乔格鲁:基准测试重要,但衡量技术进步的根本标准在于实际应用。当模型融入人类知识工作的各个环节时,才实现了真正的进步。
本文由主机测评网于2026-05-14发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260545280.html