当前位置:首页 > 科技资讯 > 正文

Gemini 3震撼登场:重塑AI新纪元

经过长时间的等待,昨晚Gemini 3终于震撼上线,以惊人的实力碾压了各大模型,让人惊叹不已。

仅需一句话,就能生成3D模型、创建网站,甚至打造开放世界游戏……

现在,只需进入Google AI Studio,即可亲身体验Gemini 3 Pro预览版。而面向大众的Gemini网站和App也将很快与大家见面。

我想说在座的各位……

Gemini 3 Pro不仅将前辈Gemini 2.5 Pro远远甩在身后,还在除“解决真实GitHub问题(SWE-Bench Verified)”外,全面超越了Claude Sonnet 4.5和GPT-5.1。

这就像一个班级里来了位各科全优的学生,你说气人不?

Gemini 3震撼登场:重塑AI新纪元 3 AI模型 多模态 生成式UI 第1张

学霸的成绩单中有几项尤为值得关注。

ARC-AGI-2测试中,Gemini 3 Pro以31.1%的成绩遥遥领先第二名Claude Sonnet 4.5。这是一项检验AI抽象推理能力的高难度测试,被视为检验通用人工智能水平的重要标准。

AIME 2025和MathArena Apex则代表了解决数学问题的能力。其中,Gemini 3 Pro在MathArena Apex拿下23.4%的分数。相比之下,对手们的分数还不到2%,可能连题目都读不懂。

ScreenSpot-Pro和Vending-Bench 2两项测试则更为有趣。前者评估AI能否像人类一样操作UI界面,后者则测试AI在复杂任务中的执行能力。

简而言之,Gemini成了Siri想成为的样子。

假设老板临时更改会议时间,你担心错过女儿的演出。此时询问AI,它将调取你手机中的数据,如会议结束时间、演出时间以及路况,帮你判断是否赶得上。

谷歌直接给你端上了这个“神器”。

开启Gemini Agent模式并授权后,它能调动你手中各种谷歌设备的数据,帮你实现上述例子。

比如,你对Gemini说:“根据邮件信息,帮我预定一辆下周旅行所需的中型SUV,租金不超过80美元一天。”下飞机后直接取车即可。

此外,它在被誉为“人类最后一场闭卷考试”的“Humanity's Last Exam”中也拿下目前最高分37.5%,比第二名GPT-5.1的26.5%高出不少。

这意味着,Gemini 3 Pro是目前最接近“人类通才”的模型。

而开启Gemini 3 Deep Think(深度思考模式)后,它在“Humanity's Last Exam”中的成绩还能提升至41%。面对复杂科学问题(GPQA Diamond)时,它拿下了93.8%的高分。

设计师要小心了

过去,开发app或网页需要设计师先绘制UI及素材,再由程序员用代码实现。而现在一句话就能让Gemini生成高质量的交互式SVG。

Gemini 3震撼登场:重塑AI新纪元 3 AI模型 多模态 生成式UI 第2张

此外,还有网友让Gemini绘制了“游戏里的水管工”、五缸发动机等复杂图案。

Gemini 3震撼登场:重塑AI新纪元 3 AI模型 多模态 生成式UI 第3张

我也尝试让Gemini画了一个灯泡并添加了可操作的开关,它仅用35秒就搞定。

Gemini 3震撼登场:重塑AI新纪元 3 AI模型 多模态 生成式UI 第4张

可交互的SVG不仅让大家玩得开心,更有深远的意义和野心。

谷歌表示,基于Gemini 3强大的推理和多模态能力,他们将在未来的Gemini App中推出“生成式UI”功能。

未来,Gemini应用将直接用可交互的UI回答问题、响应指令,而不再是一问一答的传统交互方式。

程序员再次面临挑战

某种意义上来说,SVG画图也是编程的一种。说到编程,那正是Gemini的拿手好戏。

Gemini 3震撼登场:重塑AI新纪元 3 AI模型 多模态 生成式UI 第5张

根据网友测试,Gemini 3 Pro在DesignArena的多个项目中再次夺冠。

Gemini 3震撼登场:重塑AI新纪元 3 AI模型 多模态 生成式UI 第6张

现在只需一段描述,就能让Gemini 3编写一个“macOS操作系统”。点击运行后,它不仅会模拟开机流程,还能在其“macOS”中上网、跑终端……

Gemini 3震撼登场:重塑AI新纪元 3 AI模型 多模态 生成式UI 第7张

有网友让Gemini 3制作《我的世界》,它完成得相当出色。

Gemini 3震撼登场:重塑AI新纪元 3 AI模型 多模态 生成式UI 第8张

我自己也尝试了一番。要求一个包含主页、个人介绍、作品、联系方式的现代简约风格网站。结果仅用一分半钟就搞定。