当前位置:首页 > 科技资讯 > 正文

Gemini 3.0 LMArena实测:AI新纪元令人瞩目

谷歌的Gemini 3.0在LMArena上线疑似曝光,众多实测提前现身,但效果如何,仍需细细品味。

Gemini 3.0传闻已久,如今终于露出了些许「端倪」。

依旧是在LMAreana竞技场,Gemini 3.0的两个「化名」被揭开了神秘面纱。

Gemini 3.0 Pro的化名:lithiumflow

Gemini 3.0 Flash的化名:orionmist

Gemini 3.0 LMArena实测:AI新纪元令人瞩目 LMArena AI 实测 第1张

这已是「常规操作」,每次新模型上线,都需在LMArena上造势一番。

Gemini 3.0 LMArena实测:AI新纪元令人瞩目 LMArena AI 实测 第2张

然而,看了竞技场的实测结果,Gemini 3.0确实有所长进,希望谷歌这次能摆脱OpenAI的阴影,展现自己的实力!

Gemini 3.0 LMArena实测:AI新纪元令人瞩目 LMArena AI 实测 第3张

此前,一些前端案例曾流出,网友爆料称,谷歌下一代旗舰模型将在10月22日发布。

Gemini 3.0 LMArena实测:AI新纪元令人瞩目 LMArena AI 实测 第4张

一些拿到内测资格的开发者,分享了部分demo。

Gemini 3.0 LMArena实测:AI新纪元令人瞩目 LMArena AI 实测 第5张

这次是直接上线在LMArena竞技场里了。

「幸运」遇到Gemini 3化名用户的分享了他们例子,如果你也足够幸运,不妨分享一下Gemini 3的表现是否有了显著提升。

AI首次准确识别钟表

实测中,「看表」一直是AI的一大难题,这其中涉及了多种因素,如钟表样式、指针长短、指向、分钟间隔的判断等。

但Gemini 3 Pro(lithiumflow)的实测显示,该模型已经可以精确到小时(6)、分钟(02)和秒(30)。

Gemini 3.0 LMArena实测:AI新纪元令人瞩目 LMArena AI 实测 第6张

相比之下,GPT-5 Thinking就显得有些「混乱」,直接识别成了12:30,有些时针、分针不分了。

Gemini 3.0 LMArena实测:AI新纪元令人瞩目 LMArena AI 实测 第7张

用Gemini 2.5 Pro实测也是同样混乱,模型确实很难分辨时钟时间。

Gemini 3.0 LMArena实测:AI新纪元令人瞩目 LMArena AI 实测 第8张