当前位置:首页 > 科技资讯 > 正文

谷歌Gemini系统:多智能体竞赛推动L3 AI进步

谷歌的Gemini系统正挑战着AI的极限,其多智能体竞赛功能或将引领L3 AI的潮流。

最新测试显示:Gemini能连续运行40分钟处理同一任务

在这40分钟里,Gemini根据用户输入,能生成100+条创意,并由一组Agent进行打分、排名,最终输出结构化的评审报告。

这样的设计,让用户无需面对AI的草稿式输出,只需从智能体打磨后的结果中挑选即可,大大减少了与单个Agent的磨合时间。

简而言之,用户只需决策拍板,而探索和迭代的过程,全由Agent代劳。

谷歌Gemini系统:多智能体竞赛推动L3 AI进步 Gemini 多智能体竞赛 L3 AI 长时思考 第1张

据悉,这种“先由点子生成器想方案,再由评审团进行竞赛式打分”的多智能体系统,在面向用户的产品中还是首次亮相

谷歌这次的创新,再次证明了其在AI领域的领先地位。

谷歌Gemini系统:多智能体竞赛推动L3 AI进步 Gemini 多智能体竞赛 L3 AI 长时思考 第2张

多智能体竞赛系统

如何让智能体不再只是‘回答问题’,而是把大伙的输入‘当真事办’?

谷歌的做法是将多智能体工作流长时思考对抗式生成三件事直接结合。

本质上,这是在用‘时间’换‘质量’。

一句提示会在多智能体系统内部经历一个长达40多分钟的、完整的生成—竞争—筛选流程,而不是一次性吐出答案。

具体看,Gemini for Enterprise的多智能体系统首先接收主题与评估标准,大规模生成初始创意(100+)。

随后,多个Agent以竞赛方式对这些创意进行评分、排序。

这样,用户得到的不是一条回答,而是一套经过完整流程沉淀出来的结果:约100个创意,按标准排序,并附带概述、细节、评论、完整评审记录,以及独立生成的‘比赛表现报告’。

谷歌Gemini系统:多智能体竞赛推动L3 AI进步 Gemini 多智能体竞赛 L3 AI 长时思考 第3张

当前预览版中,谷歌推出了两个基于此竞赛系统的应用场景:

创意生成:用户提供主题后,系统启动多智能体竞赛流程,生成并排序与主题相关的创意。

合作科研:用户指定研究主题并提供数据,由智能体通过相同机制生成和评估创意,更侧重科研类任务。

谷歌Gemini系统:多智能体竞赛推动L3 AI进步 Gemini 多智能体竞赛 L3 AI 长时思考 第4张

事实上,谷歌早在今年2月就发布过科研辅助类的Agent,但与这次内测的能力相比,功能规模和表现都不是一个量级。

谷歌Gemini系统:多智能体竞赛推动L3 AI进步 Gemini 多智能体竞赛 L3 AI 长时思考 第5张

一方面,单次推理的可持续时长被提升至40分钟。

另一方面,系统在推理期间能够结合对抗式生成,产出结构化、有洞见的内容。

这不仅让Agent能承担更复杂的任务,也提升了人机协作效率。

L3 AI,谷歌先行一步

去年,OpenAI提出了五级AI分类体系,用以追踪通用人工智能(AGI)的发展。

按这一体系,去年位于L1(会话型AI)向L2(推理型AI)发展的阶段。

而今年,随着Agent技术的快速发展,L3 级代理型AI开始走上舞台。

谷歌Gemini系统:多智能体竞赛推动L3 AI进步 Gemini 多智能体竞赛 L3 AI 长时思考 第6张

L3的核心在于‘代理能力’,即AI可以在用户授权下自主执行任务,并在多天内持续运行、适应环境变化。

谷歌Gemini系统:多智能体竞赛推动L3 AI进步 Gemini 多智能体竞赛 L3 AI 长时思考 第7张

随着合作科研的进一步开发,Gemini没准也能够触及L4(创新者)的门槛。