谷歌的Gemini系统正挑战着AI的极限,其多智能体竞赛功能或将引领L3 AI的潮流。
最新测试显示:Gemini能连续运行40分钟处理同一任务。
在这40分钟里,Gemini根据用户输入,能生成100+条创意,并由一组Agent进行打分、排名,最终输出结构化的评审报告。
这样的设计,让用户无需面对AI的草稿式输出,只需从智能体打磨后的结果中挑选即可,大大减少了与单个Agent的磨合时间。
简而言之,用户只需决策拍板,而探索和迭代的过程,全由Agent代劳。
据悉,这种“先由点子生成器想方案,再由评审团进行竞赛式打分”的多智能体系统,在面向用户的产品中还是首次亮相。
谷歌这次的创新,再次证明了其在AI领域的领先地位。
如何让智能体不再只是‘回答问题’,而是把大伙的输入‘当真事办’?
谷歌的做法是将多智能体工作流、长时思考、对抗式生成三件事直接结合。
本质上,这是在用‘时间’换‘质量’。
一句提示会在多智能体系统内部经历一个长达40多分钟的、完整的生成—竞争—筛选流程,而不是一次性吐出答案。
具体看,Gemini for Enterprise的多智能体系统首先接收主题与评估标准,大规模生成初始创意(100+)。
随后,多个Agent以竞赛方式对这些创意进行评分、排序。
这样,用户得到的不是一条回答,而是一套经过完整流程沉淀出来的结果:约100个创意,按标准排序,并附带概述、细节、评论、完整评审记录,以及独立生成的‘比赛表现报告’。
当前预览版中,谷歌推出了两个基于此竞赛系统的应用场景:
创意生成:用户提供主题后,系统启动多智能体竞赛流程,生成并排序与主题相关的创意。
合作科研:用户指定研究主题并提供数据,由智能体通过相同机制生成和评估创意,更侧重科研类任务。
事实上,谷歌早在今年2月就发布过科研辅助类的Agent,但与这次内测的能力相比,功能规模和表现都不是一个量级。
一方面,单次推理的可持续时长被提升至40分钟。
另一方面,系统在推理期间能够结合对抗式生成,产出结构化、有洞见的内容。
这不仅让Agent能承担更复杂的任务,也提升了人机协作效率。
去年,OpenAI提出了五级AI分类体系,用以追踪通用人工智能(AGI)的发展。
按这一体系,去年位于L1(会话型AI)向L2(推理型AI)发展的阶段。
而今年,随着Agent技术的快速发展,L3 级代理型AI开始走上舞台。
L3的核心在于‘代理能力’,即AI可以在用户授权下自主执行任务,并在多天内持续运行、适应环境变化。 随着合作科研的进一步开发,Gemini没准也能够触及L4(创新者)的门槛。
本文由主机测评网于2026-05-12发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260544741.html