当前位置:首页 > 科技资讯 > 正文

腾讯AI战略升级:智能体引领大模型时代

作者 | 邓咏仪

编辑 | 苏建勋

腾讯在AI领域一向低调,但在这次世界人工智能大会(WAIC)上,它不再保持沉默,高调展示了其在AI应用上的最新成果。

7月26日,WAIC在上海开幕,腾讯通过智能体为14亿用户打造了一个“数字好友圈”,涵盖了用户生活的各个方面。

腾讯还发布了包括自研大模型在内的多项新品,涵盖了To B和To C两大领域,堪称“AI全家桶”。

  • To B方面:发布了混元世界模型1.0,适用于VR、游戏开发、场景编辑和物理仿真等,并计划开源多个小体量模型;
  • To C方面:发布了超过10个Agent,主要用于生活、学习、工作场景,包括旅游规划Agent;
  • 平台层面:推出了智能体开发平台、具身智能开放平台Tairos、AIGC内容生成平台等。

“AI正从短期记忆向长期记忆演进”,腾讯云副总裁吴运声表示,过去大模型只能记住较短的上下文,这对复杂任务是不够的。

腾讯对智能体的投入,正是对技术演进路线的探索。例如多智能体协同——吴运声表示,AI技术正从图文问答向全方位的多模态(视频、图像、音频等)交互演进,未来将是全模态的无缝交互。不同的智能体负责不同的专业领域,通过协同才能解决更复杂的任务。

腾讯AI战略升级:智能体引领大模型时代 腾讯 AI智能体 大模型 具身智能 第1张

2023年,腾讯云发布混元大模型家族时,主要聚焦“行业大模型”。但如今,其叙事已转向多模态和具身智能。

在WAIC上,腾讯首次重点发布具身智能相关进展。旗下的Robotics X实验室与福田实验室联合发布了“具身智能开放平台Tairos”,这是国内首个以模块化方式提供大模型、开发工具和数据服务的具身智能软件平台。

模型与应用的双重推进

在模型方面,腾讯正式发布了混元3D世界模型1.0,并宣布全面开源。

虽然大语言模型的技术路线已逐渐清晰,但多模态的发展阶段仍在早期。多模态是今年的比拼重点,而世界模型是多模态的一个重要分支。

腾讯的混元3D世界模型1.0融合了全景视觉生成与分层3D重建技术,支持文字和图片输入,实现了高质量的3D场景生成。

腾讯AI战略升级:智能体引领大模型时代 腾讯 AI智能体 大模型 具身智能 第2张

过去,3D建模和渲染是个巨大的工程。现在,只需一句文字或一张图片,几分钟内即可生成。

对于未来,腾讯的混元世界模型将提升3D资产生成的质量,并改进场景生成和交互模型。

今年年初的经验表明,在新技术领域抢占技术话语权并做出优秀工作,可以获得巨大的市场回报。因此,各家纷纷加快了开源步伐。

务实落地:智能体的广泛应用

腾讯一贯务实的大模型战略在WAIC上也有所体现。其主题是“让‘好用的AI’成为普惠生产力”。

腾讯已将Agent的能力嵌入到多个To B及To C应用中,覆盖生活、工作、学习、娱乐等场景。

在学习场景方面,QQ浏览器QBot提供AI搜索、AI浏览等功能;ima AI工作台可以辅助完成日常学习和工作任务。旅游规划Agent可以根据用户需求一键生成旅行攻略,并可实现无缝下单。

腾讯AI战略升级:智能体引领大模型时代 腾讯 AI智能体 大模型 具身智能 第3张

在娱乐创作方面,QQ音乐也上线了“AI作歌”及“AI唱”功能。同时推出了配套的智能体“创作工具”,帮助企业客户和创作者搭建属于自己的智能体。

“智能体能够放大大模型价值,是解决业界落地问题的重要形态。”吴运声表示。