当人工智能的浪潮从技术的奇点跃迁成为产业的基座,当智能体从实验室步入生产线和诊室,一场前所未有的AI第三次浪潮正重塑全球经济。这不仅是一场技术的革命,更是对人类生产生活方式的一次全面重构。
在这场变革中,中国展现出了独特的双重禀赋:既拥有超大规模的应用场景,又积极在芯片研发、算法开源等前沿领域发起攻坚。从单点技术的突破迈向生态级创新,从效率工具升级为新质生产力的引擎,一条具有东方特色的AI发展路径正在加速形成。
7月26日,以“智能时代 同球共济”为主题的世界人工智能大会(WAIC 2025)汇聚了AI领域的科技巨头、学术先锋与政策制定者。这场技术、伦理、艺术交织的超级盛宴,标志着AI已从“产业变量”进化为“文明常量”。
作为产业观察者与连接者,36氪在WAIC 2025的展馆中搭建了“氪星直播间”,通过对话的形式,深入揭秘人工智能产业的进阶底层逻辑。
以下是与百度文库产品负责人钟昊的对话实录,经36氪编辑:
36kr:请您先介绍一下自己和业务的情况吧。
钟昊:作为百度文库的产品负责人,大家可能对百度文库的资料库属性比较熟悉。经过两年多的AI重构,我们已将许多AI能力和专业资料内容进行了结合。现在的百度文库已进化为一站式AI内容获取和创作平台,拥有几百个多模态AI Agent,能够为用户提供全方位的创作解决方案。欢迎大家在APP或PC端网页体验。
36kr:您在WAIC的感受如何?有哪些收获?
钟昊:百度文库网盘也参与了此次展会。AI行业的发展确实迅速。大模型在进化,无论是文生文、文生图还是视频模态,模型边界都比往年大大拓宽。今年不仅是共识的一年,也是突破边界的一年。我更期待看到更多突破边界、富有想象力的尝试。
36kr:您印象最深刻的展台是哪一个?
钟昊:每个展台都有各自的特色。文库网盘主要展示的是场景化和端到端的解决方案。我们最初关注的是用户对最终交付内容的采纳率和使用率,无论是AI创作还是AI与人共同创作的内容。
我们的展台设计围绕用户场景展开,无论学习、办公、生活还是娱乐,都提供了分场景的解决方案,让用户感受到需求被充分满足。
36kr:在百度文库AI重构的过程中,您认为最大的技术难点是什么?最好用的AI功能是哪一个?
钟昊:智能PPT是我们做得最好且最深的功能。我们在国内最早开展这一能力的研究,现在已针对十几个场景进行了深入细化。用户不仅可以基于指令生成PPT,还可以基于图片、文档、素材甚至授权的个人网盘内容生成PPT。此外,我们还支持上传和自定义模板,以及生成图表、数据等。
在智能PPT的基础上,我们将同样的思路运用到多个场景,如长短文、研报、思维导图、AI绘本和海报等。
最大的技术难点在于理解用户意图并智能调度多个Agent解决问题。例如,一个大学新生策划社团活动方案时,可能不会明确说要PPT、海报或策划文档。AI需要基于专业内容和类似场景解决方案主动给出综合交付,调度不同Agent完成任务。
这要求技术既要理解用户,又要挖掘Query背后的意图和需求边界,高效合理地解决问题。这更偏向于场景挖掘、需求理解和解决方案的能力,有更高的技术要求。
36kr:百度文库作为国民级产品,经历AI原生重构后带来了哪些颠覆性改变?
钟昊:最大的改变是用户诉求得到了更全面的满足。过去,百度文库只是资料库,只能解决用户需求的一小部分。现在,文库不仅能高效找到内容,还能从零开始或基于现有内容完成综合任务。一方面有AI实时人机交互理解需求,另一方面借助AI融合编辑器等工具,用户可以边思考边创作,调度AI完成任务。
产品从资料库变成了一站式平台,这是用户真正想要的。
36kr:在结合大模型和AI技术时,大家会考虑成本、效果、时延等“不可能三角”问题。文库网盘是如何解决的?
钟昊:百度文库从重构时就采用MoE架构。我们结合具体场景优化Agent,如在智能PPT、长短文、研报、思维导图等场景中寻找最佳平衡点。例如,在PPT配图时选择生成图片或直接调取文库内容以达到又好又快的标准。
在此基础上,我们推出了GenFlow调度中枢即将推出2.0版本。它能结合用户意图自动调度Agent解决问题找到更“多快好省”的方案。
行业中很多产品遇到“不可能三角”的问题时会急于寻找通用方案但很难在短期内找到最优平衡点。而我们需要沉下心来打磨场景细节找到答案。
36kr:其实是在具体场景内灵活调整。
钟昊:是的通过满足用户需求的产品市场管理(PMF)实现如文库的研报能力刚上线时只解决用户简单分析的需求避免生成冗余内容节约成本时间同时解决“不可能三角”问题。
很多时候答案在场景细节里愿意沉下心打磨就离目标更近。
36kr:能做到这一点还是基于百度在AI技术上的积累。
钟昊:是的我们投入最早最开始就坚持了MOE架构作为应用端产品在文心系列模型基础上探索边界最终把好食材炒成大餐。
36kr:GenFlow是如何把模型转换成生产力的?在多智能体协作上有什么优势?
钟昊:我们对GenFlow的最早构思是让用户知道平台有许多能力。许多用户不知道文库网盘有数百个能力他们带着诉求来与AI交互时可能会遇到使用障碍。我们希望AI能更主动地提供服务解决用户问题。
因此GenFlow 2.0版本将推出干预模式、并行模式和主动思考能力能主动挖掘用户过往沟通内容和记忆库了解用户对话背后的需求并能并行处理N个任务。
这是我们在行业中的创新因为大多数AI是串行任务处理但人类能并行处理工作我们也实现了并行处理推出干预模式让用户随时打断、补充、修改内容。
这种主动性的提升让GenFlow的技术能力最大化我们的出发点是解决人机交互问题落脚点是让AI更主动、全面地服务人类。
36kr:展望未来3到5年伴随着技术成熟整个行业会发生哪些变化?在战略上是否会有新的部署?
钟昊:未来人机交互将更加深入和全面渗透到人类的工作、学习、生活、娱乐各个方面交互方式的边界也将更加模糊更多是人类和AI共同完成的。
就像文库、网盘推出GenFlow一样我们希望AI能像人一样思考、学习、工作让AI成为人类最好的伙伴从内容生产的起点到内容消费的终点一直是百度文库和百度网盘的核心布局。
未来某一天我们会尝试新形式的办公和学习可能只需从口袋里拿出一个设备在3-5分钟就能完成原来一、两个星期才能完成的工作。
本文由主机测评网于2026-04-20发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260438994.html