当前位置:首页 > 科技资讯 > 正文

AI Agent驱动时代:重塑数据基座迎接挑战

随着AI大模型的飞速发展,以AI Agents为核心的新一代AI原生应用正引领变革,取得了显著成就。这些应用基于大模型,通过各类Agents和应用数据的交互,智能完成任务。然而,AI Agents驱动的应用开发迭代迅速,同时需要处理多种模态的数据,不同模态数据的访问模式和流量差异巨大,这对底层数据平台提出了新的挑战。

在QCon全球软件开发大会(北京站)上,晨章数据创始人兼首席架构师陈亮带来了《面向AI Agents的高性能数据基座:架构和工程实践》的演讲,分享了关于AI时代数据基座架构的思考,并探讨了如何通过该架构解决AI原生应用的数据挑战,以及在云计算、新硬件环境下实现高性能数据基座的工程实践。

以下是演讲的精华内容(经InfoQ编辑整理)。

AI Agent驱动的AI原生应用

今天,AI Agent正在引领软件范式的变革。在AI时代之前,我们讨论的是SaaS,彼时软件作为工具构建了工作流程,帮助人完成任务。而SaaS变成AI驱动后,软件变得更加智能,成为智能体,可执行复杂任务,甚至自我演化和改进。从这个角度看,它不再仅是帮助人的工具,而是直接提供服务。

在SaaS时代,SaaS软件有工作流程,用户输入后,工作流帮助完成任务。中间会收集很多数据,记录在某数据库里,多为结构化数据。数据格式通常由开发人员定义,随着软件规模和用户互动增长。随着软件复杂化,数据格式可能变得复杂,需要更智能的分析。

在Agent时代,工作流不再是工作流,更多关注Agent的编排。核心是大模型驱动不同Agent。在开发应用时就需要有数据,作为Agent的“燃料”。大模型提供通识性内容,但要实现领域特定任务需大量数据且格式、规模不可控。AI与用户交互产生更多数据并生成底层数据。

AI Agent驱动时代:重塑数据基座迎接挑战 Agents 数据基座 多模态数据 原生应用 第1张

例如金融场景中有4个Agent:市场分析、风控等。需要多种数据库:用户信息(关系型)、财报(半结构化)、外部知识库(Mongo)。

AI原生应用面临的数据挑战

从系统角度看,AI时代给数据库管理带来挑战:多模态、数据同步与一致性、性能与规模要求不一、多系统运维管理。早期AI Agent应用就面临传统大厂的数据挑战,且数据飞轮迭代迅速加剧数据库压力。

多模态数据基座

在此背景下,思考统一数据架构。设计目标:支持多种数据模态、原生API兼容、动态伸缩自动管理、跨模态访问与一致性。回顾数据库演化历史:从单机到OLAP/OLTP、云时代的存算分离、Agent时代的共享存储架构。

AI Agent驱动时代:重塑数据基座迎接挑战 Agents 数据基座 多模态数据 原生应用 第2张

设计目标:支持多种数据模态、API原生兼容、性能优化、动态伸缩、跨模态访问与一致性。缓存是核心功能。

面向未来的工程实践

基础设施:云计算、高速网络、存储设备、GPU等。过去十年CPU性能增1.5倍,存储增11倍,网络增20倍。未来存储或成CPU瓶颈。

AI Agent驱动时代:重塑数据基座迎接挑战 Agents 数据基座 多模态数据 原生应用 第3张

解决方案:协程执行、异步编程、单线程核心、缓存友好数据结构等。

总结和展望

AI Agent时代将带来软件范式的变革,数据管理将发生巨大变化。希望有多模态支持、原生API支持、高性能支持及扩缩容方便性。结合工程实践在性能方面有新思考。希望此次分享能带来启发。

陈亮:北京晨章数据科技有限公司创始人兼首席架构师。前微软亚洲研究院研究员。数据库领域顶级专家。