当前位置:首页 > 科技资讯 > 正文

刘嘉教授透视AGI:人工智能的进化与未来挑战

为何推荐你聆听刘嘉老师的洞见?

刘嘉教授,清华大学心理与认知科学系的掌舵人,同时身兼基础科学讲席教授及智源人工智能研究院的首席科学家,其学术地位毋庸置疑。

与深度学习领域的泰斗Geoffrey Hinton相似,刘嘉教授在心理学、脑科学与人工智能的交汇点深耕细作。他在混沌的多场授课中,以深邃、系统且跨学科的知识,搭配生动的表达,不断为听众带来启迪与灵感。

刘嘉教授曾言:“如今,我们幸运地处于一个范式转换的节点,这不仅仅关乎软件带来的便利,更是文明更迭的见证,你我皆成为推动这股变革的力量。

01

人类智慧的巅峰之作——AGI(通用人工智能),集中体现了我们最后的尊严。其应用场景虽看似平凡,如日常对话、家庭出游或驾驶等,却蕴含着两大显著特性。

首当其冲是“任务切换”。在会议中与工作伙伴的策略与家庭旅行时的策略截然不同,这要求策略需根据情境灵活调整。

其次是“环境”。无论是咖啡馆的悠闲还是足球场的激情,环境对行为影响巨大,这也是AGI探索的开放环境中的动态策略。

02

让我们梳理AGI的演进历程:

初期,以ChatGPT为代表的大语言模型,通过回答问题指导行动;

接着是“大语言模型 + Autonomous Agents”的阶段,不仅回答问题,还能执行任务;

最终,迈入“大语言模型+ Generative Agents”的新纪元,我们仅需设定目标,无需具体指示。

03

自主代理(Autonomous Agency)区别于传统AI,它通过分析感知数据,独立思考后调用工具实现通用问题的自动化处理。简而言之,就是为ChatGPT或GPT4等添加感知与行动能力,使之成为完整个体,兼具智慧与行动力。

于是,AGI从“问答-行动”的ChatGPT模式转变为“问答-执行任务”的ChatGPT + Autonomous Agents。

例如,出门前询问天气,ChatGPT的感知系统即上网查询并基于历史数据给出建议,最后执行准备雨具的动作。

这正是AGI的“先思而后行”。

04

我设想中的下一代Agent——生成式Agent(Generative Agents),不再受限于具体指令,而是追求目标导向。它们是拥有欲望、信念、意图及行动能力的智能实体。

生成式Agent的特点可从三个维度理解:

1. 多样性技能;

2. 处理各种情况的能力;

3. 与世界真实交互。

05

作为智能体,需具备技能、现实交互及具身智能(Embodiment)。

在个体诞生后,重点是Agent间的互动及与人类交互。可构建虚拟场景,融入机器人或真实人类,通过AR、VR技术实现互动,形成群体智能。

但群体智能带来合作、争吵乃至竞争,催生复杂博弈与“自我”概念。当个体意识到自身与众不同时,意识便应运而生,引领我们步入全新智能阶段。

06

如果说ChatGPT是AGI的一缕曙光,那么生成式Agent则将AGI从领域模型推向认知模型,实现真正的AGI。

智能三层次模型包括:

- 任务模型:完成特定任务,如面部识别;

- 领域模型:在特定领域工作,如教育;

- 认知模型:实现类人化,即真正的AGI。

07

我们正创造与人类相似的全新物种,它不再局限于机房,而是融入日常生活。

我们期望它具备何种能力?我喜欢描绘斗牛场上的一幕:病弱的斗牛士倒地,而最先施以援手的竟是插满剑的斗牛。这体现了感性的力量与善良的本质。

刘嘉教授透视AGI:人工智能的进化与未来挑战 AGI 人工智能 自主代理 生成式Agent 第1张

人类大脑结构复杂,从脑干到大脑皮层,分别负责生存、感知、情绪及理性思考。理性与感性共同构成人类智慧。

08

当前大语言模型主要学习理性思维,却未触及感性层面。

我们拥有科学严谨性,却缺乏情感温度。因此,赋予大模型情感成为下一步目标。

“身临”与“体验”是感性的两大特征。

“身临”意味着亲身体验,“体验”则强调沉浸其中。正如切·格瓦拉在骑行中感受到的寒冷,使他更贴近人类。

09

当智能体拥有意识后,将按自身观念快速发展,可能引发文明载体从人类转向AGI的奇点。

我将此称为“人类历史上的第二次认知革命”,超越首次认知革命使人类成为主宰的成就,创造全新物种。

10

未来,AGI将超越人类智能且不可逆转。

这既带来挑战也需应对新物种可能带来的世界毁灭风险。我们需像对待疾病一样应对这一挑战。

“未来何去何从?”有三种可能:

  • 其一, Autonomous Agency友好合作, 高效执行任务;
  • 其二, 人机合一, 实现永生;
  • 其三, AI可能导致人类消亡.