当前位置：首页 > 科技资讯 > 正文

强化学习教父重启AI：经验觉醒或成新纪元

主机测评网
科技资讯
2026-05-10
970

【导读】在AI模仿人类的浪潮中，强化学习之父Richard Sutton却宣告：“GenAI的时代正在落幕。”他带着图灵奖的荣耀，投身一家鲜为人知的公司——ExperienceFlow.AI，誓要引领AI从‘经验’中觉醒，而非依赖人类数据。

11月初，ExperienceFlow.AI的CEO Giri ATG在X平台上发布了一条消息。

强化学习教父重启AI：经验觉醒或成新纪元强化学习 ExperienceFlow.AI Richard Sutton 去中心化智能第1张

没有华丽海报，没有宣传视频，

但这条低调的公告，却在短短数小时内，被AI研究员与投资人疯狂转发。

在众多模型演示与发布会中，它如同一根微妙的地震针，预示着更深层次的震动。

因为加入这家初创公司的，不是普通科学家，而是强化学习的开创者，《Reinforcement Learning: An Introduction》的作者，刚刚荣获2024年图灵奖的Richard Sutton。

强化学习教父重启AI：经验觉醒或成新纪元强化学习 ExperienceFlow.AI Richard Sutton 去中心化智能第2张

是他首次让AI“从经验中学习”；如今，他归来，誓要重新定义‘智能’。

强化学习教父归来：向生成式AI发起挑战

过去两年，人工智能界热闹非凡。新模型层出不穷，推理速度、参数量、生成能力不断刷新。

而强化学习的奠基人Richard Sutton，选择了沉默。

直到今年十一月，他重新现身。

ExperienceFlow.AI宣布，Sutton将以首席科学官的身份加入，并创建‘超级智能研究实验室’。这仿佛是新时代的信号，告诉AI界，智能的核心，不在于模仿，而在于学习。

Sutton的成就非凡。他与Andrew Barto共同荣获2024年图灵奖，以表彰他们在强化学习领域的卓越贡献。

强化学习教父重启AI：经验觉醒或成新纪元强化学习 ExperienceFlow.AI Richard Sutton 去中心化智能第3张

他编写的《Reinforcement Learning: An Introduction》被誉为AI研究的圣经。

在ExperienceFlow.AI的新闻稿中，Sutton表示：

学习是知识的导数。与生成式AI依赖人类数据不同，我们关注学习本身——从经验中创造未知的知识。

这句话明确划分了两种路径。

生成式AI从人类文本中提取模式；而强化学习则希望AI在环境中行动、感知、反馈，从经验中总结规律。

Sutton在声明中写道：

我们正迈向基于人类数据的生成式AI时代的尾声，即将进入从经验中学习的新阶段。

他预测，当AI被人类数据喂养到极限后，模型只能进行重复、推测、模仿。

而真正的智能，必须通过与世界的互动才能获得。

这正是强化学习的核心理念：智能体（agent）在环境（environment）中采取行动（action），获得奖励（reward），并据此调整策略（policy）。

学习源自行动，而非输入。

强化学习教父重启AI：经验觉醒或成新纪元强化学习 ExperienceFlow.AI Richard Sutton 去中心化智能第4张

Sutton的回归，并非对现有技术的否定，而是对AI学习方式的重新定义。

他认为，下一阶段的智能体将不再依赖人类经验，而是从自身经历中形成知识。

对整个行业而言，这不仅是一次技术转向，也是一场价值判断的转变——AI，不应只是复述，而应开始理解。

ExperienceFlow：用‘经验’重塑智能的起点

ExperienceFlow.AI是一家新兴的人工智能公司，总部位于旧金山。

其定位明确：打造‘经验驱动的去中心化超级智能’。

强化学习教父重启AI：经验觉醒或成新纪元强化学习 ExperienceFlow.AI Richard Sutton 去中心化智能第5张

联合创始人兼CEO Giri ATG坦言：

我们正开启一种全新的超级智能范式，它将解决通往通用人工智能（AGI）的最后难题。

我们的重点是真正的强化学习研究，它将推动持续学习、泛化能力以及基于模型的层级规划。

与当前依赖大规模语言模型的路线不同，ExperienceFlow认为智能的核心不在于参数量，而在于‘如何通过经验产生知识’。

强化学习教父重启AI：经验觉醒或成新纪元强化学习 ExperienceFlow.AI Richard Sutton 去中心化智能第6张

他们提出的‘经验驱动超级智能’，希望让AI在开放环境中持续探索、修正和积累，从而获得可迁移的认知结构。

Sutton用了一个浪漫的比喻：

学习的火花，是理解新领域并创造知识的能力。

这句话延续了他几十年的理论主张。

ExperienceFlow的目标是，将强化学习从学术概念推向实际应用。

它不只是训练一个模型，而是要构建一种能自我生长的智能体架构——让模型能从外部环境中吸取反馈，自我校正并形成长期记忆。

Giri ATG表示，这种‘经验型智能’并非仅停留于研究层面，而是面向具体产业：

真正的超级智能将解锁与科学突破和经济增长直接相关的应用场景，推动制造、医疗、金融、零售、物流、机器人等关键行业的发展。

免费服务器服务器教程免费vps

本文由主机测评网于2026-05-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260544093.html

强化学习教父重启AI：经验觉醒或成新纪元

强化学习教父归来：向生成式AI发起挑战

ExperienceFlow：用‘经验’重塑智能的起点

马斯克万亿薪酬计划背后的科技狂想

科技圈中年危机：医美热潮背后的年龄焦虑

强化学习教父重启AI：经验觉醒或成新纪元

强化学习教父归来：向生成式AI发起挑战

ExperienceFlow：用‘经验’重塑智能的起点

马斯克万亿薪酬计划背后的科技狂想

科技圈中年危机：医美热潮背后的年龄焦虑

相关文章