【导读】在AI模仿人类的浪潮中,强化学习之父Richard Sutton却宣告:“GenAI的时代正在落幕。”他带着图灵奖的荣耀,投身一家鲜为人知的公司——ExperienceFlow.AI,誓要引领AI从‘经验’中觉醒,而非依赖人类数据。
11月初,ExperienceFlow.AI的CEO Giri ATG在X平台上发布了一条消息。
没有华丽海报,没有宣传视频,
但这条低调的公告,却在短短数小时内,被AI研究员与投资人疯狂转发。
在众多模型演示与发布会中,它如同一根微妙的地震针,预示着更深层次的震动。
因为加入这家初创公司的,不是普通科学家,而是强化学习的开创者,《Reinforcement Learning: An Introduction》的作者,刚刚荣获2024年图灵奖的Richard Sutton。
是他首次让AI“从经验中学习”;如今,他归来,誓要重新定义‘智能’。
过去两年,人工智能界热闹非凡。新模型层出不穷,推理速度、参数量、生成能力不断刷新。
而强化学习的奠基人Richard Sutton,选择了沉默。
直到今年十一月,他重新现身。
ExperienceFlow.AI宣布,Sutton将以首席科学官的身份加入,并创建‘超级智能研究实验室’。这仿佛是新时代的信号,告诉AI界,智能的核心,不在于模仿,而在于学习。
Sutton的成就非凡。他与Andrew Barto共同荣获2024年图灵奖,以表彰他们在强化学习领域的卓越贡献。
他编写的《Reinforcement Learning: An Introduction》被誉为AI研究的圣经。
在ExperienceFlow.AI的新闻稿中,Sutton表示:
学习是知识的导数。与生成式AI依赖人类数据不同,我们关注学习本身——从经验中创造未知的知识。
这句话明确划分了两种路径。
生成式AI从人类文本中提取模式;而强化学习则希望AI在环境中行动、感知、反馈,从经验中总结规律。
Sutton在声明中写道:
我们正迈向基于人类数据的生成式AI时代的尾声,即将进入从经验中学习的新阶段。
他预测,当AI被人类数据喂养到极限后,模型只能进行重复、推测、模仿。
而真正的智能,必须通过与世界的互动才能获得。
这正是强化学习的核心理念:智能体(agent)在环境(environment)中采取行动(action),获得奖励(reward),并据此调整策略(policy)。
学习源自行动,而非输入。
Sutton的回归,并非对现有技术的否定,而是对AI学习方式的重新定义。
他认为,下一阶段的智能体将不再依赖人类经验,而是从自身经历中形成知识。
对整个行业而言,这不仅是一次技术转向,也是一场价值判断的转变——AI,不应只是复述,而应开始理解。
ExperienceFlow.AI是一家新兴的人工智能公司,总部位于旧金山。
其定位明确:打造‘经验驱动的去中心化超级智能’。
联合创始人兼CEO Giri ATG坦言:
我们正开启一种全新的超级智能范式,它将解决通往通用人工智能(AGI)的最后难题。
我们的重点是真正的强化学习研究,它将推动持续学习、泛化能力以及基于模型的层级规划。
与当前依赖大规模语言模型的路线不同,ExperienceFlow认为智能的核心不在于参数量,而在于‘如何通过经验产生知识’。
他们提出的‘经验驱动超级智能’,希望让AI在开放环境中持续探索、修正和积累,从而获得可迁移的认知结构。
Sutton用了一个浪漫的比喻:
学习的火花,是理解新领域并创造知识的能力。
这句话延续了他几十年的理论主张。
ExperienceFlow的目标是,将强化学习从学术概念推向实际应用。
它不只是训练一个模型,而是要构建一种能自我生长的智能体架构——让模型能从外部环境中吸取反馈,自我校正并形成长期记忆。
Giri ATG表示,这种‘经验型智能’并非仅停留于研究层面,而是面向具体产业:
真正的超级智能将解锁与科学突破和经济增长直接相关的应用场景,推动制造、医疗、金融、零售、物流、机器人等关键行业的发展。
本文由主机测评网于2026-05-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260544093.html