智东西9月11日报道,今日上午,在2025 Inclusion·外滩大会开幕式上,2024年图灵奖得主、“强化学习之父”理查德·萨顿(Richard Sutton)发表主旨演讲。他认为,随着数据量逐渐饱和,人工智能(AI)正逐步迈向以持续学习为核心的“经验时代”,其潜力远超过往。
智能的本质源自经验,从经验中学习。智能体的智能程度,取决于其能预测并控制自身输入信号的能力。而经验,正是所有智能的核心与基础。
强化学习引领我们步入了新的经验时代,但要实现其全部潜力,尚需两项尚未成熟的技术——持续学习(continual learning)和元学习(meta-learning)。
面对外界对AI可能带来的偏见、失业乃至人类灭绝的担忧,萨顿认为,这种对AI的恐惧被过分夸大,且背后有某些从中获利的组织和个人在推动。
“人类最卓越的超能力,就在于比其他任何动物都更擅长协作。”在萨顿看来,AI与人类的繁荣将源于去中心化的协作。不同目标的智能体,可通过去中心化的协作实现双赢。
他预测人类智力水平很快将被超级人工智能或增强的人类所超越,权力和资源将流向最聪明的智能体。
在发展过程中,AI的替代对人类社会不可避免。
萨顿认为,人类的独特之处在于“把设计推向极致”,创造出能自我设计的事物,这恰是今天通过AI所追求的目标。
人类至少是催化剂、助产士,更是开启宇宙第四大时代——“设计时代”的先驱。
“AI是宇宙演化的必然下一步,我们应以勇气、自豪和冒险精神来迎接它。”萨顿说。
以下是理查德·萨顿演讲全文:
很高兴在2025年外滩大会上发言,主题是人工智能。
接下来我将围绕这一主题谈三个方面:科学发展趋势、政治影响及哲学意义。
我们正处“人类数据时代”。AI被训练以预测人类语言和标签,由人类专家不断微调。
当前大多数机器学习的目的,是把人类已有知识转移到一个静态、无自主学习能力的AI上。
然而,我们逐渐接近人类数据的极限,意识到这种方法通常无法生成新知识,不适合持续学习。而持续学习对智能至关重要。
播客主持人Dwarkesh Patel意识到了这一点。他在播客中说:“但根本问题在于,大语言模型并不会随时间推移变得更聪明。这种缺乏持续学习能力的情况是一个巨大的瓶颈。”
关于“智能”的根本科学争议在于,它是大量知识的积累还是快速学习的能力。
智能一词可按个人意愿使用,但其传统定义与学习能力有关。
我们正进入“经验时代”,需要新数据源,随着智能体变强而增长和完善,就像电脑游戏中的自我博弈一样。 这类数据也可由智能体以第一人称与世界互动直接生成,我称之为“经验”。这是人类和其他动物的学习方式,也是AlphaGo创造“37步”的方式。 观察婴儿与各种玩具玩耍的视频,我们能看到他获取的数据取决于自己的举动。孩子玩一段时间后转向下一件玩具,因此获得的数据由行为决定。关键在于与智能体的智力水平和认知发展相匹配的数据。 经验是智能体与世界交换信号。这些信号构成了它的“经验”。我定义的“经验”包括三项要素:观察、行动和奖励。这三种信号在智能体与世界间传递。 知识源自经验,因此可以从经验中学习. 一个智能体的智能程度取决于其能预测并控制自身输入信号的能力。 现在我想谈谈AI的政治影响。 AI已成为高度政治化议题。除地缘政治外,公众担心AI会带来偏见、失业甚至导致人类灭绝。 一些国家正在立法限制AI模型能力,有人呼吁暂停AI研究 我的观点是这种恐惧被夸大且被某些组织和个人煽动 “去中心化协作”是“共同目标”的替代方案 “AI是人类最古老的追求之一” “理解智能是科学与人文学科共同追寻的圣杯” “权力和资源将流向最聪明的智能体”
02.
AI政治化加剧,恐惧被夸大
03.
“四条原则”预测AI未来
“四条原则”来预测AI未来:
“在人类的发展进程中,AI的替代不可避免”
“把设计推向极致”是目标
“开启宇宙第四大时代——设计时代”
“我们应以勇气、自豪和冒险精神来迎接AI”
本文由主机测评网于2026-04-28发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260441172.html