当前位置:首页 > 科技资讯 > 正文

巨头豪掷10亿,AI加速“人类级”进化

Anthropic、OpenAI等科技巨头,正计划每年投入高达10亿美元,旨在教会AI像人类一样工作。他们不仅为AI提供强化学习环境(RL environment,简称gym),还让其“偷师”各领域专家。据OpenAI高管预测,未来‘整个经济体系’,将在某种程度上被重塑为一台‘RL机器’。

AI真的在接管白领工作吗?

今年5月,Anthropic CEO Dario Amodei曾公开表示:AI有可能在未来1至5年内消灭一半的入门级白领职位,并使美国失业率上涨至10至20%。

这场前所未有的岗位大替代,引发了广泛担忧。

有网友认为,白领职业,在未来3年内可能会大规模消失。

巨头豪掷10亿,AI加速“人类级”进化 AI进化 强化学习 RL环境 人类专家 第1张

还有网友认为,受到AI冲击的,不仅是底层或入门级岗位,管理职位同样难以幸免。

巨头豪掷10亿,AI加速“人类级”进化 AI进化 强化学习 RL环境 人类专家 第2张

Anthropic、OpenAI,以及全球顶尖AI实验室正在加速这场‘AI风暴’的到来。

他们把大型模型引入办公室,让其学习各种应用,例如Salesforce的客户关系管理软件、Zendesk的客户支持软件、Cerner的健康记录应用等。

目标是教会AI处理白领工作中一些繁琐、复杂的任务。

他们为这场AI训练,准备了数十亿美元级别的投入。

十年十亿投资,打造“人类级”AI

据透露,Anthropic、OpenAI等大厂,已经为AI准备了每年10亿美元的‘专项资金’,用于教会AI像人类一样工作:

Anthropic领导层计划在未来一年,为克隆版企业应用投入10亿美元,它们被称为强化学习环境(RL环境)。

OpenAI也计划今年在数据相关方面投入10亿美元,包括向人类专家支付的报酬以及RL环境费用,并预测到2030年这一数字将增至80亿美元。

这些AI‘教育费用’,还在不断上升。

如果这些方法成功,不久将有望帮助OpenAI、Anthropic突破近期在采用传统训练技术时遇到的一些瓶颈。

而且,还可以为它们开辟新的变现路径,比如销售职场软件,接管人类电脑并代其操作应用的AI智能体(agent),利用AI开发热门企业应用的新版本等。

Anthropic CEO Dario Amodei曾将这类产品称为‘虚拟协作伙伴’,称它们可以与人类并肩工作,并使用与人类相同的应用。

但要实现起来,仍然是困难重重。

Turing的前沿数据项目负责人Anshul Bhagi指出了其中的诸多繁杂细节。

例如,要教会AI处理客户关系管理,不仅要教会它在Salesforce上搜索潜在客户,找出最有潜力的线索/客户并发送跟进邮件预约初次会面,还要教会它如何使用LinkedIn、Calendly、Gmail等应用。

巨头豪掷10亿,AI加速“人类级”进化 AI进化 强化学习 RL环境 人类专家 第3张

为了验证任务完成情况,Turing还会把整体任务拆分为更小的步骤,并创建一套评估标准(rubric),来检查AI模型是否正确地执行了每一步。

“RL环境”,构建让AI学习的“真实世界”

据Turing CEO Jonathan Siddharth称,他们已经构建了超过1,000个RL环境,包括Airbnb、Zendesk和Microsoft Excel的复制版。

Turing计划将这些RL环境出售给客户,并配套提供100至500个示例任务,供AI模型在模拟应用中尝试,以及用于验证模型是否正确完成任务的方法。

AI训练,正在“偷师”各领域专家

随着AI模型能力的提升,数据标注公司雇佣的人群,已经从攻读硕士和博士的学生,转向在细分领域拥有多年经验的在职专业人士。

看看近期Turing的一份雇佣专家清单:

一名NASA的数据科学家

一名为能源部项目工作的化学家

一名放射科住院医师

一名在私募股权工作的副总裁

他们的职责是使用特定应用完成真实世界任务,以供AI观摩学习。

当AI学习到了各领域的专业知识以及如何使用职场应用,下一步可能就是逐步接管各行各业的人类工作岗位。

你做好准备了吗?