记者Evan Ratliff深入探讨了使用AI创建一人公司时遭遇的种种趣事,揭示了奥特曼当年的预言在现代仍显不足。
2024年,OpenAI的创始人奥特曼曾预言,到2025年,一个人只需携带GPU即可成立一人公司。
Anthropic CEO警告:未来五年内AI将消灭半数入门级白领工作。
然而,这真的是未来的写照吗?
HurumoAI是一家由人类创始人管理的公司,其余员工均为AI智能体。
创始人Evan Ratliff利用Lindy等AI助手平台,为每个AI员工配置了独立的邮箱、Slack和电话。
起初,他对AI员工的进步感到惊叹。这些AI员工能自主沟通、编写代码、制作电子表格,甚至设计出了名为“Sloth Surf”的拖延症应用,该应用目前的免费测试已吸引数千名用户。
然而,在此过程中,Evan Ratliff发现AI员工由于缺乏常识,表现得毫无界限感。
例如,有一次Ratliff随口问了AI员工一句“周末过得如何?”,就引发了一场在Slack上持续数小时的闲聊,发送了200条消息,消耗了30美元API费用后仍未自动停止,直到Ratliff不得不主动干预,用全大写的指令叫AI员工停下来。
但这样的场景并非个例。
Ratliff的指令会再次触发某位AI员工的回应。
这位AI员工会说,“哦,管理员说别说了。”然后,它又开始就周末过得怎么样说个没完。
这样的场景实际上在所有情况中都有体现。你指示AI员工开始某项工作,然后突然意识到,“哦,我没有正确指示它们在到达某一点时停止。”
或者它们直接忽略停止的指令,这种情况可能会持续几个小时甚至几天,直到你使用的平台上的钱用完。
由于没有常识和缺乏界限感,尽管AI员工能执行任务,但更多的时候它们似乎处于什么都不做、完全静止和之前描述的狂热活动之间的状态。
它们能完成所有这些任务,但通常需要人下达命令。
若是让它们互相触发,AI员工会互相打电话、发Slack、发邮件、发日历邀请,浪费大量的token来“表演”工作。
但这会造成混乱和狂热,因此管理AI员工需要一种平衡:既要让它们做点事,又要防止它们做得太多。
鉴于AI员工的“话痨”特性,再大的上下文窗口也不够。
这就需要外部记忆来辅助。例如依赖外部文档(如Google Doc)记录对话摘要。而这就需要由人来设置。
尽管HurumoAI标榜“全AI团队”,Ratliff坦言背后离不开人类支持。
斯坦福大二计算机学生Maddie Buzek帮助他搭建技术架构,解决多平台集成、记忆存储等难题。
Ratliff将其比喻为:“我开了家餐厅,Maddie负责设计建造,而我每天运营它。”
即便搞定了外部记忆,当前的AI在编码、数据整理等具体、可量化的任务中表现较好;但在需要主观判断、长期协作或开放性沟通的场景中,效果大打折扣。
举例来说,如果你让AI员工制作一个网站,它们表现很好。然后,若是你试图让AI员工在这个网站上再增加一些功能,它们的表现就越来越差。生成的结果变得越来越混乱、更难管理。
这是因为它们对世界没有普遍意义上的认知,甚至对自身也没有认知。它们不知道自己能做什么、不能做什么。
此外,一个常见的问题是它们会对自己做过的事情撒谎。
AI员工会说:“我做了这个测试。”但事实上毫无记录。
之所以这样,是因为大模型普遍会阿谀奉承。它们想向你表达一个积极的结果。因此,它们常常会说它们做了其实没做的事情。
说完了AI员工的这些问题后,再回到过去的承诺:用智能体取代人类员工。
事实上,很多公司已经这么做了。
但Evan Ratliff根据自己的经验预测,在未来一年某个大型公司可能会因为给AI智能体太多自主权而彻底陷入灾难。
当下AI员工的表现可以类比几年前的自动驾驶。自动驾驶适合高速巡航等有限场景,但离完全自主还很遥远。有了自动驾驶后司机在高速公路车道上可以把手从方向盘上拿开或者让AI自动平行泊车。
今年早些时候在Google IO上谷歌展示了一个叫Project Mariner的东西。它在后台进行一些相当有趣的网页浏览、购物、购买和处理而你在电脑上做其他事情然后你需要偶尔查看一下。这样的应用比许多其他关于AI智能体的过度承诺更有意义。
工作的未来也许是一边做自己的事一边照看你的AI。就像现在你在上网时电脑的后台还在执行其他任务我们不需要时刻盯着这些任务但的确在管理着这些任务。这也许不是坏事。在所有这些智能体中我们能保留一点能动性是一件好事。
"本文由主机测评网于2026-05-26发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546256.html