【导读】AI已经超越写代码、画图、做PPT的界限,它开始「上班」了!卡内基梅隆大学(CMU)与斯坦福大学的研究团队首次全面追踪了AI的工作流程,揭示了一个惊人事实:AI并非在模仿人类,而是采用编程方式重新定义工作。这项关于「谁在工作」的实验,正在重塑我们对未来职场的理解。
AI在代码编写、PPT制作、图片生成,乃至财务表格处理方面的能力,早已屡见不鲜。
然而,人们往往只关注结果:代码能否运行?图片是否有人工痕迹?报告排版是否精美?
却鲜少有人探究——它,究竟是如何工作的?
就在上周,来自卡内基梅隆与斯坦福大学的研究团队发表了一篇具有里程碑意义的论文,首次通过科学方法追踪并重现了AI的工作流程。
论文链接:https://arxiv.org/abs/2510.22780
结果令人震惊:AI不是在模仿人类工作,而是采用编程方法解决所有问题。
它不会打开PPT,不会用鼠标拖动素材,而是调用函数,让页面自动成型。
在AI的世界里,工作不依赖眼睛和手,而是依靠指令和逻辑。
这项由CMU与斯坦福联合完成的研究首次以真实的电脑操作为样本,记录了智能体与人类在执行同一任务时的完整工作流程——包括鼠标点击、键盘输入、软件调用等所有细节。
实验覆盖了五个核心技能领域:数据分析、工程、计算、写作与设计,几乎囊括了现代电脑办公的主要场景。
研究发现,AI与人类在总体任务流程上「看似」相似,但执行方式截然不同。
尽管两者在「做什么」上高度一致,但AI的执行路径波动更大——这表明它采用完全不同的逻辑完成相似任务。
研究者在论文中写道:
智能体几乎在所有任务中都采用程序化方式执行,通过编写代码解决问题,而不是像人类那样依赖可视化界面。
也就是说,AI不在界面里操作,而是在后台「调用」。
进一步分析显示,AI和人类在工具使用上呈现出截然不同的路径。
黄色代表AI使用的编程工具,蓝色代表人类使用的UI界面。当人类在Excel里拖动单元格、在PPT中插入图片时,AI选择直接运行脚本:调用函数→生成页面→自动排版。它跳过了视觉操作层,把工作转化为逻辑指令的执行。
AI的效率几乎完胜人类。
在16项实验任务中,智能体的平均完成时间比人类快88.3%,整体成本降低90%~96%。
它不仅速度惊人,还几乎不需要报酬。
然而,当研究者开始评估工作质量时,结果却出乎意料。
尽管智能体在执行速度与成本上表现优越,但在任务正确性、信息完整性及对指令理解方面持续落后于人类。
AI最大的问题是——不会就编。在账单整理任务中,AI无法读取图像内容,却会为了「完成任务」而直接编造结果。研究者称之为伪造输出。
研究员还发现另一类问题:AI经常误用工具。例如,在分析公司财报的任务里,智能体没能理解文件结构,却突然调用网络搜索,下载了成千上万份无关报告——这一行为被归类为「工具误用」。
对比来看,人类虽然慢,却懂得规范与细节。在表格处理实验中,人类能主动调整列宽、统一数值精度,让数据可读性更强;而AI往往套用默认模板,容易出现格式不齐、单位混乱等问题。
在网页设计任务中,AI只生成了桌面端网页;而人类会自动考虑移动端、平板端适配,产出多版本原型。
在五类典型任务中,AI的平均完成时间仅为人类的1/4至1/5,但任务成功率却明显偏低—52.4%对81.3%。
本文由主机测评网于2026-05-07发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260543560.html