当前位置:首页 > 科技资讯 > 正文

人类与AI的编程竞赛:胜利与挑战并存

人类暂时在编程竞赛中取得了胜利!在东京举行的AtCoder 2025世界巡回赛中,人类选手Psyho以显著优势击败了OpenAI提交的自动化程序OpenAIAHC,登上榜首。

人类与AI的编程竞赛:胜利与挑战并存 AtCoder OpenAIAHC Vibe Coding 编程工具 第1张

AtCoder World Tour Finals是AtCoder主办的一年一度赛事,旨在决出竞技编程的世界冠军。最终胜者是来自波兰的Psyho,OpenAIAHC紧随其后,位列第二。

这一消息甚至引起了OpenAI CEO奥特曼的亲自转发,并配文「干得好,Psyho!」

虽然这场胜利值得欢呼,但它始终是暂时的。OpenAIAHC紧随其后,AI在编程竞赛中的实力日益增强,从零调试的程序已逼近人类顶尖选手。

正如当年AlphaGo与李世石的「大战」,AI在编程上的优势正逐渐显现,逐步占据主导地位。

如今的开发者,正被Claude Code、Gemini CLI、Cursor等工具包围,从「用不用」的问题转变为「怎么用」的探讨。

最近Kimi K2的发布,让Claude Code再次火热。人们首先关注的是K2的速度和模型大小,以及其API接入Claude Code的功能。

启动Claude Code,输入一段提示词,回车后,一段结构清晰的函数便自动生成。Gemini CLI和Cursor同样如此。

编程从与bug对抗的痛苦过程,转变为与AI一起搭积木的创意游戏。甚至有了个好听的名字——Vibe Coding(氛围编程,通过提示词与AI协作编程)。

人类与AI的编程竞赛:胜利与挑战并存 AtCoder OpenAIAHC Vibe Coding 编程工具 第2张

然而,Vibe Coding究竟是否可行?是如编程大赛中勇夺第二的智能,还是在日常编程中一次次的「被恶心」。不久前的一项新研究给AI编程泼了一盆冷水。

反直觉的研究:AI编程可能更低效

美国AI安全机构METR最近公布了一项针对Claude 3.5/3.7的实测研究。他们找来16名经验丰富的开源开发者,在熟悉的项目中使用Claude Code辅助编程。

人类与AI的编程竞赛:胜利与挑战并存 AtCoder OpenAIAHC Vibe Coding 编程工具 第3张

结果显示,开发者使用AI后,完成任务的时间平均增加了19%。然而有趣的是,尽管结果变慢,但参与者自我感觉却变快了!他们觉得AI帮了大忙,写作更顺畅,效率提升了20%。

「AI幻觉」似乎转移到了人类身上,变成一种「效率幻觉」,你以为你变快了,其实只是感觉变快了。

为什么会这样?研究总结了几个原因:

  • 写提示词很花时间,且经常要修改;
  • Claude给出的代码大多不能直接使用,需要手动改逻辑、查bug;
  • 在「提示 - 等待 - 修改」的循环中,陷入一种「被打断的状态」。

我们不禁好奇,自己使用这些工具会不会也遇到同样的问题?于是我们做了一个小实验。

Vibe Coding真的能让你飞起来吗?

我们设计了一个看似简单但逻辑不简单的任务:编写一个命令行工具,输入关键词后返回知乎热榜中含该关键词的帖子标题,并限制输出条数。

这个任务涉及网络请求、HTML解析、字符串匹配、命令行参数解析,正好可以测试Claude Code和Gemini CLI的能力。

人类与AI的编程竞赛:胜利与挑战并存 AtCoder OpenAIAHC Vibe Coding 编程工具 第4张

人类与AI的编程竞赛:胜利与挑战并存 AtCoder OpenAIAHC Vibe Coding 编程工具 第5张

人类与AI的编程竞赛:胜利与挑战并存 AtCoder OpenAIAHC Vibe Coding 编程工具 第6张

人类与AI的编程竞赛:胜利与挑战并存 AtCoder OpenAIAHC Vibe Coding 编程工具 第7张

动作非常快,可能因为任务简单,代码生成过程不需要太久。它首先自动生成了需要安装的库,用于爬取网页,接着生成了main.py这一核心代码文件。

人类与AI的编程竞赛:胜利与挑战并存 AtCoder OpenAIAHC Vibe Coding 编程工具 第8张

人类与AI的编程竞赛:胜利与挑战并存 AtCoder OpenAIAHC Vibe Coding 编程工具 第9张

中间遇到的问题是知乎需要登录。它自动使用Google搜索了一个公开的API及尝试其他工具,但都没成功。最后告诉我需要手动输入Cookie。

人类与AI的编程竞赛:胜利与挑战并存 AtCoder OpenAIAHC Vibe Coding 编程工具 第10张

虽然短时间内没有帮我完成此任务,但体验过程确实舒适。像是在指挥实习生工作:实习生做不好不能骂,但在Vibe Coding里可以直接骂Gemini CLI。

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 后续内容略。在实际输出时保留原格式不变。