2025年6月,Shopify CEO Tobi Lütke 和 AI 专家 Andrej Karpathy 在 X 上提出了一个新概念——上下文工程。Karpathy 将其定义为“一门微妙的艺术与科学,旨在填入恰到好处的信息,为下一步推理做准备。”
然而,这个新概念与提示词工程有何不同?为何它与 RAG、MCP 等技术相关?大多数过往的回答从技术角度探讨,试图拆解上下文的构成及其最佳效果。10月30日,上海交通大学和 GAIR 实验室发表了论文《上下文工程 2.0:上下文工程的上下文》,从更全面的视角定义了这个新兴学科。它不再把人机交互视为技巧,而是回归交流动力学的基础逻辑。
本文将以这篇论文为基础,系统性地回答三个核心问题:上下文工程到底是什么?它的基础构件是什么?未来会如何发展?
要理解上下文工程,必须回答:为什么人与机器的交流如此困难?
论文认为,这是因为人类与机器之间存在认知鸿沟。
人类的交流是高熵的,表达无序、混乱且充满隐含信息。而机器是低熵生物,只能理解明确的指令。为了弥合这道鸿沟,人类必须将高熵意图转化为机器可理解的低熵指令。这就是上下文工程的本质,通过更好的上下文,达成系统性的熵减过程。
在这个系统中,最重要的是实体,即人、应用、环境。上下文,就是描述实体状态的所有信息。
上下文工程则是设计和优化上下文的收集、管理、使用,以提升机器理解和任务表现。
从这个意义上讲,上下文工程并非新概念。在AI之前,它已经发展了20多年,现在,我们已进入上下文工程 2.0 时代。
从计算机出现后,我们就开始探索人机理解的逻辑。操作系统的UI是最古老、最成功的上下文工程实践。
那个时代,上下文工程的核心是翻译,即将人的自然语言意图翻译成机器可理解的语言。
2020年,随着 GPT-3 发布,我们迎来一个全新时代。用户可直接用自然语言和机器对话。
既然上下文工程是为了解决人与AI沟通的Gap,那它无法像人类一样高熵交流的核心原因有哪些?
论文总结八大AI缺陷,可归结成四种。正是这些缺陷导致它无法理解高熵交流。
为了解决模型当前问题,论文提出包含收集、管理、使用三个阶段的完整上下文工程体系。
本文由主机测评网于2026-05-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260544091.html