长久以来,关于AI何时能超越人类的讨论不绝于耳。但圈内人心中有一个终极期望,那就是实现AGI(通用人工智能),也就是创造一个“和人一样聪明的AI”。
如果我们浏览马斯克的社交平台,会发现他频繁提及AGI,并持续预测其即将到来,似乎就在未来的三五年之间。
然而,AGI到底如何衡量呢?人与人的差异本就巨大,那么何种水平才能等同于人类智慧?
事实上,就连那些为AGI争论不休的大佬们,也无法确切定义AGI究竟是什么。
正因如此,最近一群顶尖专家联手发表了一篇论文,为AGI提供了首个量化定义。他们利用GPT模型进行测试,发现如果以100分为满分,GPT-5仅得58分,显然还未达到标准。
他们的核心观点是:AGI应具备“一个受过良好教育的成年人”的能力。他们引入了心理学中的CHC理论,即智力是多维度考察的结果。
他们详细列出了AI的十项核心能力,每项占10分:通识知识(K)、读写能力(RW)、数学能力(M)、即时推理(R)、工作记忆(WM)、视觉处理(V)、听觉处理(A)、反应速度(S)、长期记忆存储(MS)和长期记忆检索(MR)。
其中,工作记忆和长期记忆较为抽象。工作记忆类似于短期记忆,而长期记忆则指AI能否通过对话永久学习新东西。
在测试中,GPT-4和GPT-5分别得分为27和58,均未达到满分。其中GPT-5在某些方面表现突出,如通识、读写和数学能力接近满分,但在长期记忆存储方面仅得3-4分。
这表明当前AI存在严重偏科现象。例如,GPT在视觉处理方面表现不佳,GPT-4得分为零,而GPT-5也仅得4分。
当前AI的记忆只是假装拥有记忆,而非真正记忆。作者称此为“能力扭曲”,即利用某些领域的优势掩盖其他领域的弱点。
尽管这份报告存在不足,但它为当前AI做了全面诊断:AI在某些基本认知能力上仍有严重缺陷。同时提醒行业要正视这些弱点。
此外,该标准本身也引发讨论。为何AGI必须模仿人类?它可能是一种完全不同的智能。将人类CHC理论套用于AGI是否合适?此外,该标准是否过高?
无论如何,提出标准总是好事。它使AGI从玄学回归为可讨论的具体问题。即使不完美,也会促使行业思考追求的目标及所需弥补的短板。
本文由主机测评网于2026-05-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260544326.html