人类视觉瞬间领悟,人工智能却束手无策!近日,网友利用光学错觉图像对大型语言模型进行趣味测试,引发数百万人围观与热议。
这又增添了一种戏弄大模型的巧妙方式,凸显了生物视觉与计算视觉之间的有趣差异。
表面上看,这只是一幅由密集网格组成的静态图案,平凡无奇。但当我们稍微退后观察或眯起眼睛时,图片中心会隐约浮现出一个心形轮廓,甚至随着屏幕滚动,这个心形还能产生左右移动的错觉,令人称奇。
这是一种典型的基于网格的光学错觉,类似于赫尔曼网格错觉(Hermann Grid)。在这些错觉中,网格交叉点仿佛浮现出暗色斑点或形状,尽管它们实际并不存在。这一现象源于人类视觉系统中的侧抑制机制:视网膜中一个神经元的活动会抑制邻近神经元,从而增强对比度感知,有时在边缘或交叉点引发虚幻的视觉体验。
X 博主 @JonhernandezIA 提出,这种光学错觉可作为一种「AI 检测器」,因为人类大脑的生物特性(易于受错觉影响)与 AI 的计算特性(依赖数据训练和算法推理)存在根本差异,这为测试 AI 的视觉理解能力提供了新思路。
短时间内,该帖子获得近 50 万浏览量,大量网友参与测试,不同 AI 模型反应各异:有些频频翻车,有些则在提示后成功识别。例如,网友 @swombat 测试了 GPT-5 Pro、GPT-5 和 Claude Opus4.1,三者均未直接答对。GPT-5 Pro 耗时十多分钟,推测为倾斜方形;GPT-5 错误描述为熊猫;Opus4.1 则坦诚未能发现隐藏图像。
GPT-5 Pro 思考后给出错误答案,认为隐藏图案是菱形;GPT-5 更是信口开河;Opus4.1 直接表示无法识别。
网友 @lingzhong_eth 测试谷歌 Gemini,即使直接询问是否看到心形,Gemini 也坚决否认。
即便提供提示,Grok 模型要么识别失败,要么胡乱编造,如声称隐藏单词「JESUS」,显示 AI 在处理此类错觉时的局限性。
当然也有成功案例。网友 @EdDiberd 晚些时候使用 GPT-5 Pro,直接上传图片并提示“Find the hidden shape”,模型给出了正确答案。有人质疑其使用了网络搜索,但录屏视频证实了结果。该网友还测试了熊猫错觉图,GPT-5 Pro 在长时间思考后也答对了,这可能解释了此前 GPT-5 误判的原因。
网友 Moll 表示,初始时 ChatGPT 和 Claude 仅注意到“视觉错觉”,但要求它们全面分析图像后,两者都识别出了心形。另有网友建议,提示 AI 先模糊图像再思考,模拟人类眯眼行为,有助于获得正确答案。
不过,也有网友质疑这种光学错觉作为 AI 测试的有效性,认为它并非严谨的基准测试,只是社交媒体上的趣味尝试,但不可否认其揭示了 AI 视觉理解的独特挑战。
除了浮动心形和隐藏熊猫,还有其他好玩的光学错觉测试。例如,一段视频中晃动显示“tldraw”字母,暂停时字母消失;另一段左右移动的宝剑视频,暂停后宝剑也无影无踪。网友 @tldraw 用此考验 Gemini,模型似乎再次翻车。
有评论指出,通过运动消除噪音的方法适用于多种场景。还有网友调侃,这或许能成为检测机器人的新型验证码,为 AI 安全领域带来启发。
参考链接:
https://x.com/JonhernandezIA/status/1982216149124153795
https://x.com/bpiatt/status/1981906578795094071
https://x.com/EdDiberd/status/1982286711007609229
https://x.com/Rainmaker1973/status/1982400788782838182
https://x.com/tldraw/status/1982435625480433892
本文由主机测评网于2026-01-14发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260117616.html