当前位置:首页 > 科技资讯 > 正文

GPT-5.2震撼发布:性能飞跃与神秘华人团队揭秘

【导读】全新力作GPT-5.2震撼登场,性能是否如预期般飞跃?网友实测反馈褒贬不一,但专业评测揭示其强大潜力!

近日,OpenAI再度放大招,推出全新GPT-5.2,引发业界广泛关注。

据官方公布的数据,GPT-5.2在多项基准测试中表现卓越,几乎全面超越Gemini 3 Pro,成为当前市场上的佼佼者。

这款AI擅长处理各类高价值任务,如电子表格操作、PPT制作、代码编写与审查、长文档分析等,其高效性与专业性备受赞誉。

在GDPval等基准测试中,GPT-5.2甚至宣称有70.9%的时间能够媲美甚至超越专业人士,这一成就令人瞩目。

对于OpenAI而言,GPT-5.2不仅是其狙击Gemini 3的重要武器,更是实现AGI目标的关键一步。

GPT-5.2震撼发布:性能飞跃与神秘华人团队揭秘 GPT-5.2 性能飞跃 LLM 华人团队 第1张

那么,GPT-5.2的实际体验究竟如何?让我们一探究竟。

实测揭秘:GPT-5.2的惊喜与不足

出人意料的是,一篇关于GPT-5.2实测翻车贴在网上迅速走红。

例如,当被问及“garlic”中R字母的数量时,它竟回答为0个,这一错误让人大跌眼镜。

GPT-5.2震撼发布:性能飞跃与神秘华人团队揭秘 GPT-5.2 性能飞跃 LLM 华人团队 第2张

相比之下,其他模型则表现出色,稳定性远超预期。

GPT-5.2震撼发布:性能飞跃与神秘华人团队揭秘 GPT-5.2 性能飞跃 LLM 华人团队 第3张

归根结底,这是LLM(大型语言模型)的一个底层问题:由于tokenization而无法准确统计字母数量。

然而,只要选择Thinking版本,GPT-5.2便能正确回答这个问题。

GPT-5.2震撼发布:性能飞跃与神秘华人团队揭秘 GPT-5.2 性能飞跃 LLM 华人团队 第4张

GPT-5.2震撼发布:性能飞跃与神秘华人团队揭秘 GPT-5.2 性能飞跃 LLM 华人团队 第5张

在reddit上,不少网友也反映称,GPT-5.2刚发布时功能强大,但仅几个小时后便开始“降智”。

GPT-5.2震撼发布:性能飞跃与神秘华人团队揭秘 GPT-5.2 性能飞跃 LLM 华人团队 第6张

权威声音:GPT-5.2实力依旧强劲

尽管存在小插曲,但GPT-5.2仍获得广泛好评。

昨晚一经发布,便令网友们震撼不已。

例如,有人惊叹于ARC-AGI 2的这次飞跃,好奇OpenAI究竟是如何做到的。

GPT-5.2震撼发布:性能飞跃与神秘华人团队揭秘 GPT-5.2 性能飞跃 LLM 华人团队 第7张

GPT-5.2震撼发布:性能飞跃与神秘华人团队揭秘 GPT-5.2 性能飞跃 LLM 华人团队 第8张

GPT-5.2震撼发布:性能飞跃与神秘华人团队揭秘 GPT-5.2 性能飞跃 LLM 华人团队 第9张

沃顿商学院教授Ethan Mollick提前体验了GPT-5.2,对其性能赞不绝口。

GPT-5.2震撼发布:性能飞跃与神秘华人团队揭秘 GPT-5.2 性能飞跃 LLM 华人团队 第10张

编码、推理、数学能力的重大突破

Magicpathai的CEO对GPT-5.2进行了长时间测试,称其为「复杂推理、数学、编程和模拟方面的一次重大飞跃」。

GPT-5.2震撼发布:性能飞跃与神秘华人团队揭秘 GPT-5.2 性能飞跃 LLM 华人团队 第11张

实例显示,它能构建完整的3D图形引擎并支持交互式控制,分辨率高达4K。

GPT-5.2震撼发布:性能飞跃与神秘华人团队揭秘 GPT-5.2 性能飞跃 LLM 华人团队 第12张

华人团队的杰出贡献

与以往一样,GPT-5.​在这次成功背后也有着华人团队的卓越贡献。