当前位置:首页 > 科技资讯 > 正文

AI发展加速:能力跃迁与未来展望

【导读】Epoch AI年终大盘点:AI发展不仅未停滞,反而加速前进。

近期,Epoch AI在FrontierMath上的测试揭示了中文模型的新进展。

尽管在1-3级的测试中,这些模型落后于顶尖全球AI模型约七个月,但在第四级挑战中,DeepSeek-V3.2 (Thinking)成为唯一得分的选手,取得2%的分数。

AI发展加速:能力跃迁与未来展望 AI发展 能力跃迁 推理模型 经济影响 第1张

然而,即便中文模型表现不佳,外国顶尖模型如GPT、Gemini在FrontierMath上的正确率也不高。值得注意的是,这套测试由60多名数学界顶尖专家联手出题,难度极高。

最新数据显示,AI的能力增长速度比以往更快。Epoch AI用Epoch Capabilities Index (ECI)追踪前沿AI模型能力的发展趋势,自2024年4月以来,AI能力增长速度明显加快。

AI发展加速:能力跃迁与未来展望 AI发展 能力跃迁 推理模型 经济影响 第2张

年度TOP十大洞察

Epoch AI的年终回顾显示,2025年他们发布了36篇数据洞察和37篇通讯。

其中,关于AI推理成本下降、AI在消费级硬件上的实现、OpenAI的算力使用以及英伟达芯片算力的快速增长等洞察备受读者欢迎。

1. AI推理成本疯狂降价

从2023年4月至2025年3月,LLM推理价格在同一性能水平下下降了10倍以上。

AI发展加速:能力跃迁与未来展望 AI发展 能力跃迁 推理模型 经济影响 第3张

2. AI "大脑"正跑到你的电脑里

顶级开源模型在消费级GPU上的性能已接近顶尖水平。

AI发展加速:能力跃迁与未来展望 AI发展 能力跃迁 推理模型 经济影响 第4张

3. OpenAI 2024的大多数算力用于实验

数据显示,OpenAI在2024年大部分计算资源用于实验而非直接服务用户。

AI发展加速:能力跃迁与未来展望 AI发展 能力跃迁 推理模型 经济影响 第5张

Gradient最热TOP 5:洞见背后的思考

Gradient专栏的简短快讯也备受读者喜爱,包括关于ChatGPT能耗、DeepSeek的Transformer架构改进以及推理模型的局限等话题。