8月21日,DeepSeek震撼发布了其最新版本——DeepSeek-V3.1。此次升级在以下三个方面实现了重大突破:
1. 混合推理架构:创新性地支持思考模式与非思考模式的同步运作;
2. 高效思考引擎:相较于DeepSeek-R1-0528,DeepSeek-V3.1-Think能更迅速地给出答案;
3. 强大Agent功能:借助Post-Training优化,新模型在工具运用与智能体任务中表现卓越。
官方推文中特别指出,DeepSeek-V3.1采用了UE8M0 FP8 Scale的参数精度,并预告称“UE8M0 FP8专为即将面世的国产芯片设计。”
消息一出,资本市场瞬间沸腾。据东方财富统计,受DeepSeek新品发布影响,8月22日FP8概念股狂飙,寒武纪、和而泰、佳都科技等纷纷涨停。
图源:东方财富
那么,在AI大模型领域内,FP8究竟是何方神圣?DeepSeek推出的“UE8M0 FP8”又有何独到之处?对于国产AI而言,它意味着什么?
要理解“UE8M0 FP8”,我们需先洞悉“FP8”的本质。
“FP”即“Floating-Point”(浮点数)的缩写。其核心理念在于采用“二进制科学计数法”表示数字,通过“拆分位数”来平衡“表示范围”与“精度”。
为更直观地理解,我们可以借助熟悉的“十进制科学计数法”进行类比。用其表示数字时,会固定“尾数”格式(如保留1位整数和3位小数),再用“指数”调整数字大小,例如:
这样,数字被“拆分”为两个组成部分:
1.尾数:对应2.345,决定数字的“精度”(如精确到小数点后几位);
2.指数:对应10^2和10^-3中的“2”和“-3”,决定数字的“范围”(能表示多大或多小的数)。
科学计数法的优势在于:用有限的位数,既能表示极大的数,也能表示极小的数,同时保留关键精度。
在理解浮点数(FP)后,我们再看FP8后面的“8”。这里的“8”通常指的是8 bit,即8个二进制位(总位数)。类似地,还有FP64、FP32、FP16等,总位数越少,存储占用越小、计算速度越快(后续将深入探讨)。
综上所述:FP8的本质是用8 bit(8个二进制位)拆分为“符号+指数+尾数”,以平衡“范围”与“精度”。
其中,8 bit被分为三部分:
1. 符号位(S,1 bit):表示数字的正负(0=正,1=负);
2. 指数位(E):决定数字的范围大小;
3. 尾数位(M):决定数字的精度高低。
因此,现在理解DeepSeek引入的“UE8M0 FP8”就一目了然了。这里的“U”代表无符号位,“E8”表示指数位为8,“M0”即尾数位为0,“FP8”即8位浮点数。
实质上,UE8M0 FP8以“精度”换取极大的动态“范围”。同时,需通过后续算法和硬件设计来弥补精度问题。
图源:DeepSeek微信公众号
在支持FP8之前,国产芯片常用FP16、BF16和INT8等格式。这里简要阐述各厂商转向FP8的考量。
不同格式的差异主要体现在“总位数”、“指数位宽度”、“尾数位宽度”的分配上。按应用场景可分为通用标准格式、AI专用低精度格式和特殊场景格式。
IEEE 754是全球通用的浮点数标准,涵盖从消费电子到高性能计算的大部分场景。其核心在于通过固定位数分配来平衡“范围”与“精度”,主要包括单精度、双精度、半精度三类。
这类格式具有良好的标准化兼容性:所有主流芯片均原生支持,软件生态(如C/C++、Python、CUDA)无需额外适配。
FP32(单精度浮点数)是早期AI开发的默认选择。其设计在精度(约7位有效数字)和计算效率间取得平衡,支撑了AlexNet、ResNet等经典模型的训练。
然而,FP32的局限性在于:存储和计算成本高,随着模型规模扩大,显存占用和算力需求呈指数级增长。
总位数越少,存储占用越小、计算速度越快、但精度越低。例如,FP64精度高但算力消耗是FP32的2~4倍。在此背景下,研究者开始尝试更低精度格式与混合精度训练。
图源:英伟达官方博客
本文由主机测评网于2026-04-26发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260440517.html