近期,围绕Intel 18A及其后续芯片制程技术的讨论持续升温,业界对这家半导体巨头的未来走向展开诸多推测。随着基于该先进工艺打造的Panther Lake(酷睿 Ultra 3)和Clearwater Forest(至强 6+)正式亮相,许多不实传言随之消散。
九月底,半导体行业观察及多家国内媒体受邀探访英特尔位于亚利桑那州凤凰城的制造基地,实地考察了该公司的先进生产线。同期举办的Intel Tech Tour(简称ITT)活动中,英特尔技术专家深入解读了Clearwater Forest与Panther Lake的设计架构与创新细节。
总体而言,此次英特尔如期实现量产传递出一个明确信号:其行业领导地位依然稳固。
在详细介绍两款新品之前,我们首先探究集成两项突破性技术的Intel 18A工艺。据英特尔透露,Intel 18A是美国研发与制造的首个2纳米级制程节点,相较于Intel 35工艺,其每瓦性能提升15%,芯片密度增加30%。该节点在英特尔俄勒冈州工厂完成开发、认证并启动早期生产,预计今年晚些时候将实现大规模量产。
那么,这一代工艺有何独特之处?这需从以英特尔创始人戈登·摩尔命名的行业规律——摩尔定律说起。
根据理解,摩尔定律的核心在于单位面积晶体管数量定期倍增。为实现这一目标,芯片产业不断探索新方法。例如晶体管结构,历经数十年从平面结构演进至FinFET。而在3纳米以下节点,全环绕栅极晶体管成为全球晶圆厂商的共同方向。
英特尔18A率先采用的RibbonFET,正是这类晶体管的代表。英特尔表示,RibbonFET是公司十余年来首款新型晶体管架构,可实现更优的扩展性与切换效率,从而提升性能并降低能耗。
英特尔专家曾在一份声明中强调:“RibbonFET或许是有史以来制造难度最高的晶体管。”
“RibbonFET延续了几何级数的革新,将FinFET的鳍片垂直堆叠,使它们如‘带状’般紧密排列(间距从约30纳米缩小至10纳米)。这一努力是值得的:栅极环绕带状结构,晶体管工作效能更佳。总之,每个晶体管开关速度更快(性能更高)、运行更高效(功耗更低),且在晶圆上占据面积更小。这印证了摩尔定律的有效性。”专家解释道。
除了新型晶体管,能优化电力传输与信号完整性的背面供电系统PowerVia也是Intel 18A的另一大亮点。
传统半导体设计中,电源与信号互连均通过硅晶圆顶部的多层布线实现。然而随着晶体管尺寸缩小与布线密度增加,这种正面配置导致:路由拥堵加剧、电压降与IR降问题凸显,电源效率下降,难以满足信号完整性与性能目标。为此,业界转向背面供电,而PowerVia正是英特尔专有的背面供电网络技术。
英特尔认为,这项技术的好处是多方面的,远超新增工艺复杂性所带来的成本。
“例如,电源线可占据正面面积的20%,移除电源线后,互连层得以‘松绑’,足以抵消整个复杂工艺的开销。通过简化制造中最繁琐的环节,最终的两部分翻转工艺实际上比以往更经济。”英特尔强调。
此外,如英特尔所示,结合先进的封装与3D芯片堆叠技术Foveros,英特尔能将多个芯片堆叠集成至先进的SoC设计中,从而在系统级提供灵活性、可扩展性与性能。
在新发布的Clearwater Forest与Panther Lake上,英特尔的制造优势得到了充分体现。
作为英特尔首款基于Intel 18A的AI PC处理器,Panther Lake无疑是一款性能与能效兼备的芯片。从配置上看,如图展示,Panther Lake主要由五个模块组成:计算模块、GPU模块、基础模块、填充模块与平台控制模块。随后,借助英特尔领先的Foveros 2.5D封装技术,这些模块被集成一体,构建出一个极具竞争力的SoC。
英特尔公司客户端计算事业部副总裁兼中国区总经理高嵩介绍该芯片时总结其四大特点:
Panther Lake融合了Lunar Lake的高能效与Arrow Lake的高性能。二者优势结合,使Panther Lake成为兼具出色能效、卓越性能与强大扩展性的产品系列。
Panther Lake实现了显卡性能高达50%的提升;
NPU性能也显著增强,从而整体提升AI性能。“这不仅是TOPS数值的进步——从Lunar Lake的40多TOPS增至Panther Lake的50 TOPS,同时NPU芯片面积有所缩小。面积缩小虽不易在性能测试中直接体现,但对降低制造成本具有重要意义。”高嵩解释道。
Panther Lake在无线连接方面取得长足进步,无论是Wi-Fi、蓝牙还是1GbE MAC技术均具备更强灵活性。“我们采用业界最先进的无线技术Wi-Fi 7 R2,将AI PC与更强连接性能结合,将显著优化用户体验。”高嵩补充道。
如前所述,英特尔领先的制造工艺是这款芯片获得优异表现的关键。此外,架构与内核的迭代创新也是新处理器提升不可或缺的部分。
首先在计算模块方面,据介绍,该模块包含P核(Cougar Cove)与E核(Darkmont)、NPU 5、IPU 7.5、内存接口以及与图形模块分离的Xe媒体和显示引擎。其中,基于X86架构的Cougar Cove与Darkmont无疑是英特尔处理器的核心,这也是英特尔处理器的立身之本。
在P核(Cougar Cove),据英特尔介绍,新内核的改进主要集中于典型CPU架构优化,例如增强的分支预测器与容量更大的转换后备缓冲区。正如英特尔所言:“我们未改变宽度或深度,而是进行了优化。”英特尔同时强调:“Cougar Cove现采用基于人工智能的电源管理方法,可根据不同工作负载需求动态调整某些功能单元的活跃度。”
英特尔还指出,转向18A工艺使Cougar Cove能够升级一些基础结构,TLB是主要受益者之一。更大的TLB意味着更复杂的工作负载能更快速、可靠地运行。
至于E核(Darkmont),英特尔中国区技术部总经理高宇介绍,作为Skymont的迭代版本,Darkmont的更新聚焦三大关键阶段:前端、乱序执行核心及后端执行端口。这三个阶段均实现显著改进。如图所示,英特尔在该内核的译码单元、指令队列等前端组件,以及乱序执行核心与后端执行端口实现全面增强。正是这三大阶段的优化,使Darkmont能效核的IPC实现超过10%的显著增长。
此外,从前面介绍可见,Panther Lake还拥有一个LPE核心。据高宇介绍,在新一代处理器中,该内核被置于独立供电岛上,具备独立电源管理,缓存配置与运行频率根据其低功耗定位优化。得益于这一设计,其实际运行频率与功耗表现会根据整体平台设计调整,以实现最佳性能与能效平衡。
其次看GPU模块,具体指具备多帧生成能力的新一代GPU——Xe3。
英特尔介绍,Xe3 GPU经过重新设计以提升可扩展性。在GPU渲染切片中,英特尔将Xe核心数量从4个增至6个,一级缓存从192 KB扩至256 KB,二级缓存从8 MB升级至16MB,从而减少访问本地内存需求并提升性能。英特尔同时指出,Xe3 GPU的分配线程采用可变分配策略,这对性能产生显著影响。
在多帧生成方面,如图所示,此前英特尔已介绍XeSS 2,旨在加速视频游戏图形处理。其中,XeSS帧生成功能在两个“真实”渲染帧间插入AI生成帧,并采用低延迟技术抵消由此产生的延迟。
Panther Lake发布之际,英特尔推出XeSS-MFG功能,可与现有升级及多帧生成技术结合,最多注入三个额外插值帧。据英特尔介绍,实际应用中,用户可通过英特尔图形软件包控制此功能,选择设置额外帧或由应用程序自行决定。
值得一提的是,该软件还将提供选项,如指定与GPU共享多少系统内存,这对人工智能乃至某些游戏意义重大。
对于引入此项技术,不可忽视的一点是生成插帧带来的延迟。对此,英特尔表示,游戏玩家对延迟的体验可归纳为用户输入与感知运动之间的延迟。解决此问题可通过AI预测鼠标移动或调整栅格化至AI渲染帧的可变速率实现。
英特尔还推出预编译着色器分发版,使电脑无需等待编译着色器,直接从云端下载预编译着色器。此外,英特尔正开发Intelligent Bias Control 3.0版,使CPU与GPU可相互通信,并将电源分配至合适逻辑。作为对Thread Director的补充技术,它能使GPU性能提升至少10%。
再看NPU方面,高嵩介绍,英特尔NPU 4在能效性能实现重大突破。芯片面积方面,新一代加速器同比缩小40%,带来成本与集成度优势;算力方面,新一代加速器达50 TOPS,较前代提升明显。另外,该NPU原生支持FP8,这对大语言模型支持更佳。
从数据看,集成于Panther Lake的NPU 5具备4.5MB暂存器RAM、256KB二级缓存与6个SHAVE DSP。英特尔指出,Panther Lake的NPU 5最大变化在于对MAC阵列的进一步改进调整。据介绍,其单位面积MAC数量翻倍,使单位面积TOPS较Lunar Lake NPU提高40%。
得益于领先的CPU、iGPU与NPU,英特尔能为PC上的AI任务提供广泛支持。高宇重申:“英特尔坚持XPU路线,即CPU、iGPU、NPU协同工作,各司其职。”“CPU擅长快速响应,因此对响应速度要求高的模型建议运行于CPU上,如语音转文字。GPU特点是什么?带宽较大,因此追求高带宽的任务应运行于GPU上。NPU特点是能效比高,因此追求能效的任务应运行于NPU上。”高宇补充道。
据介绍,由于CPU提供10TOPS算力,iGPU提供120TOPS算力,NPU提供50TOPS算力,基于Panther Lake处理各类AI任务时游刃有余。除算力芯片外,如上所述,各种连接、显示与媒体部件也是Panther Lake的重要组成部分。
基于这些领先配置,英特尔为Panther Lake打造以下三款产品:
一款8核芯片,具备4个P核、4个低功耗E核;4个Xe3 GPU核心与4个光线追踪单元;内存接口为6800 MT/s LPDDR5x或6400 MT/s DDR5;
一款16核芯片,具备4个P核、8个E核与4个LP E核;4个Xe3 GPU核心与4个光线追踪单元;内存接口为8533 MT/s LPDDR5x或7200 MT/s DDR5;
一款16核芯片,具备4个P核、8个E核与4个LP E核、12个Xe3 GPU核与12个光线追踪单元;以及9600 MT/s LPDDR5x内存接口;
值得一提的是,如图所示,8核Panther Lake芯片将拥有12条PCIe通道(8条PCIe 4通道、4条PCIe 5通道),而16核芯片将拥有20条PCIe通道(8条PCIe 4通道与12条PCIe 5通道)。16核12Xe Panther Lake芯片则将配置降至12条PCIe通道,与8核芯片相同。
英特尔强调,Panther Lake引入可扩展多芯片架构,为合作伙伴提供前所未有的灵活性,覆盖各类规格、细分市场与价位,为广泛的消费级与商用AI PC、游戏设备及边缘解决方案提供支持。其中,包括机器人在内的边缘应用也是Panther Lake发力方向。英特尔透露,全新英特尔机器人AI软件套件与参考板,使拥有先进AI能力的客户能利用Panther Lake快速创新,开发出经济高效的机器人,用于控制与AI感知。
“Panther Lake将于今年开始大批量生产,首批SKU预计年底前发货,并将于2026年1月广泛上市。”英特尔强调。
本届ITT上,英特尔还带来面向数据中心的Sierra Forest接班人——基于E-Core设计的Xeon 6+ CPU产品。回顾英特尔在至强产品线的布局,这可能是英特尔将Xeon产品线细分为P-Core系列与E-Core系列的开端。
据介绍,基于全新“Darkmont”高效核心构建的Clearwater Forest采用多层解决方案,包含多个芯片组与构建模块,这使其成为英特尔的重大工程成就。通过将重大架构升级与最新18A制程工艺、先进3D Foveros封装及EMIB技术结合,英特尔打造出迄今为止最高效的服务器处理器。凭借Clearwater Forest发布,英特尔将其分解式架构与封装设计提升至新高度。
我们再次审视Darkmont E-core。
据介绍,该内核主要依赖更宽、更并行的前端与增强的乱序执行引擎;同时,Darkmont每个核心配备64 KB指令缓存,并扩展解码器,使其每周期能处理比前代Crestmont E-core更多指令;其重新排序与分配结构也得到改进;此外,分配单元增加、乱序窗口扩大以容纳更多工作进行;再者,执行资源成倍增加,用于整数与矢量运算的执行端口大幅增加,使核心能维持更高并行吞吐量。
从设计上看,英特尔介绍,一颗Clearwater Forest由12个采用2.5D封装的EMIB模块组成,这些模块将三个有源基础模块连接在一起,然后连接至两个I/O模块与总共12个计算模块。其中I/O模块采用Intel 7工艺制造,有源基础模块采用Intel 3工艺制造,计算芯片组则采用Intel 18A工艺节点制造。
首先看计算模块,如图所示,每个计算模块由6个子模块组成,每个子模块包含4个Darkmont E-Core。这样,每个计算模块有24个Darkmont E-Core,12个计算模块上共有288个E-Core。每个子模块还包含4 MB L2缓存,这意味着每个计算模块拥有24 MB L2缓存,12个计算模块总计拥有288 MB L2缓存,使整个芯片的L3+L2缓存总计达864 MB。
再看I/O模块,据介绍,Clearwater Forest的每个I/O模块提供48条PCIe Gen 5.0通道(共计96条)、32条CXL 2.0通道(共计64条)与96条UPI 2.0通道(共计192条)。
至于三个有源基础模块,采用Intel 3工艺制造,每个基础模块搭载四个DDR5内存控制器,芯片上总共12个内存通道。值得一提的是,该模块还包含共享LLC,每个计算模块48 MB,每个基础模块192 MB,从而提供高达576 MB的封装内LLC容量。这些模块使用EMIB连接至上方的计算模块。
从英特尔介绍我们得知,Clearwater Forest还是其首款采用Foveros Direct3D技术的量产CPU。作为先进封装解决方案,Foveros Direct 3D可在有源基础模块上将计算模块与I/O模块连接在一起。由于Foveros Direct 3D凸块间距为9微米,并采用铜对铜键合技术,因此它充当高密度、低电阻有源硅中介层,性能约0.05pJ/bit。换言之,这意味着英特尔几乎无需功耗即可在两个芯片间传输数据。通过将EMIB与Foveros芯片结合,英特尔在Clearwater Forest上能连接异构组件,形成包含大量有源芯片的封装设计。
总结而言,Clearwater Forest参数如下所示。英特尔指出,与上一代产品相比,Clearwater Forest每周期指令数提升17%;密度、吞吐量与功率效率也显著提高。作为专为超大规模数据中心、云提供商与电信公司定制的产品,Clearwater Forest使组织能够扩展工作负载、降低能源成本并提供更智能服务。
从平台上看,英特尔Clearwater Forest CPU将支持LGA 7529插槽的1S与2S配置;Clearwater Forest也包含英特尔软件防护扩展与英特尔信任域扩展;在电源管理方面;Clearwater Forest将搭载英特尔AET与英特尔Turbo速率限制器;最后,Clearwater Forest CPU将获得高级矢量扩展2,并支持VNNI与INT8。
据称,Clearwater Forest与当前Xeon 69xxE/P平台兼容,允许复用现有服务器,同时保留12个内存通道以及广泛PCIe与CXL支持。随着内存速度向DDR5-8000迈进,英特尔还公布系统规格,例如每个插槽最多288核心,双插槽上限近576核心,以及整个封装中超过1,152 MB的组合末级缓存。
基于上述发布可见,英特尔不仅在芯片设计与制造方面取得重大进展,还表明公司正倾听客户需求,并做出必要战略调整以保持竞争力。尽管PC与服务器市场日趋成熟,但新进入者不断涌现,英特尔欲保持领先地位,仍需多花心思。
然而,正如英特尔首席执行官陈立武在公司新闻稿中所言:“我们正迈入激动人心的全新计算时代,这得益于半导体技术的飞跃发展,而这些技术将塑造未来几十年。我们的下一代计算平台,结合领先的制程技术、制造与先进封装能力,将成为构建全新英特尔的各项业务创新的催化剂。美国一直是英特尔最先进的研发、产品设计与制造基地——我们很自豪能在此基础上继续发展,不断拓展美国业务,并将新创新推向市场。”
虽不能一蹴而就,但笔者认为,在这些产品与技术的支持下,英特尔已然踏上卷土重来的新旅程。
本文由主机测评网于2026-01-06发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260115450.html