来源:九州酷游娱乐备用网址 发布时间:2026-05-21 11:43:16
九游娱乐app官网下载链接:中信建投证券研究 文刘双锋 孙芳芳 章合坤 王定润 何昱灵 郭彦辉 赵子鹏 梁艺 何昊
英伟达Rubin进入量产,下一代Feynman进一步推升算力硬件需求,服务器架构从训练主导转向训推兼顾,从GPU主导转向GPU+LPU架构,并推出存储机柜、CPU机柜、LPX机柜等,实现系统方案的逐步优化。谷歌/AWS/Meta等厂商的ASIC亦在加速迭代。算力芯片需求持续强劲增长,先进制程、先进存储、先进封装、PCB、光通信等仍是硬件需求增量、技术创新最显著的环节,台积电、三星、英特尔等开发并扩产2nm先进制程,HBM演进到HBM4并衍生出定制芯片,CoPoS、CoWoP等先进封装形式涌现,CPU、传统存储的供需也逐步紧俏。
随着AI训练、推理需求的持续膨胀,存储已成为算力增长的主要瓶颈,HBM/DDR、SSD、HDD陆续成为服务器的最紧缺物料。除了HBM、DDR外,产业内还在开发AI SSD、CMX、HBF、SRAM等存储器(或方案),以满足AI训练和推理过程中数据吞吐的高要求。
随着英伟达GPU的发布周期固定在每年一次,算力提升对内存容量和带宽提出了接近每年翻倍的高要求;根据TrendForce数据,GPU的计算能力在过去20年间增长了60000倍,但同期DRAM内存带宽仅提高了100倍——“内存墙”仍将长期存在,通过HBM路线实现低功耗高带宽趋势明确。以位元计算,目前HBM占整个DRAM市场比重仍在个位数,渗透率存在比较大提升空间;TrendForce预计2026年HBM出货量将超过300亿Gb。
DRAM产能供给紧缺趋势不变,SK海力士等龙头厂商加速扩产。从供给端看,HBM供应仍然紧缺,相应持续挤占DRAM产能,25Q4-26Q1 DRAM厂商现货报价加速攀升;部分美国与国内厂商慢慢的开始和晶圆厂签订2-3年的长期合同进行锁价。根据Trendforce援引The Bell报道,SK海力士计划通过清州DRAM工厂M15X和利川M16的扩产,在26H2将其DRAM晶圆产量提高到60万片/月,和三星的DRAM晶圆产能处于同一水平。具体来看,M15X在投产初期将保持在10000片/月的DRAM晶圆,到26Q4将爬坡至5万片/月。
HBM迭代周期随之显著缩短,HBM4开始大规模商用。2025年下半年,英伟达量产的GB300搭载的是12层24GB的HBM3e,2026年英伟达将发布的Rubin系列和AMD将发布的MI400系列均将搭载HBM4/4e。其中英伟达计划在26Q1完成HBM4的最终资格测试。从更新周期来看,JEDEC于2025年4月正式对外发布了JESD 270-4高带宽存储器(HBM4)标准,(接口宽度从HBM3/HBM3e的1024位翻倍至2048位;堆栈通道数从16个增加到32个,支持24Gb或32Gb芯片的4到16层堆栈配置),较HBM3规范发布晚约三年,计划落地时间较HBM3落地时点亦在三年左右。根据EETimes的预测,HBM的迭代周期从前期的每四年一代提高并稳定到每两年到两年半一代。
全球龙头存储厂商竞逐HBM4,SK海力士仍居领头羊,三星美光加速追赶。根据Trendforce预测,2025年SK海力士将以59%的HBM出货量保持行业领头羊,而三星和美光将各占20%左右份额。从时点上看,SK海力士于2025年3月交付了全球首批12层HBM4样品、6月小批量出货,计划10月快速进入量产;美光也在25Q2向主要客户交付了HBM4样品;三星的HBM4样品25Q2交付给英伟达,当前进入最终的预生产(PP)阶段。预计2026年,领先的GPGPU如Rubin将大范围采用HBM4,Yole预计2026年HBM4渗透率将达到51%。
从技术上看,SK海力士的HBM4拥有2048个I/O终端,带宽翻倍,引脚速度在6.4Gbps以上。美光目前交付HBM4样品超过2.8 TBps带宽和超过11 Gbps引脚速度,计划在2027年同时推出标准版和定制版的HBM4e。三星同样计划于2027年推出HBM4e产品,目标引脚速度超过13Gbps,目标最大吞吐量3.25TB/s,较当前HBM3e快2倍以上。
远期看,英伟达等厂商计划自研Base Die,将存算架构进一步整合。除传统晶圆厂外,为了进一步提升传输速率,AI算力芯片厂商也开始协同进行HBM设计。2025年8月,英伟达宣布计划自研HBM内存Base Die,采用3nm工艺,预计于2027年下半年开始小规模试产。英伟达此次自研HBM内存Base Die的计划,旨在优化AI芯片的内存带宽与能效匹配度;未来英伟达的HBM内存有望采用内存原厂DRAM Die与英伟达Base Die的组合模式,标志着其在高性能计算存储架构领域的垂直整合进一步深化。
HBM带宽大、延迟低,但容量低、成本高。随着AI大模型参数规模向万亿级迈进,推理部署环节的市场规模和应用场景变得极为广阔,但传统的存储体系正面临严峻的“内存墙”困境。HBM虽能提供极致的带宽和纳秒级访问延迟,但其容量有限(单堆栈通常为16-64GB),且成本高昂,难以线性扩展。与此同时,传统SSD虽然容量大、成本低,但带宽严重不足(如NVMe PCIe 4.0 SSD仅约7GB/s),不足以满足大模型推理时对海量权重数据和键值缓存(KV Cache)的高速读取需求。在AI推理场景中,数据访问模式呈现出“读多写少”的特点,且需要单次加载的模型容量极高——例如运行405B参数的Llama 3.1模型时,仅权重存储就需要数百GB空间。HBM很快会被KV缓存占满,而依赖远端SSD或向量重计算又会引入显著延迟。
正是在这一供需失衡的背景下,HBF(High Band Flash,高带宽闪存)应运而生。HBF旨在填补HBM与SSD之间的巨大空白,以接近HBM的带宽和成本水平,提供其8至16倍的超大容量。SK海力士的仿线混合架构中引入HBF后,原本需要32颗GPU才能完成的工作负载,仅需2颗GPU就可以实现,能效比提升最高达2.69倍。HBF的出现,不仅有望破解推理阶段的存储瓶颈,更可能从根本上改变AI算力集群的经济模型,成为衔接HBM与SSD的新一代核心存储方案。
HBF通过封装创新、3D堆叠和分布式控制,在容量、带宽和成本三个维度上实现了独特的再平衡,成为AI推理场景的理想存储载体。HBF是一种基于3D NAND闪存的高带宽堆叠存储技术,其设计理念借鉴了HBM的垂直堆叠架构,但将存储介质从易失性的DRAM替换为非易失性的NAND闪存。在物理结构上,HBF通过硅通孔(TSV)或CMOS直接键合阵列(CBA)工艺,将多层高性能NAND闪存芯片垂直堆叠起来,并通过逻辑芯片与中介层连接至GPU或处理器,形成密集互连的存储结构。单堆叠可达16层die,首代产品就可以实现512GB的容量和1.6TB/s的读取带宽——这一带宽水平已接近HBM3e的性能,而容量则是同等物理空间下HBM的8至16倍。与传统SSD依赖单控制器串行调度不同,HBF采用分布式控制结构,每一组NAND die可独立并行访问,结合优化的控制器算法,将NAND固有延迟从毫秒级压缩至约5微秒级,匹配AI推理场景对高带宽读的需求。由于基于NAND闪存,HBF具备非易失特性,无需像HBM那样持续刷新供电,静态功耗仅为HBM的64%至80%。当然,HBF也存在先天短板:NAND的写入耐久性有限(约10万次擦写),访问延迟(微秒级)远高于DRAM的纳秒级,因此业界主流设计思路是将HBF用于只读数据或低频写入的键值缓存,而将频繁读写的动态数据留在HBM中。
目前,全球存储巨头已围绕HBF形成技术竞赛格局,标准化与量产进程正在加速推进:
闪迪是HBF概念的率先提出者,2025年2月在投资者日上正式介绍HBF技术,依托自家BiCS 3D NAND和CBA工艺构建核心架构,采用16层核心芯片堆叠。闪迪计划于2026年下半年交付首批HBF模块样品,目标2027年初推出首批集成HBF的AI推理服务器。
SK海力士是当前HBF研发最为积极的厂商之一,2025年8月与闪迪签署谅解备忘录,共同推进HBF技术标准化;同年10月在OCP全球峰会上正式对外发布包含HBF技术的“AIN B”系列存储器,并举办“HBF之夜”活动推动生态合作。SK海力士还提出了创新的H3混合架构(Hybrid HBM+HBF),将HBM与HBF并列部署于GPU两侧,通过双存储层级协同工作,并已完成早期测试验证。公司目标在2026年推出第一代HBF样品,2027年实现量产。
三星电子虽态度相对审慎,但已启动HBF产品的早期概念设计工作,并依托其在逻辑代工领域的4nm至2nm工艺优势,探索自研控制逻辑与下一代NAND方案的能效优化。三星计划在2027年底至2028年初将HBF集成到英伟达、AMD及谷歌的实际产品中。
此外,主控芯片方面,HBF需要配套极高吞吐能力的控制器来驾驭其超高带宽,闪迪、SK海力士等厂商均在研发专用的分布式控制架构,确保NAND阵列的并行访问效率。行业标准方面,三大厂商已就HBF标准化展开合作,闪迪与SK海力士、三星正一同推动HBF成为行业通用标准,目标在2027年完成产业级标准落地。
复盘存储器历史,存储器周期大致4-5年,上行、下行周期大致2年上下。上轮周期起始于20Q1,21Q3存储器价格见顶,此后价格持续下滑,至2023Q2持续7个季度。本轮周期,存储器23Q3开始涨价,期间24Q2-24Q4因库存问题,价格有所回落。24Q4-25Q3,除了HBM,DRAM和NAND价格涨跌更多来自库存周期,直到25Q4,北美云厂商对于2026年的需求展望大幅度的提高,内存条、eSSD缺货涨价,存储随着产能被服务器占用,传统应用(手机、电脑等)开始缺存储器,涨价蔓延至非AI领域的存储器。
需求侧,对于DRAM而言,单GPU配置的HBM、DDR规格和容量提升,2023年以来需求跟随GPU持续强劲增长;对于NAND而言,推理侧的爆发和QLC NAND成本的下降加强了对高速率、低延迟SSD对HDD的优势,SSD需求跟随token爆发。
催动本轮存储上行的核心因素是AI,特别是推理需求的爆发。大模型训练阶段的存储需求大多数来源于预训练数据集和checkpoint(模型状态快照),原始数据集规模约10-30TB,而checkpoint存储量与模型参数量线亿参数模型每个checkpoint约7TB,100个总计约700TB),这一些数据主要存储在SSD和HDD中,因HBM容量不够而需从HBM经DRAM逐步offload至SSD。推理阶段的存储需求则大多数来源于KV Cache、RAG等,其规模比原始数据大1000倍左右(取决于向量维度),随着思维链发展和用户上下文增长,单次提问token数激增至上万,KV Cache需长期存储在SSD中,当用户30分钟未交互时自动从HBM存入SSD,后续提问时再加载回HBM。推理阶段的KV Cache存储策略采用精确匹配(用户历史对话)和向量空间模糊匹配(多用户共享问题),通过共享相同问题的KV Cache和将长期未使用数据转存至HDD来优化存储,而训练阶段的存储需求则随模型参数量增加而等比例上升。
其次是HDD(机械硬盘)供应短缺,eSSD需求爆发。SSD相比HDD的核心优点是显著的读写速度和低延迟特性,SSD的读写速度可达十几GB级别,而HDD仅约几百兆,这使其在AI推理、高频数据访问等场景中有着非常明显优势。HDD被SSD替代的根本原因是AI应用爆发式增长,尤其是数据中心对高性能存储的刚性需求,同时HDD产能面临严重瓶颈,HDD厂商因行业处于“夕阳产业”状态普遍不愿扩产,而是致力于优化成本和增加单盘容量,导致HDD供应紧张。在AI应用推动下,大量新增存储需求从HDD转向SSD,特别是数据中心企业级存储中,HDD与SSD的容量比正从1:5-1:6向1:1转变,预计2026年将出现QLC SSD替代HDD的爆发式增长。
供给侧,存储IDM资本开支计划谨慎,且产能释放速度较慢。2023-2025年,大容量、小容量存储厂商资本开支维持低增长或者负增长状态,其中SK海力士资本开支增长较大,大多数都用在扩产前两年开始持续紧缺的HBM、DRAM。存储厂商的扩产意愿与供需缺口和盈利水平相关,目前各家DRAM和NAND的毛利率水平接近80%,存储厂商扩产动作开始变得频繁,但是存储器的扩产周期从购买设备到产能释放需要2年以上,因此新增的资本开支难以体现在2026年的供给上,预计产能释放的高峰期在2027年下半年及以后。
我们预计2026-2027年HBM、DRAM、NAND甚至小容量存储均会出现不同程度的供给紧缺,本轮存储涨价周期将不同于以往,涨价时间和涨价幅度将远超预期。供需缺口将催化价格大幅度上涨,根据Trendforce预测, DRAM 26Q2 的合约价在26Q1上涨93-96%的基础上持续上涨58-63%,NAND 26Q2的合约价在26Q1上涨85-90%的基础上持续上涨70-75%。
2026年,DRAM市场规模将增长至4570亿美元,同比+121%,预计NAND市场规模将增长至1420亿美元,同比+103%, NAND、DRAM的单GB价格均有大幅度提升。从 市场结构看,服务器在存储市场的占比有望逐步提升,成为存储器的第一大应用。
1、未来中美贸易摩擦可能进一步加剧,存在美国政府将设置进出口限制条件或其他贸易壁垒风险;2、AI上游基础设施投入了大量资金做研发和建设,端侧尚未有杀手级应用和刚性需求出现,存在AI应用没有到达预期风险;3、宏观环境的坏因将可能使得全球经济提高速度放缓,居民收入、购买力及消费意愿将受一定的影响,存在下游需求没有到达预期风险;4、大宗商品的价值仍未企稳,不排除持续上涨的可能,存在原材料成本提高的风险; 5、全球政治局势复杂,主要经济体争端激化,国际贸易环境不确定性增大,可能使得全球经济提高速度放缓,进而影响市场需求结构,存在国际政治经济发展形势风险。
新华社德黑兰5月20日电伊朗革命卫队海军20日表示,过去24小时内,包括油轮、集装箱船和其他商船在内的26艘船只在伊朗方面的协调和安全保障下通过了霍尔木兹海峡。
7月1日起,学校开除学生学籍、对学生退学处理,不授予学位、撤销学位等行为,将被纳入可行政复议范围
据央视新闻,新修订的《中华人民共和国行政复议法实施条例》近日公布,于今年7月1日起施行。行政复议是政府系统自我纠错的监督制度和解决“民告官”行政争议的救济制度。比如,对闯红灯被罚、开店被吊销执照、工伤不认定等政府部门的行政行为有异议的,能够最终靠行政复议来解决争议。
近日,网传山西明长城遭煤矿企业损毁一事引发全网广泛关注与热议。5月20日晚间,山西宁武县官方发布情况通报——近日,有新闻媒体报道神达朝凯煤业相关问题。山西宁武县委、县政府格外的重视,在上级部门指导下,前期已成立工作专班对有关情况做全面核查。
云南西双版纳到广东江南市场一车西瓜全程1700公里,走昆磨高速27公里长下坡,限时30个小时#卡车司机 #货车司机 #货车司机的心酸 #运满满司机
贵州遵义到云南西双版纳全程1200公里一车塑料颗粒全程高速干过去#卡车司机 #货车司机 #运满满司机 #记录货车生活 #卡车人
今日聚焦铁路部门回应带娃买票相隔8节车厢记者从中国铁路12306技术中心获悉,近日,针对新闻媒体报道的“3岁女童高铁座位与母亲相隔8节车厢”,该中心迅速组织力量进行了核实。
2026年2月4日13时46分许,位于新乡县新乡经济开发区的河南心连心化学工业集团股份有限公司化工新材料项目氨压缩工段发生一起较大窒息事故,造成3人死亡,1人受伤。
近日,湖北武汉。一个户籍人口585人的自然村,先后罹患癌症和白血病的村民经统计达到了62人,大都是50岁以下的青壮年,仅2015年以来就有34人患病,其中去世19人,15人正在治疗。
5月20日,有网民在网络站点平台发布视频称,哈尔滨市香坊区一辆载有乘客的双层巴士被高架桥横梁“削顶”,车头受损严重,现场有乘客受伤。新黄河记者致电香坊区交警大队,工作人员表示,已处理完毕,有乘客剐蹭受伤,无人死亡,系司机操作失误导致。原标题:《惊险!
广东人的晚餐有多省事?四菜一汤,白饭任装,不用复杂技巧,厨房小白也能轻松搞定,上桌就被抢着吃! 姜葱鸡。
,一巴掌拍在市长后背:死鬼,跟你说了多少回,别在我家沙发上抽烟。权力这玩意儿,看不见摸不着,却像水底下的暗流,悄无声息就把人卷进去。