服务于全球各领域电子制造客户
公司新闻 行业动态 产品知识
“全世界半导体存储器的市场范围预估将冲破6000亿美元。”
MemoryS 2026上,深圳市闪存市场资讯有限公司总司理邰炜抛出这一数字,彰光鲜明显存储行业的底层逻辑已经悄然转变:周期性行情退场,AI主导的新范式降临。
引爆这场厘革的,是AI推理对于存储的指数级需求:单哀求环境下,若上下文从4K Token扩大至128K Token,KV缓存会膨胀32倍,若是100个并发哀求,缓存需求则达TB级。
面临这类需求量,HBM已经无力承载,这就决议了KV缓存最先年夜范围向企业级SSD迁徙。
叠加NL HDD产能缺口带来的替换效应,多重变量共振,企业级SSD正于成为2026年NAND闪存最年夜的运用市场。
“企业级SSD再也不只是容量载体,而成为了整个算力架构里冲破机能瓶颈的要害。”邰炜说到。
变局之下,AI对于企业级SSD的尺度无穷拔高,高靠得住性、低时延、遐龄命既是订价标尺,也是厂商厮杀的焦点疆场。
谁能破解“AI时代数据搬运的功耗与延迟”,谁就将界说下一个十年。
超等周期已经启幕,存储厂商各有出招。
不做GPU的「副角」,SSD最先参与AI计较
当AI推理范围化发作,存储与计较的瓜葛正于被从头界说:SSD再也不只是数据的“堆栈”,而是影响Token天生效率的要害变量。
这类定位的跃迁,正于倒逼存储厂商从头思索自身的技能纵深。
以年夜普微为例,为了实现更快的Token天生与相应,其经由过程Fast SSD与TLC SSD的产物组合,打造高IOPS及低时延的数据供应能力,从而节省算力及成本。
更深一层的变化于在,存储最先参与计较的数据流调理。
年夜普微经由过程透明压缩技能实现将KV Cache的数据无损压缩21%以上,从而等效晋升27%的带宽,带来直接的机能与用户容量收益。
与此同时,FDP(矫捷数据放置)技能的引入,让SSD可以按照数据生命周期举行分组治理,从而降低写放年夜与延迟颠簸,为GPU提供可预期的数据供应节拍。
这些技能点的串联,勾画出一个清楚的演进标的目的:SSD正于从“存储装备”进化为“AI数据调理节点”,它不仅要存患上快、存患上多,还有要存患上“智慧”,能于准确的时间把准确的数据送到准确的位置。
更值患上存眷的是其产物节拍与AI算力迭代的同频。
“今朝,企业级SSD的市场年夜概能根据容量举行划分,4TB-32TB是TLC SSD的范围甜点,30TB以上则是QLC SSD的主力区间,年夜普微本年推出245TB的产物,来岁就会设计为512TB。”年夜普微董事长杨亚飞对于雷峰网(公家号:雷峰网)暗示。
这类“容量翻倍”的产物计谋,与AI模子参数范围的增加曲线形成为了共振,为下一阶段产物的放量埋下基础。
SSD的竞争焦点是让GPU「不空转」
当SSD最先负担KV Cache卸载、AI数据湖、推理缓存等使命,它既要提供靠近内存级的延迟不变性,又要具有远高在内存的容量密度及成本上风。
于这类变化下,SSD的评价系统也随之重构。
已往行业更夸大带宽、IOPS与寿命,于AI场景中,长尾延迟节制、QoS一致性以和每一瓦机能最先变患上一样要害。
对于年夜型算力集群来讲,一块SSD的价值不只是单盘机能有多高,而于在它可否于繁杂负载下连结不变相应,防止GPU因等候I/O而“空转”。
也恰是于如许的配景下,企业级存储厂商最先向体系能力延长。
以忆恒创源为例,其焦点计谋其实不是简朴重叠硬件参数,而是经由过程固件算法及体系级调理,把差别来历的节制器与NAND颗粒调校成更合适AI负载的产物形态。
于年夜范围线上部署中,依托海内年夜范围、高度繁杂的AI与互联网生态,于极度且高频的营业压力下,其SSD的平均无端障时间(MTBF)已经经到达约1500万小时,产物的不变性有可不雅的场景和数据违书。
于AI负载情况下,经由过程固件调理优化及延迟节制,其随机读延迟可以压缩至50微秒级,从而削减推理场景中GPU等候I/O的时间。
而且,经由过程对于固件及硬件架构的协同优化,高密度QLC于AI数据湖及推理场景中既能提供更年夜的容量密度,也能维持不变的机能体现。
对于在需要存储海量练习数据或者推理缓存的集群而言,这种产物正于成为实现“全闪数据中央”的要害一步。
AI重构存储路径:企业级SSD从「容量介质」转向「算力体系变量」
于这一轮由 AI 鞭策的存储重构中,一个更清楚的共鸣正于形成:企业级SSD的价值锚点,正于从“单点机能指标”转向“体系确定性”。
不管是KV Cache年夜范围卸载带来的架构迁徙,还有是QLC于高密度存储中的从头定位,抑或者是固件层对于延迟、QoS 与功耗的连续压缩,素质上都于指向统一个问题:存储再也不只是容量与带宽的提供者,而是决议算力是否可以或许被不变开释的基础变量。
于这个意义上,行业的竞争界限也于悄然上移。
单一硬件能力的差异正于被体系级能力所稀释,真正拉开差距的,是谁能更早理解AI事情负载的变化,并将其转化为可范围化、可连续优化的工程系统。
当算力、存储与收集进一步交融,数据中央的逻辑也将从“资源重叠”走向“效率构造”。
而存储,正站于这一轮重构的交汇点上。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
下一篇【产品推荐】超小型高频同轴连接器u.fl系列
www@
Maggie
微信咨询
黎小姐