AI最大瓶颈竟是内存?芯片创业公司获1.35亿美元融资

AI计算的隐藏瓶颈:内存而非算力
当您向ChatGPT提问时,数据会经历一场复杂的接力赛:信息从内存出发,经过CPU预处理,再传递给GPU进行密集计算,最后返回结果——这一过程会为每个生成的词重复一次。这种结构性的瓶颈意味着每次请求都需要通过行业中最昂贵、最耗电的芯片进行路由,效率极低。这正是XCENA这家韩美合资创业公司试图解决的问题。
XCENA的内存优化方案
XCENA成立于2022年,由三星和SK海力士的前员工共同创立。他们设计了一款芯片,将计算能力更贴近DRAM(动态随机存取存储器,即处理器正在使用的高速短期内存),使常规数据操作在内存附近完成,无需在CPU、GPU和内存之间进行昂贵的数据往返。
如果这一技术能够规模化应用,将对AI基础设施成本产生显著影响,这也解释了投资者对公司的热情。XCENA最近完成了1.35亿美元的B轮融资,估值达到5.7亿美元,总融资额达到1.85亿美元。
内存-centric架构的崛起
XCENA首席执行官Jin Kim在采访中表示:“CPU和GPU多年来一直在变得更智能,但内存从未跟上。XCENA希望改变这一现状。”他补充道:“最近内存价格的上涨和相关股票的升值,表明AI基础设施正朝着内存-centric架构转变。”(本月,全球三大内存芯片供应商——三星、SK海力士和美光——首次各自市值突破万亿美元。)
XCENA的核心论点是:“推理不仅是一个计算问题,它越来越成为一个内存扩展问题。”其芯片MX1通过CXL(计算 express 链接)与CPU连接,在数据离开内存模块之前进行处理,实现了“将计算带到数据旁”而非传统方式。公司声称,原本需要10台服务器运行的任务,现在可能只需1台即可完成。
技术突破与市场潜力
“虽然GPU在矩阵乘法(AI模型训练的核心数学运算)方面表现出色,但周围的数据编排工作,包括预处理、KV缓存管理(存储先前对话上下文的系统,避免模型重复处理)和数据缓存,仍由CPU处理。我们的芯片直接在内存模块内处理这些任务。”Kim解释道。
自去年下半年以来,内存解决方案的需求激增,XCENA认为时机对其有利。公司已与多家全球内存供应商进行初步洽谈(Kim未透露具体名称)。其理想客户是每年在AI基础设施上花费数十亿美元的超大规模企业,即使是微小的内存效率提升也可能意味着数亿美元的节省。
产品进展与竞争格局
MX1芯片目前仍处于原型阶段,预计2026年底前在三星的晶圆厂投入大规模生产,公司预计2027年开始产生收入。
虽然神经处理单元(NPU)制造商正竞争挑战英伟达的训练工作负载,但XCENA的目标是所有这些工作负载下方的内存密集型层次。其主要竞争对手包括纳斯达克上市公司Astera Labs和Marvell,这两家公司都在研发下一代内存连接技术。Kim表示,虽然Marvell是大型成熟企业,但XCENA的差异化在于知识产权:“我们有数千个核心。”相比之下,Marvell的公开规格显示其依赖少数通用核心。
这些核心基于RISC-V开源芯片设计蓝图,专为数据处理优化,每个核心都刻意保持小巧高效。此外,XCENA还设计了内部内存层次结构、互连总线和DRAM控制器——这种垂直整合程度是大多数芯片公司(包括大型竞争对手)通常外包的。
本轮融资由首尔风险投资公司Atinum和IMM Investment联合领投,Corstone Asia及现有投资者SBI Investment和Mirae Asset Capital参与。该公司在首尔 Pangyo(首尔郊外的技术中心)和 Sunnyvale设有办事处,员工超过90人,并正在与国际投资者洽谈额外融资。
关注微信号:智享开源 ,及时了解更新信息。

关注微信

还没有任何评论,你来说两句吧!