“存算一体”:大模型时代端边算力瓶颈的破局者?
发布时间:
2025-08-18 11:30:49
【导(dǎo)语(yǔ)】随(suí)着信息时代数据量的爆炸性增长和人工智能技术的迅猛发展,传统冯·诺依曼架构在AI领域面临“功耗墙”和“内存墙”等严峻挑战。在此背景下,存算一体技术以其颠覆式的创新理念,试图打破这一僵局。本文将探讨存算一体技术如何突破冯·诺依曼架构的瓶颈,以及后摩智能等企业在该领域的探索与实践,特别是在大模型时代,存算一体技术如何重塑端边智能体验,引领算力革命的新篇章。
近年来,随着信息时代的数据大爆炸以及人工智能浪潮的到来,尤其是大模型技术的广泛应用,其训练和推理所需处理的数据量呈指数级增长。而基于“存储-计算分离”原理的冯·诺依曼架构虽独具优势,但在AI浪潮中已显疲态,存在着不容忽视的局限。
在传统冯・诺依曼架构中,数据需要在存储单元与计算单元间频繁搬运,导致大量的资源被浪费在数据搬运这一环节上。根据英特尔的研究表明,当半导体工艺达到7nm时,数据搬运功耗高达35pJ/bit,占总功耗的63.7%。数据传输造成的功耗损失越来越严重,限制了芯片发展的速度和效率,形成了“功耗墙”问题。
此外,在冯·诺依曼架构中,存储器与处理器是两个完全分离的单元,处理器根据指令从存储器中读取数据、完成运算,并存回存储器。但随着人工智能、大数据等新兴技术的迅猛发展,计算任务对数据处理的速度和规模提出了前所未有的高要求。而当下的(de)存(cún)储(chǔ)器(qì)的(de)数(shù)据(jù)访(fǎng)问(wèn)速(sù)度(dù)跟(gēn)不(bù)上(shàng)计(jì)算(suàn)单(dān)元(yuán)的(de)数(shù)据(jù)处(chù)理(lǐ)速(sù)度(dù),二(èr)者(zhě)之(zhī)间(jiān)形(xíng)成(chéng)了(le)巨(jù)大(dà)的(de)性(xìng)能(néng)差(chà)距(jù),“内(nèi)存(cún)墙(qiáng)”问(wèn)题(tí)日(rì)益(yì)凸(tū)显(xiǎn)。
面(miàn)对(duì)大(dà)模(mó)型(xíng)推(tuī)理(lǐ)对(duì)算力需求的持续拉动,如何攻克“功耗墙”“内存墙”等难题已然成为了工业界和学术界的焦点问题,一场旨在突破现有算力瓶颈的革命正蓄势待发。
在此背景下,“存算一体”正试图用一场颠覆式创新打破这一僵局。近年来,在半导体工艺持续突破与AI算力需求爆发的双重推动下,存算一体技术迎来了新的发展机遇。
从原理上来看,存算一体的核心是将存储功能与计算功能融合在同一个芯片上,直接利用存储单元进行数据处理——通过修改“读”电路的存内计算架构,可以在“读”电路中获取运算(suàn)结(jié)果(guǒ),并(bìng)将(jiāng)结(jié)果(guǒ)直(zhí)接(jiē)“写(xiě)”回(huí)存(cún)储(chǔ)器(qì)的(de)目(mù)的(de)地(de)址(zhǐ),不(bù)再(zài)需(xū)要(yào)在(zài)计(jì)算(suàn)单(dān)元(yuán)和(hé)存(cún)储(chǔ)单(dān)元(yuán)之(zhī)间(jiān)进(jìn)行(xíng)频(pín)繁(fán)的(de)数(shù)据转移,消除了数据搬移带来的消耗,极大降低了功耗,大幅提升计算效率。
正是基于这样的特性,存算一体有力地突破冯·诺依曼架构所面临的瓶颈限制。
存算一体属于非冯诺伊曼架构,在特定领域可以提供更大算力(1000TOPS以上)和更高能效(超过10-100TOPS/W),明显超越现有ASIC算力芯片。除了用于AI计算外,存算技术也可用于感存算一体芯片和类脑芯片,代表了未来主流的大数据计算芯片架构。
近年来,大模型的蓬勃发展与广泛应用,其对强大算力和高存储带宽提出了迫切需求。而存算一体技术凭借其解决数据搬运难题、显著提升计算效率的(de)优(yōu)势(shì),与(yǔ)大(dà)模(mó)型(xíng)的(de)发(fā)展(zhǎn)需(xū)求(qiú)完(wán)美(měi)契(qì)合(hé)。与(yǔ)此(cǐ)同(tóng)时(shí),大(dà)模(mó)型(xíng)计(jì)算(suàn)的(de)应(yīng)用(yòng)场(chǎng)景(jǐng)正(zhèng)从(cóng)云(yún)端(duān)逐(zhú)步(bù)向(xiàng)端(duān)边(biān)侧(cè)拓(tà)展(zhǎn)延(yán)伸,这一趋势为存算一体技术带来了更为广阔的发展空间。
根据量子位智库数据,预计2025年存算一体市场规模将达125亿元,随着技术成熟度提高以及大规模商用落地,至2030年这一市场规模将达1136亿元。
面对极具潜力且规模(mó)不(bù)断(duàn)扩(kuò)张(zhāng)的(de)市(shì)场(chǎng)前(qián)景(jǐng),存(cún)算(suàn)一(yī)体(tǐ)芯(xīn)片(piàn)成(chéng)为(wèi)了(le)科(kē)技(jì)领(lǐng)域备(bèi)受(shòu)瞩(zhǔ)目(mù)的(de)焦(jiāo)点(diǎn)。越(yuè)来(lái)越多的企业正竞相投身存算一体芯片领域,并不断加快布局进程。国内诸如恒烁股份、亿铸科技等企业,均依托自身优势在不同技术路线上积极开展探索,力求在存算一体芯片市场中占据一席之地。
而(ér)在(zài)这(zhè)股(gǔ)热(rè)潮(cháo)下,后摩智能作为国内存算一体AI芯片的先行者和落地者,具有显著的代表性,其探索历程与实践成果生动展现出了我国存算一体芯片技术的多元化发展图景。
在大模型技术迅猛发展、应用场景持续拓展的大背景下,市场对于适配大模型的高性能芯片需求日益迫切。基于这一趋势洞察,后摩智能凭借在存算一体技术领域的前瞻性布局与深厚技术积累,于2023年年底果断调整研发方向,将重点转向基于大模型的应用需求,全力投入存算一体AI芯片的研发工作。
经过不懈努力与技术攻关,后摩智能迎来了重要时刻。在WAIC 2025期间,后摩智能的后摩漫界®M50芯片正式对外亮相,并同步推出力擎™系列M.2卡、力谋®系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵。
据(jù)了(le)解(jiě),后(hòu)摩(mó)漫(màn)界M50定位到了端边大模型应用场景。M50芯片采用存算一体计算架构,实现了160TOPS@INT8、100TFLOPS@bFP16的物理算力,搭配最大48GB内存与153.6GB/s的超高带宽,而典型功耗仅10W,相当于手机快充的功率。这一性能指标意味着,PC、智能语音设备、机器人等智能移动终端无需依赖云端,即可高效运行1.5B到70B参数的本地大模型,真正实现了(le)“高(gāo)算(suàn)力(lì)、低(dī)功(gōng)耗(hào)、即(jí)插(chā)即用”的愿景。
后摩智能的M50芯片及其产品矩阵的发布,标志着端边智能新时代的正式开启。通过存算一体技术的深度融合,后摩智能成功解决了端边设备在算力、功耗与带宽方面的痛点,为消费终端、智能办公与智能工业等领域提供了高效、安全、低成本的AI解决方案。
值得一提的是,8月27日,在深圳国际会展中心(宝安)举办的“IOTE 2025深圳・边缘计算产业生态大会”上,后摩智能产品市场负责人张伟超将发表“大模型时代的算力革命-‘存算一体’重塑端边智能体验”主题演讲,为我们带来更多后摩智能关于存算一体技术在端边算力提升路径、应用场景拓展以及与边缘计算生态深度融合等方面的结合与思考。

相关新闻
当你在机场看到国产大飞机C919优雅起降时,可能想不到它的“诞生过程”有多硬核——这架拥有6万多个🈁零件、翼展35.8米的“钢铁巨兽”,其装配精度要控制在头发丝直径级别。更让人惊叹的是,沈阳中航沈飞民机工厂的自动化生产线,仅用6个关键零件就能创造年产值3亿元的奇迹。今天咱们就唠唠,C919在自动化装配路上啃下的五大“硬骨头”。第一块硬骨头:百万级制孔(kǒng)的(de)“针(zhēn)尖
想(xiǎng)象(xiàng)一(yī)下(xià),过(guò)去(qù)一(yī)条(tiáo)电(diàn)机(jī)装(zhuāng)配(pèi)线(xiàn)需(xū)要(yào)20名工(gōng)人(rén)轮(lún)班(bān)操(cāo)作(zuò),每(měi)天(tiān)最(zuì)多(duō)生(shēng)产(chǎn)500台(tái)电(diàn)机(jī);而
深圳市物联网产业协会成功举办《24小时自助图书馆通用规范》团体标准评审会
【导语】2019 年深圳市物联网产业协会发布的《24 小时自助图书馆通用规范》部分指标落后且引用文件有更新,不利行业发展。为此协(xié)会(huì)于(yú) 2024 年(nián) 11 月(yuè)启(qǐ)动(dòng)修(xiū)订(dìng)立(lì)项(xiàng),2025 年(nián) 10 月(yuè) 30 日(rì)召(zhào)开(kāi)评(píng)审(shěn)
全球智能视觉处理芯片龙头冲刺港交所:光环之下,何以冲破增长枷锁?
【导语】近日,智能视觉处理芯片龙头富瀚微递交港交所招股书,吹响“A+H”双上市号角。其虽在全球市场占据领先地位,但2022 - 2025年上半年营收、净利、毛利率均逐年下滑。不过,富瀚微注重研发创新,积极拓展AI新业务版图。此次赴港上市,能否助力其突破瓶颈、续写传奇,值得期待(dài)。 近(jìn)日(rì),智(zhì)能视觉处理芯片龙头富瀚微正式向港交所递交了招股书,吹响“
国家发改委等五部门:探索推动具身智能机器人进社区、进家庭,到 2027 年底建成 50 个以上全域数字化转型城市
【导语】10月31日,国家发展改革委等五部门发布《深化智慧城市发展推进全域数字化转型行动计划》,提出到2027年底建成50个以上全域数(shù)字(zì)化(huà)转(zhuǎn)型(xíng)城(chéng)市(shì),2035年(nián)涌(yǒng)现(xiàn)一(yī)批(pī)具(jù)有(yǒu)国(guó)际(jì)竞(jìng)争(zhēng)力(lì)的(de)现(xià
2025深圳安博会:大公博创揽三奖 低空安防技术引国内外媒体聚焦
【导语】2025年10月28日至31日,第二十届中国国际社会公共安全博览会在深圳启幕。成都大公博创信息技术有限(xiàn)公(gōng)司(sī)携(xié)全系(xì)列(liè)低(dī)空(kōng)安(ān)防(fáng)设(shè)备(bèi)参(cān)展(zhǎn),凭(píng)借(jiè)三(sān)项(xiàng)权(quán)威(wēi)大(dà)奖(jiǎng)、全栈(zh
【导语】中国电信率先公开展示业内首个“北斗语音消息”服务,首创 AI 算法实现语音极速传输;与此同时,华为也在第四届北斗峰会上发布相关功能,其手(shǒu)表(biǎo)成(chéng)首(shǒu)款(kuǎn)支(zhī)持(chí)终(zhōng)端(duān),北(běi)斗(dòu)应(yīng)用(yòng)再(zài)掀(xiān)新(xīn)篇(piān)。 据(jù