面壁智能发布端侧大模型“前进四”MiniCPM 4.0,号称性能大小王


【导语】6月7日,面壁智能发布了端侧大模型MiniCPM 4.0,该模型通过自研CPM.cu推理框架实现极限场景下220倍提速。此次发布(bù)的(de)MiniCPM 4.0系(xì)列(liè)包(bāo)括(kuò)8B和(hé)0.5B两(liǎng)种(zhǒng)参(cān)数(shù)规(guī)模(mó),采用(yòng)创(chuàng)新(xīn)稀(xī)疏(shū)架(jià)构(gòu)和(hé)“高(gāo)效(xiào)双(shuāng)频(pín)换(huàn)挡(dǎng)”机(jī)制(zhì),兼(jiān)顾(gù)长(zhǎng)、短(duǎn)文本(běn)处(chù)理(lǐ)。MiniCPM 4.0支(zhī)持(chí)在(zài)多(duō)个(gè)开(kāi)源(yuán)框(kuāng)架(jià)部(bù)署(shǔ),带(dài)来(lái)90%的(de)模(mó)型(xíng)瘦(shòu)身(shēn)和(hé)速(sù)度(dù)提(tí)升(shēng),实(shí)现(xiàn)端(duān)侧(cè)推(tuī)理(lǐ)的(de)显(xiǎn)著(zhe)提(tí)升(shēng)。

面壁智能发布端侧大模型“前进四”MiniCPM 4.0,号称性能大小王

  6 月(yuè) 7 日(rì)消(xiāo)息(xi),面(miàn)壁(bì)智(zhì)能(néng)发(fā)布(bù)端(duān)侧(cè)大(dà)模(mó)型(xíng) MiniCPM 4.0。该(gāi)公(gōng)司(sī)称(chēng)新(xīn)模(mó)型(xíng)通(tōng)过(guò)自(zì)研(yán)CPM.cu推(tuī)理(lǐ)框(kuāng)架(jià),在(zài)极(jí)限(xiàn)场(chǎng)景(jǐng)下(xià)实(shí)现(xiàn)最(zuì)高(gāo) 220 倍(bèi)提(tí)速(sù),常(cháng)规(guī) 5 倍(bèi)提(tí)速(sù),支(zhī)持(chí)在(zài) vLLM、SGLang、LlamaFactory 等(děng)框(kuāng)架(jià)部(bù)署(shǔ)。

  此(cǐ)次(cì)发(fā)布(bù)的(de)一(yī)款(kuǎn) 8B 闪(shǎn)电(diàn)稀(xī)疏(shū)版(bǎn),采用(yòng)创(chuàng)新(xīn)稀(xī)疏(shū)架(jià)构(gòu)掀(xiān)起(qǐ)高(gāo)效(xiào)风(fēng)暴(bào);另(lìng)一(yī)款(kuǎn) 0.5B 则(zé)被(bèi)称(chēng)作(zuò)“轻(qīng)巧(qiǎo)灵(líng)动(dòng)的(de)最(zuì)强(qiáng)小(xiǎo)小(xiǎo)钢炮”。

  据官方介绍,此次面壁推出的 MiniCPM 4.0 系列 LLM 模型拥有8B、0.5B 两种参数规模,针对单一架构难以兼顾长、短文本不同场景的技术难题,MiniCPM 4.0-8B 采用「高效双频换挡」机制,能够根据任务特征自动切换注意力模式:在处理高难度的长文本、深度思考任务时,启用稀疏注意力以降低计算复杂度,在短文本场景下切换至稠密注意力以确保精度,实现了长、短文本切换的高效响应。

  据了解,MiniCPM 4.0 可在vLLM、SGLang、LlamaFactory、XTuner等开源框架部署。其内置自研CPM.cu极速端侧推理框架,从投机采样创新、模型压缩量化创新、端侧部署框架创新几方面,带来 90% 的模型瘦身和速度提升,官方宣称将实现端侧推理“从天生到终生”的丝滑。

相关新闻


今日科普|C919自动化装配难题

当你在机场看到国产大飞机C919优雅起降时,可能想不到它的“诞生过程”有多硬核——这架拥有6万多个🆚零件、翼展35.8米的“钢铁巨兽”,其装配精度要控制在头发丝直径级别。更让人惊叹的是,沈阳中航沈飞民机工厂的自动化生产线,仅用6个关键零件就能创造年产值3亿元的奇迹。今天咱们就唠唠,C919在自动化装配路上啃下的五大“硬骨头”。第一块硬骨头:百万级制孔(kǒng)的(de)“针(zhēn)尖


今日科普|探秘自动化装配流程

想(xiǎng)象(xiàng)一(yī)下(xià),过(guò)去(qù)一(yī)条(tiáo)电(diàn)机(jī)装(zhuāng)配(pèi)线(xiàn)需(xū)要(yào)20名工(gōng)人(rén)轮(lún)班(bān)操(cāo)作(zuò),每(měi)天(tiān)最(zuì)多(duō)生(shēng)产(chǎn)500台(tái)电(diàn)机(jī);而


深圳市物联网产业协会成功举办《24小时自助图书馆通用规范》团体标准评审会

【导语】2019 年深圳市物联网产业协会发布的《24 小时自助图书馆通用规范》部分指标落后且引用文件有更新,不利行业发展。为此协(xié)会(huì)于(yú) 2024 年(nián) 11 月(yuè)启(qǐ)动(dòng)修(xiū)订(dìng)立(lì)项(xiàng),2025 年(nián) 10 月(yuè) 30 日(rì)召(zhào)开(kāi)评(píng)审(shěn)


全球智能视觉处理芯片龙头冲刺港交所:光环之下,何以冲破增长枷锁?

【导语】近日,智能视觉处理芯片龙头富瀚微递交港交所招股书,吹响“A+H”双上市号角。其虽在全球市场占据领先地位,但2022 - 2025年上半年营收、净利、毛利率均逐年下滑。不过,富瀚微注重研发创新,积极拓展AI新业务版图。此次赴港上市,能否助力其突破瓶颈、续写传奇,值得期待(dài)。   近(jìn)日(rì),智(zhì)能视觉处理芯片龙头富瀚微正式向港交所递交了招股书,吹响“


国家发改委等五部门:探索推动具身智能机器人进社区、进家庭,到 2027 年底建成 50 个以上全域数字化转型城市

【导语】10月31日,国家发展改革委等五部门发布《深化智慧城市发展推进全域数字化转型行动计划》,提出到2027年底建成50个以上全域数(shù)字(zì)化(huà)转(zhuǎn)型(xíng)城(chéng)市(shì),2035年(nián)涌(yǒng)现(xiàn)一(yī)批(pī)具(jù)有(yǒu)国(guó)际(jì)竞(jìng)争(zhēng)力(lì)的(de)现(xià


2025深圳安博会:大公博创揽三奖 低空安防技术引国内外媒体聚焦

【导语】2025年10月28日至31日,第二十届中国国际社会公共安全博览会在深圳启幕。成都大公博创信息技术有限(xiàn)公(gōng)司(sī)携(xié)全系(xì)列(liè)低(dī)空(kōng)安(ān)防(fáng)设(shè)备(bèi)参(cān)展(zhǎn),凭(píng)借(jiè)三(sān)项(xiàng)权(quán)威(wēi)大(dà)奖(jiǎng)、全栈(zh


业内首家:中国电信实现北斗语音消息服务

【导语】中国电信率先公开展示业内首个“北斗语音消息”服务,首创 AI 算法实现语音极速传输;与此同时,华为也在第四届北斗峰会上发布相关功能,其手(shǒu)表(biǎo)成(chéng)首(shǒu)款(kuǎn)支(zhī)持(chí)终(zhōng)端(duān),北(běi)斗(dòu)应(yīng)用(yòng)再(zài)掀(xiān)新(xīn)篇(piān)。 据(jù