边缘计算:大小模型结合是边缘智能的最优解路径
发布时间:
2025-06-17 09:30:44
【导语】2023年,边缘计算领域迎来新变革,大模型的开源化为规模化应用提供了重要支撑。视觉物联在《2025边缘计算市场调研报告》中发现,大模型一体机成为热门产品,但边缘设备算力等限制使得纯大模型部署面临挑战。业内共识是大小模型结合,以实现成本与效率的平衡。本次调研将深入探讨边缘计算的技术发展与落地应用,为企业战略决策提供参考。欢迎相关企业报名参加,共同探索边缘计算的未来趋势。
如果说今年边缘计算有什么新变化,那无疑是大模型的开源化,为规模化落地提供重要支撑。
视觉物联在《2025边缘计算市场调研报告》的企业走访中发现,大模型一体机成为了今年炙手可热的明星产品,各大企业纷纷推出用于本地端的大模型一体机。
凭借强大的泛化能力与语义理解优势,大模型在众多领域展现出独特价值。例如在安防行业,它能够精准理解“可疑人员徘徊”等复杂语义,无需依赖大量人工标注样本。
然而,边缘设备自身存在的算力、存储及实时性等方面的限制,使得纯大模型部署困难重重,面临着算力(lì)成(chéng)本(běn)高(gāo)昂(áng)、实(shí)时(shí)性(xìng)欠(qiàn)佳(jiā)以(yǐ)及(jí)数(shù)据(jù)适(shì)配(pèi)性(xìng)差(chà)三(sān)大(dà)严(yán)峻(jùn)挑(tiāo)战(zhàn)。
例(lì)如(rú),一(yī)个(gè)7b参(cān)数(shù)的(de)大(dà)模(mó)型(xíng)在(zài)边(biān)缘(yuán)端(duān)运(yùn)行(xíng)时(shí),处(chù)理(lǐ)单(dān)路视(shì)频(pín)就(jiù)需要数秒时间,难以满足多路并发处理的需求;在工业质检等对响应速度要求极高的场景中,大模型每秒仅能处理1帧的速度,远远无法达到毫秒级响应的标准;此外,边缘场景数据呈现碎片化特点,通用大模型的准确度仅为75%,需针对性优化。
小模型则凭借“小而精”的特性,在边缘端占据着传统优势,其训练数据量需求少、推理速度快(可达毫秒级)、硬件兼容性强。
但小模型也存在明显的短板,其语义理解能力相对薄弱,面对未训练过的复杂场景,如“识别戴安全帽且携带工具的工人”时往往束手无策;而且不同行业需求差异巨大,针对不同场景开发小模型需要重复投入,开发成本高达数十万级门槛。
业内的普遍共识是大小模型结合,小模型用于前置过滤,大模型进行深度理解,二者相辅相成,实现成本与效率的平衡。
例如,小模型先对视频流进行初筛,过滤99%的常规画面,大模型则补充小模型算法精度问题。以烟火检测为例,大模型可以将误报从15次降至1次,将95%的误报过滤掉。
对于无历史数据的新场景,如宠物行为识别,大模型可基于少量样本快速生成1.0版本算法,再通过小模型持续数据投喂提升精度,形成“0到1快速验证+1到100持续迭代”的闭环。
与过去传统方案动辄50万开发费及大量标注数据的投入相比,大小模型结合后,5万元即可启动项目,极大地降低了开发门槛;同时,小模型运行于低功耗边缘盒子,大模型部署于算力稍强的边缘服务器,避免“杀鸡用牛刀”的资源浪费。
以智慧交通应用场景为例,小模型实时抓拍车牌、车型,大模型分析“多车连续变道”、“行人横穿马路”等复杂事件,为交通调度提供决策支持。
但不容忽视的是,目前国产化芯片还无法支持大模型运行,企业需通过模型轻量化(如量化、剪枝)与异构计算(CPU+NPU协同)缓解;在实际应用中,大部分企业仍不得不选择英伟达芯片。
小结
边缘计算的智能化变革,绝非大模型对小模型的替代,而是二者在算力、成本、精度间寻找最优解的过程。对于企业而言,需以场景需求为导向,若追求极致实时性与成本控制,小模型仍是首选;若面临复杂语义理解与创新场景开拓,大模型则是破局关键。
视觉物联联合AIoT星图研究院已经启动《2025边缘计算市场调研报告》,将从技术发展与落地应用等方面展开深度调研,揭示行业基本面,洞察竞争格局,为企业战略制定、投资决策、市场拓展等提供结构化的参考依据。
我们拟将调研更多深耕边缘计算领域发展方向的企业,并从中总结行业发展现状以及未来发展趋势,供其他企业参考,欢迎企业踊跃报名参加。

相关新闻
当你在机场看到国产大飞机C919优雅起降时,可能想不到它的“诞生过程”有多硬核——这架拥有6万多个🆕零件、翼展35.8米的“钢铁巨兽”,其装配精度要控制在头发丝直径级别。更让人惊叹的是,沈阳中航沈飞民机工厂的自动化生产线,仅用6个关键零件就能创造年产值3亿元的奇迹。今天咱们就唠唠,C919在自动化装配路上啃下的五大“硬骨头”。第一块硬骨头:百万级制孔(kǒng)的(de)“针(zhēn)尖
想(xiǎng)象(xiàng)一(yī)下(xià),过(guò)去(qù)一(yī)条(tiáo)电(diàn)机(jī)装(zhuāng)配(pèi)线(xiàn)需(xū)要(yào)20名工(gōng)人(rén)轮(lún)班(bān)操(cāo)作(zuò),每(měi)天(tiān)最(zuì)多(duō)生(shēng)产(chǎn)500台(tái)电(diàn)机(jī);而
深圳市物联网产业协会成功举办《24小时自助图书馆通用规范》团体标准评审会
【导语】2019 年深圳市物联网产业协会发布的《24 小时自助图书馆通用规范》部分指标落后且引用文件有更新,不利行业发展。为此协(xié)会(huì)于(yú) 2024 年(nián) 11 月(yuè)启(qǐ)动(dòng)修(xiū)订(dìng)立(lì)项(xiàng),2025 年(nián) 10 月(yuè) 30 日(rì)召(zhào)开(kāi)评(píng)审(shěn)
全球智能视觉处理芯片龙头冲刺港交所:光环之下,何以冲破增长枷锁?
【导语】近日,智能视觉处理芯片龙头富瀚微递交港交所招股书,吹响“A+H”双上市号角。其虽在全球市场占据领先地位,但2022 - 2025年上半年营收、净利、毛利率均逐年下滑。不过,富瀚微注重研发创新,积极拓展AI新业务版图。此次赴港上市,能否助力其突破瓶颈、续写传奇,值得期待(dài)。 近(jìn)日(rì),智(zhì)能视觉处理芯片龙头富瀚微正式向港交所递交了招股书,吹响“
国家发改委等五部门:探索推动具身智能机器人进社区、进家庭,到 2027 年底建成 50 个以上全域数字化转型城市
【导语】10月31日,国家发展改革委等五部门发布《深化智慧城市发展推进全域数字化转型行动计划》,提出到2027年底建成50个以上全域数(shù)字(zì)化(huà)转(zhuǎn)型(xíng)城(chéng)市(shì),2035年(nián)涌(yǒng)现(xiàn)一(yī)批(pī)具(jù)有(yǒu)国(guó)际(jì)竞(jìng)争(zhēng)力(lì)的(de)现(xià
2025深圳安博会:大公博创揽三奖 低空安防技术引国内外媒体聚焦
【导语】2025年10月28日至31日,第二十届中国国际社会公共安全博览会在深圳启幕。成都大公博创信息技术有限(xiàn)公(gōng)司(sī)携(xié)全系(xì)列(liè)低(dī)空(kōng)安(ān)防(fáng)设(shè)备(bèi)参(cān)展(zhǎn),凭(píng)借(jiè)三(sān)项(xiàng)权(quán)威(wēi)大(dà)奖(jiǎng)、全栈(zh
【导语】中国电信率先公开展示业内首个“北斗语音消息”服务,首创 AI 算法实现语音极速传输;与此同时,华为也在第四届北斗峰会上发布相关功能,其手(shǒu)表(biǎo)成(chéng)首(shǒu)款(kuǎn)支(zhī)持(chí)终(zhōng)端(duān),北(běi)斗(dòu)应(yīng)用(yòng)再(zài)掀(xiān)新(xīn)篇(piān)。 据(jù