阿里巴巴开源视频生成与编辑模型通义万相 Wan2.1-VACE


【导(dǎo)语(yǔ)】据(jù)《科(kē)创(chuàng)板(bǎn)日(rì)报(bào)》报(bào)道(dào),阿(ā)里(lǐ)巴(ba)巴(ba)已(yǐ)正(zhèng)式(shì)开(kāi)源(yuán)通(tōng)义(yì)万(wàn)相(xiāng)Wan2.1-VACE视(shì)频(pín)生(shēng)成(chéng)与(yǔ)编(biān)辑(ji)模(mó)型(xíng)。该(gāi)模(mó)型支持文生视频、图像(xiàng)参(cān)考(kǎo)视(shì)频(pín)生(shēng)成(chéng)、视(shì)频(pín)编(biān)辑(ji)等(děng)多(duō)项(xiàng)功(gōng)能(néng),并(bìng)推(tuī)出(chū)1.3B和(hé)14B两(liǎng)个(gè)版(bǎn)本(běn),其(qí)中(zhōng)1.3B版(bǎn)本(běn)适(shì)配(pèi)消(xiāo)费(fèi)级(jí)显(xiǎn)卡(kǎ)。作(zuò)为(wèi)阿(ā)里(lǐ)云(yún)通(tōng)义(yì)系(xì)列(liè)AI大(dà)模(mó)型(xíng)的(de)一(yī)员(yuán),通义万相自2023年上线以来不断升级,最新2.1版在性能上实现大幅提升,尤其擅长处理复杂运动和还原真实物理规律。今年2月,阿里巴巴宣布全面开源该模型,为视频创作领域注入新活力。

  据《科创板日报》报道,阿里巴巴正式开源通义万相 Wan2.1-VACE,这是一款支持视频生成与编辑的模型,单一模型可同时支持文生(shēng)视(shì)频(pín)、图(tú)像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力。

据(jù)悉(xī),本(běn)次(cì)共(gòng)开(kāi)源(yuán) 1.3B 和(hé) 14B 两(liǎng)个(gè)版(bǎn)本(běn),其(qí)中(zhōng) 1.3B 版(bǎn)本(běn)可(kě)在(zài)消(xiāo)费(fèi)级(jí)显(xiǎn)卡(kǎ)运(yùn)行。

  据了解,通义万相是阿里云通义系列 AI 绘画创作大模型,可辅助人类进行图片创作,于 2023 年 7 月 7 日正式上线。在 2024 年 9 月 19 日的阿里云栖大会上,阿里发布了通义万相视频生成大模型。该模型可以生成影视级高清视频(pín),而(ér)且(qiě)更(gèng)能(néng)听(tīng)懂(dǒng)中(zhōng)国(guó)话(huà)。

  值(zhí)得(de)注(zhù)意(yì)的(de)是(shì),今(jīn)年(nián) 1 月(yuè)初(chū)通(tōng)义(yì)万(wàn)相(xiāng)视(shì)频(pín)生(shēng)成(chéng)模(mó)型(xíng)宣(xuān)布(bù)升(shēng)级(jí)至(zhì) 2.1 版(bǎn),模(mó)型(xíng)整(zhěng)体(tǐ)性(xìng)能(néng)大(dà)幅(fú)提(tí)升(shēng),尤(yóu)其(qí)是(shì)在(zài)处(chù)理(lǐ)复(fù)杂(zá)运(yùn)动、还原真实物理规律、提升电影质感及优化指令遵循方面取得了显著进展。2 月 25 日,阿里巴巴宣布全面开源旗下视频生成模型万相 2.1 模型。


相关新闻


今日科普|C919自动化装配难题

当你在机场看到国产大飞机C919优雅起降时,可能想不到它的“诞生过程”有多硬核——这架拥有6万多个✅零件、翼展35.8米的“钢铁巨兽”,其装配精度要控制在头发丝直径级别。更让人惊叹的是,沈阳中航沈飞民机工厂的自动化生产线,仅用6个关键零件就能创造年产值3亿元的奇迹。今天咱们就唠唠,C919在自动化装配路上啃下的五大“硬骨头”。第一块硬骨头:百万级制孔(kǒng)的(de)“针(zhēn)尖


今日科普|探秘自动化装配流程

想(xiǎng)象(xiàng)一(yī)下(xià),过(guò)去(qù)一(yī)条(tiáo)电(diàn)机(jī)装(zhuāng)配(pèi)线(xiàn)需(xū)要(yào)20名工(gōng)人(rén)轮(lún)班(bān)操(cāo)作(zuò),每(měi)天(tiān)最(zuì)多(duō)生(shēng)产(chǎn)500台(tái)电(diàn)机(jī);而


深圳市物联网产业协会成功举办《24小时自助图书馆通用规范》团体标准评审会

【导语】2019 年深圳市物联网产业协会发布的《24 小时自助图书馆通用规范》部分指标落后且引用文件有更新,不利行业发展。为此协(xié)会(huì)于(yú) 2024 年(nián) 11 月(yuè)启(qǐ)动(dòng)修(xiū)订(dìng)立(lì)项(xiàng),2025 年(nián) 10 月(yuè) 30 日(rì)召(zhào)开(kāi)评(píng)审(shěn)


全球智能视觉处理芯片龙头冲刺港交所:光环之下,何以冲破增长枷锁?

【导语】近日,智能视觉处理芯片龙头富瀚微递交港交所招股书,吹响“A+H”双上市号角。其虽在全球市场占据领先地位,但2022 - 2025年上半年营收、净利、毛利率均逐年下滑。不过,富瀚微注重研发创新,积极拓展AI新业务版图。此次赴港上市,能否助力其突破瓶颈、续写传奇,值得期待(dài)。   近(jìn)日(rì),智(zhì)能视觉处理芯片龙头富瀚微正式向港交所递交了招股书,吹响“


国家发改委等五部门:探索推动具身智能机器人进社区、进家庭,到 2027 年底建成 50 个以上全域数字化转型城市

【导语】10月31日,国家发展改革委等五部门发布《深化智慧城市发展推进全域数字化转型行动计划》,提出到2027年底建成50个以上全域数(shù)字(zì)化(huà)转(zhuǎn)型(xíng)城(chéng)市(shì),2035年(nián)涌(yǒng)现(xiàn)一(yī)批(pī)具(jù)有(yǒu)国(guó)际(jì)竞(jìng)争(zhēng)力(lì)的(de)现(xià


2025深圳安博会:大公博创揽三奖 低空安防技术引国内外媒体聚焦

【导语】2025年10月28日至31日,第二十届中国国际社会公共安全博览会在深圳启幕。成都大公博创信息技术有限(xiàn)公(gōng)司(sī)携(xié)全系(xì)列(liè)低(dī)空(kōng)安(ān)防(fáng)设(shè)备(bèi)参(cān)展(zhǎn),凭(píng)借(jiè)三(sān)项(xiàng)权(quán)威(wēi)大(dà)奖(jiǎng)、全栈(zh


业内首家:中国电信实现北斗语音消息服务

【导语】中国电信率先公开展示业内首个“北斗语音消息”服务,首创 AI 算法实现语音极速传输;与此同时,华为也在第四届北斗峰会上发布相关功能,其手(shǒu)表(biǎo)成(chéng)首(shǒu)款(kuǎn)支(zhī)持(chí)终(zhōng)端(duān),北(běi)斗(dòu)应(yīng)用(yòng)再(zài)掀(xiān)新(xīn)篇(piān)。 据(jù