
开端:证券时报开云(中国)Kaiyun·官方网站登录入口
大模子开源,“卷”到了视频规模。
2月25日晚,阿里巴巴文书全面开源旗下视频生成模子万相2.1模子。据先容,通义万相2.1模子基于Apache2.0契约,14B和1.3B两个参数规格的一都推理代码和权重一都开源,同期撑抓文生视频和图生视频任务,大家设立者可在Github、HuggingFace和魔搭社区下载体验。
通义万相是阿里云通义系列AI绘图创作大模子,可援救东说念主类进行图片创作,于2023年7月7日负责上线。在2024年9月19日的阿里云栖大会上,阿里发布了通义万相视频生成大模子。该模子不错生成影视级高清视频,而况更能听懂中国话,被外界称为“最懂中国风”的视频大模子。
值得防御的是,就在本年1月初,通义万相视频生成模子文书重磅升级至2.1版,模子全体性能大幅擢升,尤其是在搞定复杂通顺、规复信得过物理限定、擢升电影质感及优化提示解雇方面得到了显赫进展。通义万相2.1推出后,凭借着优秀的发达,在泰斗评测榜单VBench中登上榜首。
伸开剩余69%据了解,VBench是视频生陋习模的泰斗评测集,它一共有16个评分维度,从全体一致性、动作清醒度、画面安祥性等方濒临模子进行全见解评估。VBench榜单深入,通义万相在通顺幅度、多对象生成、空间干系等要道智商上拿下最高分,并以总分84.7%的收获斩获第一。这意味着,通义万相是国内乃至大家视频生成模子的领跑者。
具体阿里通义团队先容,通义万相2.1模子在图像生成和视频生成两大智商上均有显赫擢升。在视频生成方面,通过自研的高效VAE和DiT架构,增强了时空险峻文建模智商,可撑抓无穷长1080P视频的高效编解码,并在笔墨视频生成上扫尾了突破,成为首个撑抓华文笔墨生成智商、且同期撑抓中英文笔墨殊效生成的视频生成模子,可得志告白诡计、短视频等规模的创作需求。
凭证阿里展示的案例,当用户输入:“以红色新年宣纸为配景,出现一滴水墨,晕染墨汁逐渐晕染开来。笔墨的笔画边际依稀且当然,跟着晕染的进行,水墨在纸上呈现‘福’字,墨色从深到浅过渡,呈现出独到的东方韵味。配景高档精真金不怕火,杂志照相感”的提示时,通义万相2.1模子不错凭证条目,输出具有中国本性及浓郁的新年作风的视频素材,糜掷东方韵味。
由于“最懂中国风”,通义万相模子在蛇年春晚上也说明了蹙迫作用。举例,在春晚每年的保留节目《记起今宵》中,舞台配景中变身为秀好意思花灯的城市地标,恰是由通义万相图像裁剪模子Wanx-ACE生成。另外,在莫文蔚与毛不易齐唱的《岁月里的花》节目中,阿里通义万相哄骗图像作风化和首尾帧视频生成手艺,生成了千里浸式的油画风舞好意思后果,为不雅众呈现了一场秀好意思的视觉盛宴。
业内东说念主士分析称,2024年春节前后,OpenAI凭借Sora在视频生陋习模激发飞扬,让视频生成成为各大AI厂商竞相追赶的焦点。而2025年春节,阿里通义万相则展示了视频生成手艺令东说念主防卫标显赫跳动,引颈着视频大模子规模接续迅速上前发展。
现时,DeepSeek正以绽开的姿态参与重构大家AI生态神志,并给大模子开源社区注入了极强的信心与能源。2月24日,DeepSeek负责启动“开源周”,商量5天每天开源一个代码库,眩惑了大家设立者极大存眷。在开源公告中,DeepSeek还默示,我方仅仅探索通用东说念主工智能的小公司,看成开源社区的一部分,每共享一排代码,都会成为加快AI行业发展的集体能源。
在DeepSeek的带动下,越来越多的AI厂商运行拥抱开源。阿里巴巴这次开源旗下视频生成模子万相2.1模子,符号着开源的界限正从大讲话模子规模推广至图像、视频等多模态大模子规模开云(中国)Kaiyun·官方网站登录入口,有助于冲突手艺壁垒,让更多的设立者和照料东说念主员好像共同参与到AI立异的进度中来。
发布于:广东省Powered by Kaiyun「中国大陆」官方网站-门户网站/登录网址 @2013-2022 RSS地图 HTML地图