介绍一下阿里最新开源的视频生成模型:Wan2.2

2025 年7 月 28 日,阿里开源了一个先进的大规模视频生成模型 Wan2.2。作为 Wan 系列的重大升级,Wan2.2 在模型架构、数据训练、生成效率和美学质量上均实现了显著突破,旨在为学术界和工业界提供顶尖的视频生成能力。 Wan2.2 是一个功能强大的开源视频生成模型,其核心创新在于引入了高效的 MoE (混合专家) 架构,显著提升了模型容量而未增加计算成本。通过使用更大规模、更精细标注的训练数据,Wan2.2 在生成视频的动作复杂度和电影级美学质感方面达到了业界领先水平。此外,它还推出了一个高效的高清混合模型 TI2V-5B,该模型能在消费级显卡 (如 RTX 4090) 上运行,支持生成 720P 分辨率的视频,并兼顾了文生视频和图生视频功能,极大地降低了高质量视频生成的门槛。 1. 架构与技术创新 MoE (混合专家) 架构: Wan2.2 首次将 MoE 架构引入视频扩散模型。它设计了两个专家模型(高噪声专家和低噪声专家),分别处理去噪过程的不同阶段。这使得模型总参数量达到 27B,但每步推理时仅激活 14B 参数,从而在提升模型能力的同时保持了计算效率。 高效高清混合 TI2V 模型: Wan2.2 开源了一个 5B 参数的紧凑模型 TI2V-5B。该模型采用全新的 Wan2.2-VAE,实现了 4×16×16 的高压缩率,支持在 24GB 显存的消费级显卡上生成 720P、24fps 的高清视频,是目前速度最快的同类模型之一。 统一框架: TI2V-5B 模型在统一的框架内原生支持文生视频 (Text-to-Video) 和图生视频 (Image-to-Video) 两种任务。 2. 性能与质量提升 电影级美学: 模型使用了经过精心策划和详细标注(如光照、构图、色调等)的美学数据进行训练,使得生成的视频具有可控的电影级风格。 复杂动作生成: 与 Wan2.1 相比,Wan2.2 的训练数据量大幅增加(图像 +65.6%,视频 +83.2%),显著增强了模型在动作、语义和美学等多个维度的泛化能力,在 Wan-Bench 2.0 评测中表现优于顶尖的闭源商业模型。 提示词扩展: 支持使用 Dashscope API 或本地模型 (如 Qwen) 对用户输入的提示词进行扩展,以生成更丰富、更高质量的视频内容。 3....

July 29, 2025 · 1 min · fisherdaddy

单条视频获赞 230 万,从一条切“玻璃水果”的短视频在 TikTok 爆火谈谈如何获得 AI 视频的 Prompt

Google Veo3 一经发布就引起了广泛关注,它最大的特点是可生成带有音频的视频片段(例如街头的汽车噪音、鸟鸣、人物对话等),大幅超越当前所有的视频生成模型。正如 Google DeepMind 首席执行官 Demis Hassabis 所说:我们正在“走出视频生成的无声时代”。 最近一个 TikTok 用户用 Google Veo3 生成了一段“用刀切玻璃水果”的 ASMR(治愈系) 视频而爆红,目前播放量已破2300万,获赞230万。 有网友把这个博主上述所有的视频拼接成了一个视频,大家可以感受下治愈的声音和画质: Your browser does not support the video tag. 如何复刻 看完上面的你视频,你有可能非常好奇这个视频到底是如何制作的,有什么办法可以复刻出来。下面我来教大家一个方法: 第一步:把你想要复刻的视频下载到本地。(如果你不知道怎么下载,问下豆包之类的 AI 助手,实在不行用手机或电脑录屏也是个办法) 第二步:把该视频上传到 Google AI Studio,模型使用 Gemini 2.5 Pro。 如果该视频是个完整的一个场景的片段,输入 Prompt:“这个视频是由 AI 生成的,请帮我写出你认为最合适的能生成这个视频的的 Prompt”。 如果该视频是由多个切片视频组合而成,例如上述视频,可以输入这样的 Prompt:“这个视频是由 AI 生成的,请帮我写出你认为最合适的能生成这个视频的的 Prompt。注意,这个视频由多个视频拼接而成,AI 生成的视频最大 8s,请帮我给出每个视频切片对应的最佳 Prompt。” 第三步:从AI 给的一个或多个 Prompt 中选择你喜欢的,或者逐个尝试一下效果,如果不满意你可以继续追问来优化。我们看看对于上述视频,AI 给出的 Prompt 是什么: A video showing a sequence of actions in a cinematic close-up: First, a chef’s knife makes one perfect slice through a glass strawberry, and the slice falls onto a wooden board....

June 17, 2025 · 2 min · fisherdaddy