wan2.7-videoedit
阿里推出的 AI 视频编辑模型,支持以自然语言指令编辑视频,可参考图像替换视频元素
简介
wan2.7-videoedit 是阿里推出的视频编辑大模型,属于 wan2.7 系列的视频编辑分支。与传统视频编辑工具不同,用户只需用自然语言描述编辑意图(如”把视频里的女生换成图片里的女生,背景不变”),模型即可自动完成视频元素替换、风格迁移等操作。
该模型支持两种核心编辑模式:主体替换(将视频中的人物/物体替换为参考图片中的目标)和动作模仿(基于参考图片生成与源视频相同动作的新视频)。这两种能力使其在电商带货、虚拟试衣、创意内容等场景中具有直接的商业价值。
与 RunningHub 等工作流平台上的主体替换方案相比,wan2.7-videoedit 在处理速度上有显著优势——RunningHub 的工作流处理 13 秒视频需要约 20 分钟,而 wan2.7-videoedit 可在几分钟内完成同等时长的视频编辑。
关键信息
- 类型:AI 模型(视频编辑)
- 领域:AI 视频生成 / 电商 / 内容创作
- 开发商:阿里(Alibaba)
- 调用方式:API 异步调用(发送请求 + 轮询结果,分两步)
- 相关概念:VTON 虚拟试衣、豆包、阿里云百炼平台
核心特性
视频编辑能力
- 自然语言指令编辑:用白话描述编辑意图,模型自动理解并执行
- 图像参考替换:可参考提供的图片来替换视频中的元素
- 主体替换模式:将视频中的人物/物体替换为参考图片中的目标,保持背景和音乐不变
- 动作模仿模式:基于参考图片生成与源视频相同动作的新视频,可用于规避内容同质化
技术架构要求
- 异步调用流程:发送视频编辑请求和获取成品视频不在同一步骤,需分两步进行
- OSS 存储前置:本地文件需先上传到 OSS 对象存储桶,桶需设置为公共读
- 地址类型判断:需自动判断输入是在线地址还是本地地址,本地地址需先上传
不同素材中的观点
- 2026-06-13-ai-children-clothing-video-skill:作者在对比 RunningHub 主体替换工作流(13 秒视频跑 20 分钟)后选择 wan2.7-videoedit 作为技术底座,围绕其调用构建了高内聚低耦合的 Skill 架构。实测人物替换和动作模仿两种模式均可在几分钟内完成,成品视频质量满足电商带货需求。
实用信息
- 快速上手:
- 购买阿里云 OSS 并创建公共读桶
- 编写地址判断 + OSS 上传模块(如
oss_uploader.py) - 调用 wan2.7-videoedit API 发送编辑请求
- 轮询获取编辑完成的视频
- 适用场景:电商带货视频(童装/服装等需要人物展示的品类)、虚拟试衣展示、创意短视频制作
- 注意事项:异步流程需要设计重试和超时机制;本地文件必须先上传 OSS 才能被模型访问