wan2.7-videoedit

阿里推出的 AI 视频编辑模型,支持以自然语言指令编辑视频,可参考图像替换视频元素

简介

wan2.7-videoedit 是阿里推出的视频编辑大模型,属于 wan2.7 系列的视频编辑分支。与传统视频编辑工具不同,用户只需用自然语言描述编辑意图(如”把视频里的女生换成图片里的女生,背景不变”),模型即可自动完成视频元素替换、风格迁移等操作。

该模型支持两种核心编辑模式:主体替换(将视频中的人物/物体替换为参考图片中的目标)和动作模仿(基于参考图片生成与源视频相同动作的新视频)。这两种能力使其在电商带货、虚拟试衣、创意内容等场景中具有直接的商业价值。

与 RunningHub 等工作流平台上的主体替换方案相比,wan2.7-videoedit 在处理速度上有显著优势——RunningHub 的工作流处理 13 秒视频需要约 20 分钟,而 wan2.7-videoedit 可在几分钟内完成同等时长的视频编辑。

关键信息

  • 类型:AI 模型(视频编辑)
  • 领域:AI 视频生成 / 电商 / 内容创作
  • 开发商:阿里(Alibaba)
  • 调用方式:API 异步调用(发送请求 + 轮询结果,分两步)
  • 相关概念VTON 虚拟试衣豆包阿里云百炼平台

核心特性

视频编辑能力

  • 自然语言指令编辑:用白话描述编辑意图,模型自动理解并执行
  • 图像参考替换:可参考提供的图片来替换视频中的元素
  • 主体替换模式:将视频中的人物/物体替换为参考图片中的目标,保持背景和音乐不变
  • 动作模仿模式:基于参考图片生成与源视频相同动作的新视频,可用于规避内容同质化

技术架构要求

  • 异步调用流程:发送视频编辑请求和获取成品视频不在同一步骤,需分两步进行
  • OSS 存储前置:本地文件需先上传到 OSS 对象存储桶,桶需设置为公共读
  • 地址类型判断:需自动判断输入是在线地址还是本地地址,本地地址需先上传

不同素材中的观点

  • 2026-06-13-ai-children-clothing-video-skill:作者在对比 RunningHub 主体替换工作流(13 秒视频跑 20 分钟)后选择 wan2.7-videoedit 作为技术底座,围绕其调用构建了高内聚低耦合的 Skill 架构。实测人物替换和动作模仿两种模式均可在几分钟内完成,成品视频质量满足电商带货需求。

实用信息

  • 快速上手
    1. 购买阿里云 OSS 并创建公共读桶
    2. 编写地址判断 + OSS 上传模块(如 oss_uploader.py
    3. 调用 wan2.7-videoedit API 发送编辑请求
    4. 轮询获取编辑完成的视频
  • 适用场景:电商带货视频(童装/服装等需要人物展示的品类)、虚拟试衣展示、创意短视频制作
  • 注意事项:异步流程需要设计重试和超时机制;本地文件必须先上传 OSS 才能被模型访问

相关页面