视频反推提示词完整教程

从零开始到反推爆款视频,理解原理 + 上手实操。

这篇教程讲清 AI 视频反推 从原理到实操的全流程:把一条视频拆成结构化提示词,再喂给即梦、可灵等模型复刻。

读完你能独立反推抖音 / 小红书 / B站 上的爆款视频。适合 AI 视频玩家、电商运营、广告制作者。

想直接试?打开反推工具,粘贴链接即用。去反推

1. 什么是视频反推

「视频反推」指的是:给 AI 一条已有的视频,让它倒推出「能重新生成这条视频的提示词」。和你平时「写一句话让 AI 生成视频」的方向正好相反—— 正向是「文字 → 视频」,反推是「视频 → 文字(提示词)」。

背后靠的是多模态大模型:它会把视频逐帧的画面、镜头运动、人物动作,连同音轨里的台词一起「看懂」,再按一套固定模板,拆成机器能直接执行的结构化提示词。 promptvv 把一条视频拆成 事件简述 / 生图提示词 / 任务 / 分镜(Shot)/ 镜头与运镜 / 表演与台词 这几层,组合起来就是一份能喂回即梦、Seedance 复刻原片的脚本。

原视频AI 多模态理解结构化拆解可执行提示词即梦 / Seedance 生成

和「从零写提示词生成新视频」不同,反推的价值在于「有参照」:你已经看到一条满意的成片,只是不知道怎么用文字把它说清楚。 反推就是替你把这条成片翻译成模型能听懂的话,省去从零反复试错。

为什么非得「结构化」?因为模板套话(例如「一个很酷的人在城市里走」)信息量太低,模型只能瞎猜,生成结果飘忽。 把它拆成主体、场景、光线、运镜、时长、台词等明确字段,生成才稳定、可复刻。

适合谁:想复刻爆款的 AI 视频创作者、要快速产出商品 / 口播脚本的电商与广告团队、研究分镜与运镜的短剧与影视爱好者。

2. 反推工作流(5 步)

从打开工具到拿到能用的提示词,整套流程通常 1 分钟内走完:

  1. Step 1 选模型按视频语言 / 类型选反推模型(中文剧情选豆包,综合选最佳)。
  2. Step 2 上传视频粘贴抖音 / 小红书 / B站 链接,或上传本地视频文件。
  3. Step 3 看输出30 秒内得到结构化提示词(任务 / 分镜 / 镜头 / 表演 / 台词)。
  4. Step 4 多轮追问精修对识别不准的维度继续追问,prompt 越聊越贴。
  5. Step 5 选格式导出选输出格式(全能参考 / 首帧 / 首帧+参考),生成生图 + 视频提示词,喂给即梦 / Seedance / 可灵。

提示:单条视频是实时「边分析边吐字」的,你能看着提示词一段段生成;一次提交多条会进后台队列处理,处理完出现在你的历史记录里。

3. 看懂输出:一条 prompt 的结构

反推结果不是一段大白话,而是分层结构。理解每一层,你才知道哪里不准、该怎么追问。

  • 事件简述:最顶部,一行一个事件、按时间顺序列全整条视频发生了什么,先让你一眼看懂剧情。
  • 生图提示词(场景 / 角色 / 道具):把画面里要用到的素材分门别类各出一段。每段都以「生成图片,4K 高清」开头, 比例按画幅自动判断——竖屏给 9:16、横屏给 16:9。
  • 任务 + 分镜(Shot):这是核心。视频超过 15 秒会自动拆成多个「生成任务」(因为 Seedance 单段生成有时长上限); 15 秒以内、且场景没整段更换的就不拆。每个任务下面是它自己的分镜 Shot,逐镜标注景别、运镜、时长、动作与台词。
  • 时间轴:每个任务的时间轴都从 00:00 重新开始(对应即梦 / Seedance 一次只生成一段), 而 Shot 编号全局连续,方便你对位。
  • 起始关键帧:选「全能参考」格式会写明起始关键帧;选「首帧」格式则把首帧图单独拆出来,不在视频段里重复。
  • 消除歧义:结尾补一段对模型容易误解处的额外说明。

举个例子,一个 Shot 在结果里大致长这样(简化):

Shot 3 | 近景 | 时长 3s | 运镜:缓慢推近
动作:橘猫长官眼含泪光,抬手下令
台词:(沉痛、低沉)「开炮」

读懂这套分层后,遇到「某个镜头不对」就能精准定位——是 Shot 的运镜标错了、还是某个角色的生图提示词漏了特征——再用多轮追问只改那一处,而不必整条重来。

4. 提示词优化技巧

  • 加场景细节:把「一个人在跳舞」改成「暖光棚内,女生穿白色连衣裙做卡点舞,镜头随节拍推拉」—— 主体、光线、动作、运镜都补上,生成效果立刻不同。
  • 钉死角色一致性:多镜头、多任务时给每个角色固定一套外观描述(发型、服装、配饰),避免模型每段「换脸」。
  • 用准运镜术语:推、拉、摇、移、跟、升降——把镜头怎么动写明白,比「动感镜头」有效得多。
  • 尊重 15 秒分镜:长视频本就会被切成多段,写提示词时按 15 秒以内一段来组织动作,生成更连贯。
  • 注意图片比例:竖屏短视频用 9:16、横屏用 16:9,比例错了构图会被裁。
  • 多轮追问要具体:别笼统说「不准」,要指到具体维度——「第 2 个 Shot 应是跟拍不是推镜」「主角衣服是红色不是蓝色」,模型才能精准改。
  • 源视频尽量清晰:糊画质、强滤镜会让画面与台词识别变难;链接解析失败时,下载原画质再用本地上传,结果更稳。

5. 选对视频类型

提交前可以选「视频类型」。选对了,提示词会按该类视频的重点来拆;拿不准就用默认的「智能判断」,让 AI 自己从画面判断属哪类。一共 7 种:

  • 智能判断(默认):不确定时用它,AI 自动判别属短视频 / 跳舞 / 带货等并套对应规则,基调偏「短视频」。
  • 短视频:节奏快、信息密度高、前几秒抓人,适合大多数抖音 / 小红书内容。
  • 跳舞:强化动作分解、节拍(卡点)对齐,运镜偏环绕 / 跟 / 升降,适合翻跳与卡点舞。
  • 带货:区分纯产品展示与真人出镜,口播台词用中文保留,按卖点上字幕,适合商品 / 口播视频。
  • 剧本 / 短剧:侧重台词、情绪弧线、多角色对手戏,表演组体现人物关系张力,适合剧情号。
  • 动漫:按动画的造型风格与镜头语言来拆。

选错也不致命——重选类型重跑,或用多轮追问把侧重点掰回来即可。

6. 即梦 / Seedance / 可灵 适配

同一条视频,喂给不同模型 / 不同模式,需要的提示词形态不一样。promptvv 在「输出格式」里给了三种,按目标模型选:

输出格式给什么适配
全能参考场景 / 角色 / 道具 生图提示词 + 视频提示词,一次给齐即梦全能参考、可灵等通用流程
首帧拆成「首帧图 prompt」+「视频运动 prompt」两段即梦首帧模式(先定首帧图,再生成运动)
首帧 + 参考首帧图 + 参考图 + 视频提示词,控图最细对画面一致性要求高的场景

即梦 / Seedance(字节系)是直接适配的,生成格式拿来即用;可灵等其它模型没有专属优化,但反推出的结构是通用的,套用同样能参考。

7. 真实案例拆解

拿首页案例「古风战争 · 拟人动物短片」来看反推是怎么一层层拆的(完整可播放视频 + 完整 prompt 在首页案例区):

  1. ① 事件简述 先把整条片子的事件按时间顺序列全——从「三花猫被绑上城墙」「橘猫长官指挥猫咪士兵备战」到「火箭炮击中城墙、橘猫长官红着眼继续挥炮」,十来个事件一行一条,剧情一眼看懂,也方便你核对有没有漏。
  2. ② 任务拆分 这条约 23 秒、超过 15 秒,于是自动拆成两个生成任务,断点选在适合分段处,保证每段都落在 Seedance 的单段时长内。
  3. ③ 分镜 Shot 每个任务下逐镜写:景别(近景 / 全景)、运镜(推 / 摇 / 跟)、该镜时长、人物动作,以及对应时间点的台词与音效;Shot 编号全局连续,每个任务的时间轴各自从 00:00 起。
  4. ④ 生图提示词 画面里反复出现的城墙战场、各角色(三花猫、橘猫长官、柴犬士兵)、关键道具(火炮、绳子)各出一段独立的生图提示词,竖屏自动给 9:16——先把素材图生出来,再拿去做视频。

把这四层拼起来,就是一份能喂回即梦复刻这条视频的完整脚本。 ▶ 看这条视频和它的完整 prompt。另外两条(奇幻冒险 · 巨龙与王子 / 武侠搞笑 · 宗师与猫)同样在首页案例区,可直接复制 prompt 套用。

套到你自己的视频也是同一套路:先看事件简述对不对、再逐个任务核 Shot 的运镜与时长、最后检查角色与道具的生图提示词有没有抓住关键特征;哪一层不对就只针对那一层追问,比整条重来高效得多。

8. 常见问题

反推不准怎么办? 切换反推模型或视频类型,再用多轮追问——别笼统说「不准」,要指到具体 Shot 或维度(如「第 2 个镜头应是跟拍不是推镜」),模型才能精准改。

抖音视频解析失败怎么办? 平台偶尔会风控,导致链接解析失败。此时把视频下载到本地,再用「上传文件」即可,结果一样。

支持哪些平台的视频链接? 抖音、小红书、B站 可直接粘贴自动解析;YouTube、TikTok、快手 暂不支持直接解析,下载后用本地上传。

支持多长的视频? 建议 30 分钟以内。视频越长,分析准确度和速度都会下降;超过 15 秒会自动拆成多个生成任务。

反推一次要多久? 通常 30 秒内出结构化结果(不含视频下载时间);单条是实时边分析边吐字,能看着提示词一段段生成。

我的视频会被长期保存吗? 不会。视频只用于本次反推分析,完成后即从服务器删除;只有反推出的文本结果会存进你的历史记录。

要花钱吗? 注册即赠 30 秒免费额度可先试;之后按视频实际时长计费、成功才扣,多轮追问每轮扣少量时长。详见定价页。