视频反推提示词完整教程

从零开始到反推爆款视频，理解原理 + 上手实操。

这篇教程讲清 AI 视频反推 从原理到实操的全流程：把一条视频拆成结构化提示词，再喂给即梦、可灵等模型复刻。

读完你能独立反推抖音 / 小红书 / B站上的爆款视频。适合 AI 视频玩家、电商运营、广告制作者。

想直接试？打开反推工具，粘贴链接即用。去反推

1. 什么是视频反推

「视频反推」指的是：给 AI 一条已有的视频，让它倒推出「能重新生成这条视频的提示词」。和你平时「写一句话让 AI 生成视频」的方向正好相反—— 正向是「文字 → 视频」，反推是「视频 → 文字（提示词）」。

背后靠的是多模态大模型：它会把视频逐帧的画面、镜头运动、人物动作，连同音轨里的台词一起「看懂」，再按一套固定模板，拆成机器能直接执行的结构化提示词。 promptvv 把一条视频拆成 事件简述 / 生图提示词 / 任务 / 分镜（Shot）/ 镜头与运镜 / 表演与台词 这几层，组合起来就是一份能喂回即梦、Seedance 复刻原片的脚本。

原视频→AI 多模态理解→结构化拆解→可执行提示词→即梦 / Seedance 生成

和「从零写提示词生成新视频」不同，反推的价值在于「有参照」：你已经看到一条满意的成片，只是不知道怎么用文字把它说清楚。反推就是替你把这条成片翻译成模型能听懂的话，省去从零反复试错。

为什么非得「结构化」？因为模板套话（例如「一个很酷的人在城市里走」）信息量太低，模型只能瞎猜，生成结果飘忽。把它拆成主体、场景、光线、运镜、时长、台词等明确字段，生成才稳定、可复刻。

适合谁：想复刻爆款的 AI 视频创作者、要快速产出商品 / 口播脚本的电商与广告团队、研究分镜与运镜的短剧与影视爱好者。

2. 反推工作流（5 步）

从打开工具到拿到能用的提示词，整套流程通常 1 分钟内走完：

Step 1 选模型：按视频语言 / 类型选反推模型（中文剧情选豆包，综合选最佳）。
Step 2 上传视频：粘贴抖音 / 小红书 / B站链接，或上传本地视频文件。
Step 3 看输出：30 秒内得到结构化提示词（任务 / 分镜 / 镜头 / 表演 / 台词）。
Step 4 多轮追问精修：对识别不准的维度继续追问，prompt 越聊越贴。
Step 5 选格式导出：选输出格式（全能参考 / 首帧 / 首帧+参考），生成生图 + 视频提示词，喂给即梦 / Seedance / 可灵。

提示：单条视频是实时「边分析边吐字」的，你能看着提示词一段段生成；一次提交多条会进后台队列处理，处理完出现在你的历史记录里。

3. 看懂输出：一条 prompt 的结构

反推结果不是一段大白话，而是分层结构。理解每一层，你才知道哪里不准、该怎么追问。

事件简述：最顶部，一行一个事件、按时间顺序列全整条视频发生了什么，先让你一眼看懂剧情。
生图提示词（场景 / 角色 / 道具）：把画面里要用到的素材分门别类各出一段。每段都以「生成图片，4K 高清」开头，比例按画幅自动判断——竖屏给 9:16、横屏给 16:9。
任务 + 分镜（Shot）：这是核心。视频超过 15 秒会自动拆成多个「生成任务」（因为 Seedance 单段生成有时长上限）； 15 秒以内、且场景没整段更换的就不拆。每个任务下面是它自己的分镜 Shot，逐镜标注景别、运镜、时长、动作与台词。
时间轴：每个任务的时间轴都从 00:00 重新开始（对应即梦 / Seedance 一次只生成一段），而 Shot 编号全局连续，方便你对位。
起始关键帧：选「全能参考」格式会写明起始关键帧；选「首帧」格式则把首帧图单独拆出来，不在视频段里重复。
消除歧义：结尾补一段对模型容易误解处的额外说明。

举个例子，一个 Shot 在结果里大致长这样（简化）：

Shot 3 ｜近景｜时长 3s ｜运镜：缓慢推近
动作：橘猫长官眼含泪光，抬手下令
台词：（沉痛、低沉）「开炮」

读懂这套分层后，遇到「某个镜头不对」就能精准定位——是 Shot 的运镜标错了、还是某个角色的生图提示词漏了特征——再用多轮追问只改那一处，而不必整条重来。

4. 提示词优化技巧

加场景细节：把「一个人在跳舞」改成「暖光棚内，女生穿白色连衣裙做卡点舞，镜头随节拍推拉」—— 主体、光线、动作、运镜都补上，生成效果立刻不同。
钉死角色一致性：多镜头、多任务时给每个角色固定一套外观描述（发型、服装、配饰），避免模型每段「换脸」。
用准运镜术语：推、拉、摇、移、跟、升降——把镜头怎么动写明白，比「动感镜头」有效得多。
尊重 15 秒分镜：长视频本就会被切成多段，写提示词时按 15 秒以内一段来组织动作，生成更连贯。
注意图片比例：竖屏短视频用 9:16、横屏用 16:9，比例错了构图会被裁。
多轮追问要具体：别笼统说「不准」，要指到具体维度——「第 2 个 Shot 应是跟拍不是推镜」「主角衣服是红色不是蓝色」，模型才能精准改。
源视频尽量清晰：糊画质、强滤镜会让画面与台词识别变难；链接解析失败时，下载原画质再用本地上传，结果更稳。

5. 选对视频类型

提交前可以选「视频类型」。选对了，提示词会按该类视频的重点来拆；拿不准就用默认的「智能判断」，让 AI 自己从画面判断属哪类。一共 7 种：

智能判断（默认）：不确定时用它，AI 自动判别属短视频 / 跳舞 / 带货等并套对应规则，基调偏「短视频」。
短视频：节奏快、信息密度高、前几秒抓人，适合大多数抖音 / 小红书内容。
跳舞：强化动作分解、节拍（卡点）对齐，运镜偏环绕 / 跟 / 升降，适合翻跳与卡点舞。
带货：区分纯产品展示与真人出镜，口播台词用中文保留，按卖点上字幕，适合商品 / 口播视频。
剧本 / 短剧：侧重台词、情绪弧线、多角色对手戏，表演组体现人物关系张力，适合剧情号。
动漫：按动画的造型风格与镜头语言来拆。

选错也不致命——重选类型重跑，或用多轮追问把侧重点掰回来即可。

6. 即梦 / Seedance / 可灵适配

同一条视频，喂给不同模型 / 不同模式，需要的提示词形态不一样。promptvv 在「输出格式」里给了三种，按目标模型选：

输出格式	给什么	适配
全能参考	场景 / 角色 / 道具生图提示词 + 视频提示词，一次给齐	即梦全能参考、可灵等通用流程
首帧	拆成「首帧图 prompt」+「视频运动 prompt」两段	即梦首帧模式（先定首帧图，再生成运动）
首帧 + 参考	首帧图 + 参考图 + 视频提示词，控图最细	对画面一致性要求高的场景

即梦 / Seedance（字节系）是直接适配的，生成格式拿来即用；可灵等其它模型没有专属优化，但反推出的结构是通用的，套用同样能参考。

7. 真实案例拆解

拿首页案例「古风战争 · 拟人动物短片」来看反推是怎么一层层拆的（完整可播放视频 + 完整 prompt 在首页案例区）：

① 事件简述 先把整条片子的事件按时间顺序列全——从「三花猫被绑上城墙」「橘猫长官指挥猫咪士兵备战」到「火箭炮击中城墙、橘猫长官红着眼继续挥炮」，十来个事件一行一条，剧情一眼看懂，也方便你核对有没有漏。
② 任务拆分 这条约 23 秒、超过 15 秒，于是自动拆成两个生成任务，断点选在适合分段处，保证每段都落在 Seedance 的单段时长内。
③ 分镜 Shot 每个任务下逐镜写：景别（近景 / 全景）、运镜（推 / 摇 / 跟）、该镜时长、人物动作，以及对应时间点的台词与音效；Shot 编号全局连续，每个任务的时间轴各自从 00:00 起。
④ 生图提示词 画面里反复出现的城墙战场、各角色（三花猫、橘猫长官、柴犬士兵）、关键道具（火炮、绳子）各出一段独立的生图提示词，竖屏自动给 9:16——先把素材图生出来，再拿去做视频。

把这四层拼起来，就是一份能喂回即梦复刻这条视频的完整脚本。 ▶ 看这条视频和它的完整 prompt。另外两条（奇幻冒险 · 巨龙与王子 / 武侠搞笑 · 宗师与猫）同样在首页案例区，可直接复制 prompt 套用。

套到你自己的视频也是同一套路：先看事件简述对不对、再逐个任务核 Shot 的运镜与时长、最后检查角色与道具的生图提示词有没有抓住关键特征；哪一层不对就只针对那一层追问，比整条重来高效得多。

8. 常见问题

反推不准怎么办？ 切换反推模型或视频类型，再用多轮追问——别笼统说「不准」，要指到具体 Shot 或维度（如「第 2 个镜头应是跟拍不是推镜」），模型才能精准改。

抖音视频解析失败怎么办？ 平台偶尔会风控，导致链接解析失败。此时把视频下载到本地，再用「上传文件」即可，结果一样。

支持哪些平台的视频链接？ 抖音、小红书、B站可直接粘贴自动解析；YouTube、TikTok、快手暂不支持直接解析，下载后用本地上传。

支持多长的视频？ 建议 30 分钟以内。视频越长，分析准确度和速度都会下降；超过 15 秒会自动拆成多个生成任务。

反推一次要多久？ 通常 30 秒内出结构化结果（不含视频下载时间）；单条是实时边分析边吐字，能看着提示词一段段生成。

我的视频会被长期保存吗？ 不会。视频只用于本次反推分析，完成后即从服务器删除；只有反推出的文本结果会存进你的历史记录。

要花钱吗？ 注册即赠 1 分钟免费额度可先试；之后按视频实际时长计费、成功才扣，多轮追问每轮扣少量时长。详见定价页。