Ready?發(fā)車!


1. 黃金法則①:任務(wù)定義先行——「一句話需求公式」

適用場景:文生圖 / 文生視頻 / 圖生視頻

公式

角色 + 場景 + 動(dòng)作 + 情緒 + 視覺風(fēng)格 + 技術(shù)參數(shù)

模板

作為一名[電影級(jí)分鏡師],請?jiān)赱賽博東京雨夜]中,讓[少女忍者]以[憂傷]的情緒[飛躍霓虹屋頂],整體[新海誠+賽博朋克]風(fēng)格,輸出[16:9, 4K, 24fps, ProRes 422]。

實(shí)戰(zhàn)案例

坑點(diǎn)警示


2. 黃金法則②:多模態(tài)上下文——把「圖」喂給「文」

適用場景:圖生圖 / 圖生視頻 / 風(fēng)格遷移

操作 3 步走

  1. 選一張「風(fēng)格參考圖」:Dribbble、Pinterest、Behance 均可。
  2. CLIP Interrogator 2.1 反推出文本:
    < https://huggingface.co/spaces/fffiloni/CLIP-Interrogator-2 >
    上傳圖片 → 得到「soft prompt」。
  3. 把 soft prompt 粘貼到 Stable Diffusion WebUI「positive prompt」欄,再加主體描述詞即可。

示例
原圖:吉卜力風(fēng)格《千與千尋》場景。
反推關(guān)鍵詞:

studio ghibli style, pastel color palette, hand-painted texture, dreamy atmosphere, 8k

再加主體:

a steampunk airship docking in the sky castle, in the style of studio ghibli

出圖即可保持吉卜力質(zhì)感,又帶蒸汽朋克元素。


3. 黃金法則③:結(jié)構(gòu)控制——ControlNet「三件套」

適用場景:人物姿勢 / 建筑線稿 / 產(chǎn)品三視圖

三件套 需求 模型 下載地址
姿勢控制 ControlNet OpenPose < https://huggingface.co/lllyasviel/ControlNet-v1-1 >
深度信息 ControlNet Depth 同上
邊緣線稿 ControlNet Canny 同上

工作流

  1. BlenderMagicPoser 擺好人物姿勢 → 渲染 OpenPose JSON。
  2. WebUI「ControlNet」欄上傳 JSON,勾選「Low VRAM」+「Pixel Perfect」。
  3. 正向提示詞只寫「服裝 + 情緒 + 光影」,姿勢交給 ControlNet,出圖一致性 ↑90%。

4. 黃金法則④:權(quán)重語法——「::」與「( )」的魔法

適用場景:Stable Diffusion / ComfyUI

語法速查表 符號(hào) 功能 示例
::n 權(quán)重乘 n sunset::1.5
(word:1.3) 動(dòng)態(tài)權(quán)重 (golden lighting:1.3)
[word] 弱化 [ugly]

實(shí)戰(zhàn)

a girl, (silver hair:1.2), (cyan eyes:1.3), wearing [hoodie], cyberpunk city, neon lights, depth of field

5. 黃金法則⑤:鏡頭語言——用「分鏡提示詞」做視頻

適用場景:Runway / Pika / AnimateDiff

分鏡模板

[鏡頭類型] + [運(yùn)動(dòng)軌跡] + [景別] + [主體動(dòng)作] + [轉(zhuǎn)場特效]

示例 1:長鏡頭

long take, dolly in slowly from wide shot to close-up, a lone samurai walking through bamboo forest, seamless transition to cherry blossom close-up

示例 2:手持 POV

handheld POV, running along Tokyo alley at night, neon signs flickering, motion blur 20%, quick whip pan transition to rooftop

工具


6. 黃金法則⑥:負(fù)向提示詞——用「NOT」思維避坑

適用場景:所有文生圖/視頻模型

通用負(fù)向詞表

lowres, blurry, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, deformed, long neck

進(jìn)階技巧


7. 黃金法則⑦:迭代壓縮——Prompt 的「A/B 測試」

適用場景:批量生產(chǎn) / 廣告投流

流程

  1. Prompt 版本管理
    Notion Database 建立「prompt_id / 正向 / 負(fù)向 / 采樣器 / 出圖鏈接 / 點(diǎn)贊率」字段。
  2. 自動(dòng)化測試
    ComfyUI Manager 的「Queue Prompt」API,循環(huán) 10 組溫度、CFG、步數(shù)組合。
  3. 數(shù)據(jù)回收
    把生成的 100 張圖丟進(jìn) Google Vision API ( < https://cloud.google.com/vision > ) 打標(biāo)簽,統(tǒng)計(jì)高頻詞云,反向優(yōu)化 prompt。

案例數(shù)據(jù)


8. 零代碼整合工作流——一條命令跑完全程

工具棧

步驟 工具名稱 使用方式
文案 ChatGPT-Vision 打開瀏覽器訪問 ChatGPT 官方站點(diǎn)即可
參考圖搜索 Lexica 輸入關(guān)鍵詞即可瀏覽百萬張 AI 參考圖
在線文生圖 Mage.Space 免費(fèi) GPU,直接在線運(yùn)行 Stable Diffusion
結(jié)構(gòu)控制 Hugging Face ControlNet Space 上傳骨骼圖或線稿即可實(shí)時(shí)出圖
視頻化 Runway Gen-4 注冊即用,支持圖生 4K 視頻
剪輯 & 字幕 CapCut Desktop 2025 官方商店一鍵安裝,模板商店豐富

一鍵啟動(dòng)腳本(Windows/Mac 通用)

# 1. 創(chuàng)建虛擬環(huán)境
python -m venv venv && source venv/bin/activate

# 2. 拉取 Forge 版本
git clone https://github.com/lllyasviel/Forge.git && cd Forge
pip install -r requirements.txt

# 3. 啟動(dòng)
python launch.py --xformers --api --cors-allow-origins=* --listen

瀏覽器打開 http://localhost:7860,上傳 ControlNet 骨骼圖 → 輸入黃金法則①公式 → 一鍵出圖 → 再丟進(jìn) ComfyUI AnimateDiff → 一鍵出視頻 → CapCut 套模板 → 導(dǎo)出 4K30,全程 30 分鐘


9. 彩蛋:3 個(gè) 2025 年即將爆火的新玩法

  1. 音頻驅(qū)動(dòng)唇形同步
    SadTalker 3.0 ( < https://github.com/OpenTalker/SadTalker > ) 已支持中文口型,上傳 10 秒音頻即可讓 AI 人物說話。
  2. 3D 姿勢轉(zhuǎn)視頻
    MoveNet + AnimateDiff 組合,讓 Blender 骨骼動(dòng)畫直接驅(qū)動(dòng)真人寫實(shí)視頻。
  3. 實(shí)時(shí) Prompt 協(xié)作
    PromptFlow ( < https://promptflow.io > ) 推出多人實(shí)時(shí)編輯 Prompt,像 Figma 一樣給提示詞加評(píng)論。

10. 結(jié)語:把 Prompt 變成印鈔機(jī)

“未來只有兩種創(chuàng)作者:會(huì)用多模態(tài) Prompt 的,和被淘汰的。”

把本文 7 大黃金法則收藏下來,每周抽 1 小時(shí)做一次「Prompt 迭代日」。
當(dāng)你能在 30 分鐘內(nèi)讓 AI 產(chǎn)出一條點(diǎn)贊 10w+ 的 4K 視頻,你的時(shí)間才真正開始值錢。

上一篇:

Google DeepMind發(fā)布 Genie 3 SDK安裝與避坑指南(含Docker鏡像)

下一篇:

零樣本 vs Few-shot 深度評(píng)估 2025:ICLR 最佳論文實(shí)驗(yàn)復(fù)現(xiàn)與賺錢級(jí)優(yōu)化筆記
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊

多API并行試用

數(shù)據(jù)驅(qū)動(dòng)選型,提升決策效率

查看全部API→
??

熱門場景實(shí)測,選對(duì)API

#AI文本生成大模型API

對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)

#AI深度推理大模型API

對(duì)比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)