Image to Prompt

将任意图片转为可复用的 AI 提示词,也可以一键换主题、保留原图风格。

Image to Prompt Generator

Drop or select your image here Browse

PNG, JPG, JPEG, WebP · Up to 10MB

Keep the image's style, swap the subject/IP/text to a new theme.

Generated Prompt

No prompt generated yet

Upload an image and click Generate Prompt

案例展示

上传任意图片 → 反推可复用的 prompt 模板 → 改写 Swap 提示里的短语(或直接填「新主题」)→ 得到同风格、不同主题的新图。

《西游记》海报 — 孙悟空侧脸剪影,轮廓内嵌套多层叙事场景
原图
《三国演义》主题重混 — 诸葛亮剪影,由改写后的 prompt 喂给 GPT-Image-2 生成
换主题 → 三国演义
原图换主题 → "三国演义"目标模型: GPT-Image-2

为什么不同目标模型给的 prompt 长得不一样

市面上大多数「图生 prompt」工具不管你粘贴到哪个模型,都给同一段通用描述。我们没这么做 —— 因为同一段 caption 在不同图像模型上生成出来的效果差距非常明显:每个模型训练时见过的 prompt 句式不同,针对 Midjourney 调过的 prompt 直接丢给 GPT-Image-2 通常会塌房,反过来也一样。

GPT-Image-2

训练时偏好自然语言描述 + 显式构图说明。完整长句效果好,逗号分隔的 tag 串效果反而差。我们倾向于「A poster showing X in the style of Y, with Z arranged in the foreground」这种句式,并显式给出文字内容,比如「the headline reads: …」。

Midjourney v7

tag 风格 prompt,逗号分隔,配合 --ar / --style / --stylize 参数。我们会根据原图的宽高比自动追加 --ar,并避免完整英文句子(Midjourney 会降权 'a' / 'the' 这类冠词)。

FLUX (1.1 / Pro / Dev)

偏好简洁自然语言(甜区约 30–80 token)。超过 ~150 token 的部分会被静默截断。它对摄影类提示词反应强烈('shot on …'、'85mm f/1.4'、'available light'),对插画类风格反应弱 —— 除非你显式说「illustration」或「flat vector」。

Nano Banana / Imagen / Seedream / Sora

各有怪癖:Imagen 需要明确的主体位置说明,Seedream 在亚洲语言 typography 上比同行强,Sora 即便生成静态画面也需要带「the camera dollies in」这类镜头运动动词。我们针对每种各自调整。

怎么用这个 prompt 才有效

  1. 1. 选对目标模型

    你要粘贴到 Midjourney,就选 Midjourney —— 不要选「通用」。两种 prompt 的差距很大。

  2. 2. 用 swap 提示替换,而不是原样使用

    每段生成的 prompt 都标记了可替换短语(主体、IP、文字内容)。保留结构,替换这些占位 —— 你就能把一张满意的图当成模板,复用出十张同风格不同主题的新图。

  3. 3. 把 prompt 粘回去验证

    把未修改的 prompt 直接粘回目标模型,对比生成结果和原图。如果重新生成的图在结构(构图、配色、文字位置)上接近,说明 prompt 抓到了正确特征。如果差距明显,源图大概率是边缘情况 —— 看下面的「限制」部分。

这个工具搞不定的场景

常见问题