将任意图片转为可复用的 AI 提示词,也可以一键换主题、保留原图风格。
Drop or select your image here Browse
PNG, JPG, JPEG, WebP · Up to 10MB
Keep the image's style, swap the subject/IP/text to a new theme.
No prompt generated yet
Upload an image and click Generate Prompt
上传任意图片 → 反推可复用的 prompt 模板 → 改写 Swap 提示里的短语(或直接填「新主题」)→ 得到同风格、不同主题的新图。


GPT-Image-2市面上大多数「图生 prompt」工具不管你粘贴到哪个模型,都给同一段通用描述。我们没这么做 —— 因为同一段 caption 在不同图像模型上生成出来的效果差距非常明显:每个模型训练时见过的 prompt 句式不同,针对 Midjourney 调过的 prompt 直接丢给 GPT-Image-2 通常会塌房,反过来也一样。
训练时偏好自然语言描述 + 显式构图说明。完整长句效果好,逗号分隔的 tag 串效果反而差。我们倾向于「A poster showing X in the style of Y, with Z arranged in the foreground」这种句式,并显式给出文字内容,比如「the headline reads: …」。
tag 风格 prompt,逗号分隔,配合 --ar / --style / --stylize 参数。我们会根据原图的宽高比自动追加 --ar,并避免完整英文句子(Midjourney 会降权 'a' / 'the' 这类冠词)。
偏好简洁自然语言(甜区约 30–80 token)。超过 ~150 token 的部分会被静默截断。它对摄影类提示词反应强烈('shot on …'、'85mm f/1.4'、'available light'),对插画类风格反应弱 —— 除非你显式说「illustration」或「flat vector」。
各有怪癖:Imagen 需要明确的主体位置说明,Seedream 在亚洲语言 typography 上比同行强,Sora 即便生成静态画面也需要带「the camera dollies in」这类镜头运动动词。我们针对每种各自调整。
你要粘贴到 Midjourney,就选 Midjourney —— 不要选「通用」。两种 prompt 的差距很大。
每段生成的 prompt 都标记了可替换短语(主体、IP、文字内容)。保留结构,替换这些占位 —— 你就能把一张满意的图当成模板,复用出十张同风格不同主题的新图。
把未修改的 prompt 直接粘回目标模型,对比生成结果和原图。如果重新生成的图在结构(构图、配色、文字位置)上接近,说明 prompt 抓到了正确特征。如果差距明显,源图大概率是边缘情况 —— 看下面的「限制」部分。