GPT Image 2

4天前发布 4 0 0

GPT Image 2 是 ChatGPT Plus 内置的最新图片生成模型,核心突破是“对话式逐步改图”——你说怎么改它就怎么改。本文深度评测其指令遵循能力、艺术表现、真实优缺点,并提供从零到精通的完整教程。适合已经订阅或考虑订阅 ChatGPT Plus 的设计师、运营和创作者。

收录时间:
2026-06-14
GPT Image 2GPT Image 2

GPT Image 2:我终于可以像跟设计师聊天一样,让AI改图了

> 一个被 Midjourney 折磨了半年的用户,在 ChatGPT 里找到了“控图”的爽感。

一、我被 Midjourney 逼疯的那些瞬间

用 Midjourney 一年多了,水平不算差,但有一件事始终让我抓狂:改图。

上周做一张活动海报,AI 生了一张很棒的底图——光影、构图、情绪都在线。唯一的问题是,海报标题需要的“SALE”三个字母,它写成了“SAL3”。就这么一个小问题,我重新跑了十几轮,改提示词、调权重、换参考图……最后花了四十分钟,出来的不是字母错了就是画面崩了。我认输,老老实实导进 PS 把“3”改回“E”。

类似的场景太多了:衣服颜色不对、背景里多了一棵多余的树、人物表情太冷……每次都是一个“小问题”导致整张图废掉,或者重新跑几十次靠运气修正。

直到上个月,我在 ChatGPT Plus 里试了 GPT Image 2。一开始没抱希望,毕竟被“画得好但改不了”折磨太久了。但用了两天,我服了。

二、它到底强在哪?不是画得更美,是“听人话”

1. 对话式改图:就像你在指挥一个设计师

我扔了一张之前用 MJ 生成的“穿红裙子的女孩站在海边”的图(AI 画的,不是真人照片)。然后我在同一个对话里说:“把裙子颜色改成深蓝色,保留裙摆的褶皱纹理。”

三秒钟后,图出来了。红裙子变成了蓝裙子,褶皱、光影、甚至海面的反光都随着颜色变化做了适配。背景没变,女孩的姿势没变,发色没变——只改了裙子。

那一刻我差点从椅子上跳起来。这在以前是不可能的。Midjourney 的图生图或重绘,本质上是“根据原图和新提示重新生成一张相似的图”,而不是“在原有图上精准修改”。你会得到一张“大概类似”的图,但细节全是新的。

GPT Image 2 的做法不同。它是在 理解画面内容 的基础上,只修改你指定的部分。这种体验上的差异,就像是你跟一个真人设计师说“这里改一下”,而不是“你重新画一张,但跟之前那张差不多”。

2. 多指令一起改:连说三个要求它都记得住

我又试了一个更变态的:“在刚才那张蓝裙子女孩的图里,把背景从海边改成秋天的银杏林,人物的光线也要变成傍晚的金色逆光,然后在右上角加一行手写体小字‘Autumn Dream’。”

一个指令里包含了三个完全不同的修改:换背景、改光照、加文字。GPT Image 2 生成的结果里,三件事都做到了。银杏林的色调、树叶的模糊层次、逆光打在头发上的金色轮廓、手写体的位置和透明度……全部符合。

我当时觉得,这已经不是“工具”了,这是“一个听得懂人话、还能同时处理多件事的助理”。

3. 迭代式创作:从粗糙到精细,全程在聊天里完成

以往的工作流:Midjourney 出图 → 不满意 → 改 Prompt → 重新生成 → 又不满意 → 换 SD 加 ControlNet → 再调……工具换来换去,对话历史碎片化。

现在我用 GPT Image 2 做一张海报的流程是这样的:
– 我:“帮我生成一张护肤品的推广海报,中央是一瓶精华,背景是清晨的阳光透过白色窗帘,柔和温暖。”
– AI 出图后我看了说:“瓶身有点暗,把高光提亮一点,玻璃质感再通透些。”
– 改了之后我再说:“背景加一点虚化的绿叶,增加自然感,但不要抢了瓶身的视觉中心。”
– 继续:“在图片底部加一行字‘源自纯净自然’,灰色细线字体,居中。”
– 最后:“帮我把整张图的色温调暖一点点,现在稍微偏冷。”

每一步都是在上一张图的基础上微调。我不用重新写一段冗长的 Prompt 从头生成,也不用担心改了这里那里又变了。 最终成品的质量,是我和 AI 聊了七八句话“磨”出来的。

这种创作体验,是革命性的。

三、但别急着吹——它的短板也很真实

1. 艺术感不如 Midjourney

这是个绕不开的坎。GPT Image 2 生成的图“正确、准确、听话”,但就“惊艳”程度而言,Midjourney V6/V7 在色彩情绪、光影氛围、风格化上的上限确实更高。

我拿同一个 Prompt——“一个孤独的宇航员坐在月球上,地球在远方,极简主义,电影感”——在两边生成。Midjourney 给的图有一种“叙事感”,像是电影截图,情绪很浓。GPT Image 2 给的图也很漂亮,但更“干净”、更“正确”,少了一点说不清的灵气。

所以我现在的做法是:追求艺术感、不确定性的探索用 MJ;追求精准控制、需要反复修改的商业用途用 GPT Image 2。 两个不冲突,各司其职。

2. 复杂的局部修改偶尔会翻车

虽然大部分时候很准,但我也遇到过几次“假装没听见”的情况。比如有一次我说“把图中左下角那个小石头去掉”,它没去,反而把旁边的草变多了。再发一次“只去掉石头,其他完全不变”,这次对了。

这说明它的指令遵循度虽然很高,但不是 100%。复杂场景下,需要用非常明确、甚至有点“啰嗦”的语言框定范围。

3. 需要 ChatGPT Plus 订阅,免费用户无缘

GPT Image 2 是 Plus 专属功能。每月 20 美元,如果你本来就订阅了 Plus 那没问题;如果只是偶尔用一下,专门为它花这个钱可能不值。国内用户还需要科学上网,又是一层门槛。

4. 每天生成次数有限制

虽然官方没有明确说每日限额,但我试过一天高强度用了三十多次,后来提示“生成请求过于频繁,请稍后再试”。对普通用户够用,但职业设计师重度使用时可能会被卡。

四、手把手教程:从零到改出一张满意的图

第1步:确保你在 ChatGPT Plus 里

打开 chat.openai.com,确认右上角是 “ChatGPT Plus”。免费版不支持 GPT Image 2,别想了。

第2步:开始一个对话,上传或描述初稿

方式一:直接描述生成
> “生成一张图:一个年轻女性坐在咖啡馆窗边,穿白色衬衫,面前有一杯拿铁,阳光从左边打进来。”

方式二:上传已有图片
点击输入框左侧的“+”号,上传一张本地图片,然后说“帮我把这张图里的[某样东西]改成[新样子]”。

第3步:用自然语言逐步修改

不需要学任何特殊语法,像跟设计师说话一样:

– “把她的白衬衫换成浅蓝色亚麻材质。”
– “咖啡杯上多加一层奶泡,表面拉一个爱心。”
– “背景窗外的街景改成秋天的落叶街道。”
– “整体光线从左边来,把右侧稍微压暗一点,让面部更有层次。”

每说完一句,AI 就会在上一张图的基础上生成新版本。如果不满意,继续说“再改一下……”

第4步:组合修改(一次说多个要求)

当你能准确描述时,可以一次说多个修改:
> “在目前这张图的基础上,同时做三件事:第一,把人物表情从平静改为微笑;第二,把桌上的拿铁换成一杯抹茶;第三,给整张图加一层淡淡的暖色滤镜。”

AI 会一次性处理。

第5步:添加文字(这是它的强项)

相比 Ideogram 那种专门写字的工具,GPT Image 2 的文字能力稍弱,但也够用:
> “在图片右下角加上一行小字‘Cozy Autumn’,白色半透明,无衬线字体。”

第6步:保存最终图片

满意后,点击图片下方的“下载”按钮即可。如果图片不是最终版,可以继续在对话里修改。

一个完整实战案例(建议跟着做)

目标:做一张“夏日冰饮”的社交媒体配图。

1. 生成初稿:“一张清凉的夏日饮料图,透明玻璃杯里装满柠檬水和冰块,背景是泳池蓝色,阳光反射在水面上。”
2. 修改杯型:“把玻璃杯换成矮胖的威士忌杯,杯口加一片薄荷叶。”
3. 改背景:“背景从泳池改成海滩,远处有海浪和沙滩,光线保持明亮。”
4. 加文字:“在画面左上角加一行字‘Summer Chill’,水蓝色,手写体,稍微倾斜。”
5. 调色:“整体色调再偏青一点,降低一点饱和度,看起来更清凉。”

大约 2 分钟,得到一张可以直接发小红书的成品图。

五、谁最适合用它?

– ChatGPT Plus 用户:你已经付了月费,不用白不用。它是目前 ChatGPT 里最值得开启的功能之一。
– 经常要“改图”的设计师、运营、电商卖家:你不需要在 Midjourney 和 PS 之间来回切了,直接在对话里改,效率翻倍。
– 讨厌写复杂 Prompt 的人:GPT Image 2 不需要你用“negative prompt”、参数、权重这些黑话。说人话就行。
– 需要图文协作的创作者:你要同时产出文案和配图,在一个对话里搞定,不用开两个工具。

六、什么情况下别用它?

– 你不是 ChatGPT Plus 用户:免费版用不了,别折腾。
– 你追求的是“艺术壁纸”级别的惊艳:Midjourney 更适合你。
– 你需要大量、无限制地生成高分辨率图片:它的每日限额可能不够,而且输出分辨率不是印刷级。

七、真实感受:从“赌图”到“控图”的转变

用 GPT Image 2 之前,我每次写 Prompt 都像在买彩票——不知道这次会出来什么,也不知道哪个词会让画面崩掉。改图更是噩梦,一个小问题就要重跑。

现在,我敢在客户面前说“你要改哪里?我现在就改”。因为我知道,对方说“把 logo 放大一点”“把按钮改成橙色”,我真的能在半分钟内改好给他看。

这不是“更强的 AI 绘画”,这是“不同维度的 AI 绘画”。它不是来取代 Midjourney 的,它来填补一个 Midjourney 一直没做好的空白——可控性。

GPT Image 2 让我重新相信,AI 不是来抢设计师饭碗的,而是来把我从那些“反复改图”的机械劳动中解放出来的。我现在可以把更多时间花在想创意上,而不是跟 Prompt 搏斗。

 

八、一句话总评

AI 绘画从“抽卡”变成了“对话”。 如果你受够了“跑一百张选一张”,试试 GPT Image 2。它不一定让你每一张都惊艳,但会让你每一张都听话。

 

入口:ChatGPT Plus 订阅用户,直接在对话中使用。
价格:20 美元/月(包含 ChatGPT Plus 所有功能)。
教程提示:就像跟人说话一样说出你的修改要求,越具体越好。

数据统计

相关导航

文心一格

文心一格

百度基于文心大模型推出的AI图片生成平台。和通用AI生图工具不同,文心一格的核心差异化在于对中国传统文化和中国元素的深度理解——国风、水墨画、工笔画、敦煌风格、传统节日、古诗词意境这些主题的生成效果在国内AI生图工具中处于领先位置。底层AI引擎是百度的文心大模型(ERNIE系列),在中文语义理解和中文语境把握上有天然的数据优势。对于品牌建设需要"中国风"视觉元素的内容创作者和设计师来说,文心一格在这个特定审美方向上有其他工具难以替代的价值。

暂无评论

none
暂无评论...