刚刚!ChatGPT Images 2.0突然发布,实测强得离谱 chatgpt上传图片报错 chatgpt刚出来的版本
创始人
2026-04-23 00:05:58
0

还在熬夜做图的设计师们,这下真的有些尴尬了:在几乎没有预告的情况下,OpenAI 于北京时间 2026 年 4 月 22 日凌晨发布了 ChatGPT Images 2.0 模型(下文简称 Images 2.0)。

和 ChatGPT 原本的生图模型相比,Images 2.0 在图片精度、语言支持、分辨率支持和交互方式上都有着相当显著的提升。值得一提的是,这次发布的 Images 2.0 甚至还拥有了思考的能力。



图片来源:OpenAI

简单来说,Images 2.0(现已在 ChatGPT、API 中使用)其实包含两个模型(分支):

1. 快速模型(Instant Model)可以处理绝大多数日常任务,比如制作 Logo、多语言海报甚至是文章配图;

2. 思考模型(Thinking Model、需手动切换)可以通过网络查找相关信息,并在生图前先对内容进行推理,并在一组输出中保证画面内容连贯。

接下来我们直接用图片来举例。

下面这张照片是雷科技 AWE26 报道团出发前拍的合照,我们直接把这张图丢给 ChatGPT、输出我们的需求:



图片来源:雷科技

做一本《雷科技》科技杂志的封面,封面是图片里这几个人。

不到一分钟,ChatGPT 就把封面做好了。可以看到全新的 Images 2.0,不仅不会把基础图片重绘(这是大多数生图 AI 的通病),甚至连中文的部分都能正确绘制。



图片来源:雷科技

但这还没完,在提出「日期改成 2026 年 3月」「人的姿势可以变一下,这样太死板了」等模糊的提示词后,ChatGPT 依旧能顺利完成任务。



图片来源:雷科技

同样的,只要「喂」给 Images 2.0 一张手机外观,ChatGPt 也能直接完成手机使用场景照。



图片来源:雷科技

而在全新的图片查看界面,ChatGPT 还加入了两项全新的功能——我们可以直接选择图片需要修改的区域,要求 ChatGPT 做出修改,还可以直接在长宽比选单中选择需要输出的图片比例,自媒体配图变得更方便了。



除了基于图片生成新的图片,Images 2.0 基于文字做图的能力也有所提升。雷科技只给出了「电车通马上要出发报道 2026 北京车展」的信息,Images 2.0 就能自己找齐相关信息,并正确输出海报。



图片来源:雷科技

较为可惜的是,尽管在 OpenAI 的直播中,Images 2.0 可以正确处理二维码信息,但雷科技经过多次尝试,仍无法在图片中嵌入可以被识别的二维码。



图片来源:雷科技

其实从效果来看,Images 2.0 的多语言支持已经非常出色了。但为了拉开能力差距,雷科技决定给 Images 2.0 上点强度:

生成一个照片风格图片:一幅毛笔书法作品在博物馆展出,上书: 北国风光,千里冰封,万里雪飘。望长城内外,惟余莽莽;大河上下,顿失滔滔。山舞银蛇,原驰蜡象,欲与天公试比高。须晴日,看红装素裹,分外妖娆。 江山如此多娇,引无数英雄竞折腰。惜秦皇汉武,略输文采;唐宗宋祖,稍逊风骚。一代天骄,成吉思汗,只识弯弓射大雕。俱往矣,数风流人物,还看今朝。

尽管文本内容更长,不过 ChatGPT 仍在一分钟之内就输出了结果。可以看出,Images 2.0 的中文支持确实不错,字体字形基本没有问题,但书法的「质感」仍有欠缺,怎么看都像是「印刷品」。



图片来源:雷科技

说完 Instant Model,我们再来看看思考模式的能力。这次雷科技直接给 Images 2.0 准备了一道大题:



以上图里的形象为漫画主角,生成一部摩托车为主题的短篇漫画,篇幅至少要 8 页,封面和封底为彩色,其余为黑白,画风参考石森章太郎。

接到需求后,Images 2.0 会有一个明显的思考推理步骤;点开推理详情,我们甚至能看到 Images 2.0 编写对话的过程。这其实越正常,毕竟我并没有给出任何关于剧情的提示词,全权交给 Images 2.0 自由发布。

在耗时 11 分钟后,Images 2.0 成功输出了一组 8 张图。值得注意的是,Images 2.0 不仅在 8 张图中做到了画风和细节的统一(除了时有时无的头盔),甚至连剧情都能保持上下文连贯。这种超长连续推理能力,即使是 Nano Banana 也难以做到。

















也正因如此,雷科技认为,Images 2.0 的表现,完全可以用一骑绝尘来形容。

因为触发了 ChatGPT Plus 用户的公平使用限额机制,雷科技的 Images 2.0 体验到这里就暂告一段落了。但就雷科技的体验来说,Images 2.0 的能力上限远不仅如此:

除了支持中文(及印地语、日语等多种亚洲语言)、连续推理等能力外,在直播中,OpenAI 还提到了Images 2.0 能在米粒上写字的超精细制图能力,以及生成 360 度全景照片的能力。



图片来源:OpenAI



图片来源:OpenAI

也正因 Images 2.0 制图效果如此出色,雷科技认为 Images 2.0 的登场,也标志着 AI 生图正式告别了那个靠玄学提示词「抽卡」的蛮荒时代。

如果大家有玩过 Stable Diffusion 等早期文生图 AI,应该对文生图的「蛮荒时代」有印象:你可能第一次尝试就做出了自己想要的图片,也可能来来回回调整提示词,用两个小时生成了几百 GB 的废片,体验甚至比二次元「抽卡手游」还要差——二游至少有保底机制。

在当时,我们如果想要保证图片「有较大概率符合要求」,就必须用 ComfyUI;而 ComfyUI 复杂的节点设计,从某种意义上也违背了 AI 生图「偷懒」的目标。

但 Images 2.0 引入「思考模型」后,AI 第一次具备了长文本逻辑解析与时空一致性的推理能力。

以刚刚提到的画漫画工作流为例,Images 2.0 可以先理解场景、构思剧情、布局文字,最后再落笔。这种从底层逻辑出发的进化,直接解决了 AI 绘画中「文字崩坏」与「画风不统一」这两大问题,极大地拓宽了 AI 的生产力边界。



图片来源:OpenAI

可以肯定的是,Images 2.0 的出现,对于绘画、摄影行业的冲击极为「惨烈」;而从 AI 发展的角度看,OpenAI 也再次证明了单纯的分辨率并不能从根本提升 AI 的工作效率,推理能力才是 AI 图像的核心竞争力领域。

在 AI 图像时代,OpenAI 已经为我们开了一个好头。接下来,就得看 Google 和国内 AI 巨头们该如何应对了。

2026第十九届北京国际汽车展览会将于4月24日至5月3日在北京‌中国国际展览中心(顺义馆)和首都国际会展中心(新国展二期)举行,本届车展以“领时代·智未来”为主题,集中展现汽车工业的更多黑科技。
比亚迪、小米、鸿蒙智行(问界等)、小鹏、蔚来、岚图等头部品牌集结,多款重磅新车首秀;地平线、Momenta、卓驭等供应商集体秀肌肉,AI大模型深度赋能,高阶智驾、动力电池、超快充技术等前沿科技集中亮相,看点拉满!
雷科技旗下「电车通」将派出报道团直击现场,以“关注电动车,更懂智能化”的专业视角,带来一线独家报道,敬请关注!



相关内容

热门资讯

“我要打10个”的伊朗,缺油了... 如果说两周前,伊朗军方还在电视台上拍着胸脯保证“一切正常,我们赢麻了”,那么现在,这层窗户纸算是被彻...
REDMI K90 Max发布... 4 月 21 日,REDMI K90 Max 正式发布。作为 REDMI K 系列全新成员,REDM...
A股,突变!七大巨头,集体异动... 市场明显起了变化!早上,紫金矿业和宁德时代两大巨头都在发布利好之后意外回落,与此同时,有色和电池板块...
“农夫”们才入局,补水啦已经签... 文 | 陶魏斌2026年世界杯开赛在即,补水啦官宣了自己的品牌代言人——姆巴佩,当今足球世界的顶级球...
新市场扭亏、国内转型阵痛 极兔... 独立 稀缺 穿透仍有不少硬仗要打作者:闻道编辑:李莉风品:一然来源:铑财——铑财研究院新曲线越烧越旺...
盘后突发利空!油价涨破100,... 今天的行情再次应了那句话:不要光站在那里,要站在光里!隔壁港股大跌,A股低开高走,上证指数站上410...
纠结的万华化学:不论业绩如何,... 在周期股里,万华化学这两年的表现有点别扭,化工赛道热门企业华鲁恒升、新和成、卫星化学等纷纷在今年创出...
手机涨价潮来袭,OPPO刘作虎... 4月21日,OPPO正式发布Find X9s Pro与Find X9 Ultra 影像双旗舰新品。作...
航空业“油荒”危机将至:海湾出... 财联社4月22日讯(编辑 刘靖怡)随着全球航运咽喉霍尔木兹海峡因美伊对峙被封锁,海湾地区对国际市场的...
调研|平安银行对公和零售信贷投... 截至今年3月末,创业板上市公司占A股上市公司总数1/4,总市值近18万亿元,是全球最具活力的市场之一...