评论 | 当AI学会了精准“写字”，我们要思考什么？

当地时间4月21日，美国人工智能公司OpenAI对外推出的ChatGPTImages2.0模型，一经上线便以突破性的生图能力登顶行业榜单，不仅点燃了大众对创意表达的热情，更让人们将目光再次聚焦于人工智能生成技术的发展，引发了一场关于AI与创意、技术与生活的深度思考。

GPTImages2.0上线之所以能掀起讨论热潮，核心在于其攻克了一个看似微小却极其关键的障碍——图像中的文字生成。如果说以前的AI像一个凭感觉涂鸦的孩子，那么现在的GPTImages2.0已经学会了读字、写字，甚至是“排版”。它打破了语言模型与图像模型的壁垒，能精准捕捉复杂创作指令，在生成图像前完成逻辑推演，让生成的画面更具逻辑性和完整性。过去，AI画出的招牌总是一团乱码，菜单上的菜品名字像是来自异次元。现在，GPTImages2.0可以精准呈现不同字体、大小、颜色的文字，甚至能根据指令调整排版和透视关系。

图一

图二（同一段指令下，图一由豆包生成，图二由GPT Images2.0生成）

回望2026年开年，字节跳动推出的Seedance2.0以出色的视频生成能力引发关注，它凭借多模态协同优势，让专业视频创作变得高效便捷，让“一人即制片厂”成为可能。它们都是人工智能生成技术不断突破的生动体现。如果说以前我们使用AI是在“开盲盒”，那么未来，AI生成内容将越来越精准，越来越符合现实世界的规则，逐渐变成一个可以信赖的、可靠的创作伙伴。

从Seedance2.0的视频赋能，到GPTImages2.0的生图突破，人工智能生成技术正不断拓展边界，深刻改变着创意表达与生产方式。这场由GPTImages2.0引发的讨论，最终也落脚于对未来的思考：未来的AI还能生成什么？当它能够完美生成图像中的文字，能够合成连贯的视频故事，能够模拟真实的物理交互，我们与AI的关系将如何重新定义？

GPTImages2.0的热度终会沉淀，但它引发的思考却不会停止。它让我们看到了人工智能生成技术的无限可能，也让我们对更多AI产品充满期待。未来，随着技术的持续深耕，AI生成功能必将迎来更广阔的发展空间，而这场关于技术与创意、当下与未来的思考，也将伴随人工智能的发展，不断走向深入。（曾若溪）

责任编辑：朱剑

更多资讯，下载群众新闻