速递｜OpenAI上架图像生成神器，200美元月Pro用户抢先，免费版后续推出

2025-03-26ASPCMS社区 - fjmyhfvclm

图片来源：Unsplash

在周二的一次直播中，OpenAI CEO Sam Altman 宣布了 ChatGPT 图像生成功能一年多以来的首次重大升级。

ChatGPT 现在可以利用公司的 GPT-4o 模型原生创建和修改图像和照片。GPT-4o 长期以来一直是 AI 驱动的聊天机器人平台的基础，但直到现在，该模型只能生成和编辑文本，而不是图像。

具有图像输出功能的GPT-4o “思考”时间比它有效替代的图像生成模型 DALL-E 3 稍长，以生成 OpenAI 描述的更准确和详细的图像。

GPT-4o 可以编辑现有图像，包括包含人物的图像——转换它们或“修复”前景和背景对象等细节。

为了支持新的图像功能，OpenAI 告诉《华尔街日报》，它使用“公开可用数据”以及与 Shutterstock 等公司合作获得的专有数据来训练 GPT-4o。

许多生成式AI 供应商将训练数据视为竞争优势，因此他们对此及其相关信息守口如瓶。但训练数据的细节也是潜在的知识产权相关诉讼的来源，这进一步阻碍了公司透露太多信息。

“我们在输出方面尊重艺术家的权利，并且我们有政策防止我们生成直接模仿任何在世艺术家作品的图像，”OpenAI 首席运营官布拉德·莱特卡普在给《华尔街日报》的声明中表示。

OpenAI 提供了一个选择退出表格，允许创作者请求将其作品从其训练数据集中移除。该公司还表示，它尊重禁止其网络爬虫从网站收集训练数据（包括图像）的请求。

ChatGPT 的升级版图像生成功能紧随ASPCMS社区的实验性原生图像输出功能而来，后者是其旗舰模型 Gemini 2.0 Flash 的一部分。这一强大功能在社交媒体上迅速走红，但并非出于最好的原因。Gemini 2.0 Flash 的图像组件几乎没有设置防护措施，允许人们去除水印并创建描绘受版权保护角色的图像。

本文翻译自：https://techcrunch.com/2025/03/25/chatgpts-image-generation-feature-gets-an-upgrade/

编译：ChatGPT