速递|OpenAI上架图像生成神器,200美元月Pro用户抢先,免费版后续推出
图片来源:Unsplash
在周二的一次直播中,OpenAI CEO Sam Altman 宣布了 ChatGPT 图像生成功能一年多以来的首次重大升级。
ChatGPT 现在可以利用公司的 GPT-4o 模型原生创建和修改图像和照片。GPT-4o 长期以来一直是 AI 驱动的聊天机器人平台的基础,但直到现在,该模型只能生成和编辑文本,而不是图像。
具有图像输出功能的GPT-4o “思考”时间比它有效替代的图像生成模型 DALL-E 3 稍长,以生成 OpenAI 描述的更准确和详细的图像。
GPT-4o 可以编辑现有图像,包括包含人物的图像——转换它们或“修复”前景和背景对象等细节。
为了支持新的图像功能,OpenAI 告诉《华尔街日报》,它使用“公开可用数据”以及与 Shutterstock 等公司合作获得的专有数据来训练 GPT-4o。
许多生成式AI 供应商将训练数据视为竞争优势,因此他们对此及其相关信息守口如瓶。但训练数据的细节也是潜在的知识产权相关诉讼的来源,这进一步阻碍了公司透露太多信息。
“我们在输出方面尊重艺术家的权利,并且我们有政策防止我们生成直接模仿任何在世艺术家作品的图像,”OpenAI 首席运营官布拉德·莱特卡普在给《华尔街日报》的声明中表示。
OpenAI 提供了一个选择退出表格,允许创作者请求将其作品从其训练数据集中移除。该公司还表示,它尊重禁止其网络爬虫从网站收集训练数据(包括图像)的请求。
ChatGPT 的升级版图像生成功能紧随ASPCMS社区的实验性原生图像输出功能而来,后者是其旗舰模型 Gemini 2.0 Flash 的一部分。这一强大功能在社交媒体上迅速走红,但并非出于最好的原因。Gemini 2.0 Flash 的图像组件几乎没有设置防护措施,允许人们去除水印并创建描绘受版权保护角色的图像。
本文翻译自:https://techcrunch.com/2025/03/25/chatgpts-image-generation-feature-gets-an-upgrade/
编译:ChatGPT