OpenAI的Dall-E 3是由ChatGPT驱动的艺术生成器

OpenAI的Dall-E 3是由ChatGPT驱动的生成器

OpenAI宣布推出了其最新的AI艺术工具Dall-E 3。它利用了OpenAI的热门聊天机器人ChatGPT,通过自动扩展提示来更复杂、更精心地创作艺术作品,以使生成器获得更详细、更连贯的指导。

Dall-E 3的新功能在于它消除了需要对输入程序进行细化的复杂性,也就是所谓的“提示工程”,并且它允许用户通过ChatGPT的对话界面进行改进。这个新工具可能有助于降低生成复杂AI艺术作品的门槛,并且由于其聊天机器人的卓越能力,有助于OpenAI保持领先地位。

AI艺术,由OpenAI提供

例如,看看这张土豆国王的图片。

多亏了一些工具,将文本提示转化为视觉构图,这种古怪的由AI生成的艺术在社交媒体上已经司空见惯。但是这一张图片得到了ChatGPT的大量艺术帮助,它将一个简短的提示转化为更详细的提示,包括如何正确组合的指导。

这不仅是Dall-E的一个重大进步,也是整个生成式AI艺术的一个重大进步。Dall-E是一个由Pixar角色Wall-E和艺术家Salvador Dalí组合而成的词,于2021年宣布并于2022年推出,它由一个算法组成,该算法从网络和其他来源中爬取了大量带标签的图像。它使用所谓的扩散模型来预测如何为给定的提示呈现图像。通过足够大量的数据,这可以产生复杂、连贯和美观的图像。Dall-E 3与众不同之处在于人类和机器的交互方式。

AI艺术,由OpenAI提供

这张由Dall-E 3生成的图片展示了使用ChatGPT填充提示会产生更连贯、更复杂的图片。通常情况下,这可能需要大量的提示工程,用户试图使用越来越复杂的提示来创建复杂的东西。但是有了Dall-E 3,ChatGPT就承担了制作更复杂提示的工作。

AI艺术,由OpenAI提供

Dall-E 3根据以下提示生成了这张图片:“一幅由半透明玻璃制成的人类心脏的插图,它矗立在暴风雨中的海面上的基座上。阳光穿透云层,照亮了心脏,揭示了一个微小的宇宙。地平线上以醒目的字母刻着一句名言‘在你内心找到宇宙。’”

Dall-E 3还允许用户通过ChatGPT对创作进行改进,就像他们在向真正的艺术家提出修改建议一样。“你不必担心处理非常长的提示,”研究负责人和Dall-E团队负责人Aditya Ramesh说。“相反,你可以像与同事交流一样与ChatGPT进行交互。”

Dall-E团队的研究负责人Gabriel Goh向ENBLE展示了这个技巧,他让Dall-E 3为一个想象中的面馆创建了几个宣传海报。在提供了几个选项后,Goh通过ChatGPT要求Dall-E 3将其中一个转化为挂在餐馆外面的招牌插图。

Dall-E 3现在可以通过付费版本的ChatGPT Plus使用。

2022年,许多AI艺术生成器的出现预示着更广泛的生成式AI繁荣的开始。早期的许多生成器都很简陋,无法对图像进行改进或修改。除了OpenAI之外,Midjourney、Stable Diffusion和Ideogram等初创公司也吸引了大量的资金和公众关注。但是使用这些AI艺术系统也引发了人们对专业人类艺术家可能被替代的担忧,以及AI公司如何使用受版权保护的材料来训练他们的算法。

对于这一争议,OpenAI今天还宣布将推出一种方法,让艺术家可以将他们的作品从未来的训练中移除。Dall-E 3还将通过检测提示中是否包含了以知名艺术家的风格生成一幅艺术品来阻止用户尝试生成这样的作品。

OpenAI还有一些保护措施,以阻止用户生成色情或图形暴力的艺术作品,或者包含公众人物的图像。OpenAI的政策研究员Sandhini Agarwal表示,Dall-E的新版本经历了更多的“红队测试”,即研究人员试图突破其防护措施。“对于色情内容的明确请求,将经过分类器并被拒绝,”Agarwal说道。当然,一些程序员已经创建了没有任何限制的开源图像生成器。

人工智能生成艺术繁荣的最显著结果之一是充斥社交媒体的超现实图像。下面的图片是使用Dall-E 3和ChatGPT的帮助生成的,使用了以下提示:“一片由各种肉类完全构成的广阔景观展现在观众面前。嫩而多汁的烤牛肉丘陵,鸡腿树,培根河流和火腿巨石创造了一幅超现实而诱人的场景。天空上点缀着一颗辣香肠太阳和莎拉米云。”

OpenAI提供的AI艺术