新AI工具旨在实现高分辨率图像生成的民主化

新的AI工具旨在促进高分辨率图像生成的民主化

AI图像生成的世界中,像DALL-E和Midjourney这样的工具目前占据了主导地位,不仅仅是因为它们的高分辨率性能。这些模型的训练需要巨大的投资和资源,不可避免地导致了中心化的服务和按使用付费的方式。

萨里大学开发的一种新的AI工具旨在扭转这一趋势,并使这项技术实现民主化,以面向更广大的用户开放高分辨率图片生成。

这个名为DemoFusion的模型允许用户生成高质量的图片,而无需订阅服务或拥有强大的计算机。实际上,该系统只需要消费级别的RTX 3090 GPU,这种GPU可以在任何中等游戏电脑或Mac M1上找到。

这个AI实质上是稳定扩散XL(SDXL)开源模型的即插即用扩展,该模型以1024×1024的分辨率生成图像。DemoFusion可以通过几行简单的代码实现4倍、16倍甚至更高的分辨率增加,而无需进行任何额外的训练。团队表示,唯一的取舍是“稍微多等一会儿”。我们在TNW上尝试了一下,大约需要六分钟。

SDXL vs DemoFusion AI image generator
图片来源:萨里大学
左侧:SDXL的生成结果。右侧:DemoFusion的生成结果。图片来源:萨里大学

为了实现这些高分辨率的结果,科学家们首先生成低分辨率的图像,然后使用一种称为渐进式改善的过程对其进行增强。这通过在图像的补丁之间进行工作来改善SDXL的细节和分辨率。

“我们独特的技术首次让用户能够增强他们的AI生成图像,而无需庞大的计算能力或对模型进行重新训练,”Yi-Zhe Song教授说道。

“数字艺术和图像是一种强大的媒介,每个人都应该能够使用它,而不仅仅是少数富有的公司。这就是为什么我们将DemoFusion公开的原因。我们相信它可以丰富我们的生活,每个人都应该能够使用它。”

这种新技术在论文《DemoFusion:无需$$$实现高分辨率图像生成的民主化》中在线可用

DemoFusion能否获得足够的关注来与OpenAI的DALL-E等巨头竞争还有待观察,但它的创造是将AI图像生成的潜力开放给公众和更广泛的科技社区的重要一步。