新AI工具旨在实现高分辨率图像生成的民主化

新的AI工具旨在促进高分辨率图像生成的民主化

在AI图像生成的世界中，像DALL-E和Midjourney这样的工具目前占据了主导地位，不仅仅是因为它们的高分辨率性能。这些模型的训练需要巨大的投资和资源，不可避免地导致了中心化的服务和按使用付费的方式。

萨里大学开发的一种新的AI工具旨在扭转这一趋势，并使这项技术实现民主化，以面向更广大的用户开放高分辨率图片生成。

这个名为DemoFusion的模型允许用户生成高质量的图片，而无需订阅服务或拥有强大的计算机。实际上，该系统只需要消费级别的RTX 3090 GPU，这种GPU可以在任何中等游戏电脑或Mac M1上找到。

这个AI实质上是稳定扩散XL（SDXL）开源模型的即插即用扩展，该模型以1024×1024的分辨率生成图像。DemoFusion可以通过几行简单的代码实现4倍、16倍甚至更高的分辨率增加，而无需进行任何额外的训练。团队表示，唯一的取舍是“稍微多等一会儿”。我们在TNW上尝试了一下，大约需要六分钟。

为了实现这些高分辨率的结果，科学家们首先生成低分辨率的图像，然后使用一种称为渐进式改善的过程对其进行增强。这通过在图像的补丁之间进行工作来改善SDXL的细节和分辨率。

“我们独特的技术首次让用户能够增强他们的AI生成图像，而无需庞大的计算能力或对模型进行重新训练，”Yi-Zhe Song教授说道。

“数字艺术和图像是一种强大的媒介，每个人都应该能够使用它，而不仅仅是少数富有的公司。这就是为什么我们将DemoFusion公开的原因。我们相信它可以丰富我们的生活，每个人都应该能够使用它。”

这种新技术在论文《DemoFusion：无需$$$实现高分辨率图像生成的民主化》中在线可用。

DemoFusion能否获得足够的关注来与OpenAI的DALL-E等巨头竞争还有待观察，但它的创造是将AI图像生成的潜力开放给公众和更广泛的科技社区的重要一步。