科技魔方

英伟达推新AI图像生成器Perfusion :大小仅100KB、训练只需4分钟

人工智能

2023年08月03日

  在人工智能艺术创作工具快速发展的背景下,Nvidia 研究人员推出了一种创新的文本到图像个性化方法,称为Perfusion。

  与大AI图片生成模型不同的是,Perfusion 只有100KB大小,训练时间短,只需要4分钟。

  Nvidia 和以色列特拉维夫大学共同撰写的一篇研究论文中介绍了所用的技术。尽管体积很小,但在特定版本的效率方面,它能够胜过Stability AI 的 Stable Diffusion v1.5、新发布的 Stable Diffusion XL (SDXL) 和 MidJourney 等领先的 AI 艺术生成器。

  Perfusion 通过一种名为 “Key-Locking” 的新方法,在图像生成过程中将用户想要添加的新概念与更一般的类别联系起来,从而避免过度拟合。这样可以灵活地表达个性化的概念,同时保持其核心特征。与其他 AI 图像生成器相比,Perfusion 具有更高的视觉质量和与文本的对齐性。

  此外,Perfusion 还可以将多个个性化概念结合在一张图像中,并允许用户在推理过程中通过调整一个100KB 的模型来控制视觉保真度和文本对齐性之间的平衡。与其他调整输出的方法相比,Perfusion 的体积更小,效果更好。

  此研究与 Nvidia 在人工智能领域的发展方向相一致,该公司的股票在2023年大涨230%,其 GPU 在训练 AI 模型方面占据主导地位。

  据分析,Perfusion 模型的创新性可能会使 Nvidia 在生成式人工智能领域获得优势。不过,Nvidia 目前只公布了研究论文,并承诺很快发布代码。

+1

来源:站长之家

延展资讯