研究人员微调对AI图像生成的控制

导读 有问题的是一种称为条件图像生成的 AI 任务,其中 AI 系统创建满足一组特定条件的图像。例如,可以训练一个系统来创建猫或狗的原始图像

有问题的是一种称为条件图像生成的 AI 任务,其中 AI 系统创建满足一组特定条件的图像。例如,可以训练一个系统来创建猫或狗的原始图像,具体取决于用户请求的动物。最近的技术已经建立在此基础上以合并有关图像布局的条件。这允许用户指定他们想要在屏幕上的特定位置显示哪些类型的对象。例如,天空可能在一个盒子里,一棵树可能在另一个盒子里,溪流可能在一个单独的盒子里,等等。

新工作建立在这些技术的基础上,让用户可以更好地控制生成的图像,并在一系列图像中保留某些特征。

“我们的方法是高度可重构的,”该工作论文的合著者、北卡罗来纳州立大学计算机工程助理教授吴天福说。“与以前的方法一样,我们的方法允许用户让系统根据一组特定的条件生成图像。但我们的方法还允许您保留该图像并添加到其中。例如,用户可以让 AI 创建山景。然后用户可以让系统将滑雪者添加到该场景中。”

此外,新方法允许用户让 AI 操纵特定元素,以便它们可识别地相同,但以某种方式移动或更改。例如,人工智能可能会创建一系列图像,显示滑雪者在穿越景观时转向观众。

“这方面的一个应用是帮助自主机器人‘想象’在开始给定任务之前最终结果可能是什么样子,”吴说。“您还可以使用该系统为 AI 训练生成图像。因此,您可以使用该系统来创建用于训练其他 AI 系统的图像,而不是从外部来源编译图像。”

研究人员使用 COCO-Stuff 数据集和 Visual Genome 数据集测试了他们的新方法。基于图像质量的标准测量,新方法优于以前最先进的图像创建技术。

免责声明:本文由用户上传,如有侵权请联系删除!