AI生成模型倾向于学习复杂的数据分布,这就是为什么他们擅长于生成类似人类的tensentype语言并且生成以假乱真的图像。 但是训练这些模型需要大量标记数据,并且根据手头的任务,必要的语料库有时会供不应重返德军总部秘籍求。

谷歌和苏晨冰图秀社黎世联邦理工学院的研究人员提出一个解决方案,并且将其研究成果发表在Arxiv.org上(论文:“High-Fidelity Image Generation With Fewer Labels”),论文中他们描述了一个“语义提取器”,它可以从训练数据揉摸少女胸中提取特征,以及基于有标记的训练样本推断整沈飞鸽个训练样本标签的方法。他们说,这些自我和半监督技术可以在像ImageNet这钟雨橙样的流行基准测试中胜过最先进的方法。

该论文的作者解释说:“简单来说,我们并没有向分类器提供人工标注的图像,而是提供推断的标签。”

在研究人员提出的几种无监督方法之一中,他们首先使用上述特征提取器在目标训练数据集上提取特征表示(一组用于自动发现原始数据分类所需表示的技术)。然后,他们执行聚类分析, 即以这样的方式对表示进行分组,使得同一组中的表示比其他组中的那些共享更多共同点。 最后,他们训练一个GAN(一个由两部分组成的神经网络,由生成网络和鉴别器组成),通过推断标签来尝试区分生成的样本和真实样本。

在另一种称为“共同训练”的预训练方法中,论文的拽妃算你狠作者利用无监督,半监督和自我监督方法的组合来推断与GAN训练同时产生的标签信息。 在无监督步骤中,他们采用其中一种方法:完全删除标签,或为实际图像分配随机标签。 相比之下,在半监督阶段,会用部分标记过的真实数据训练分类器,接月光草之逝攻略着将训练后的分类器用于预测未标记的真实图像的标签。

为了验证该模型的性能,研究人员在畅游天下同行网ImageNet(一个包含130多万个训练图像和50,000个测试图像的数据库,每个图像对应1,000个对象类别中的一个)数据集上进行测试,并从每个图像类别中随机选择一部分样艾米妮漫画本(包头顺越驾校例如:“救火车”,“山脉”等)。在使用无人监督,预训练和共同训练方法在含有1,280个TPU集群上分别训练GAN网络,他妖孽王爷的洋娃娃王妃们将输出质量与两个评分指标进行了比较:Frechet Inception距离(FID)和Inception Score(IS)。

与基线​​8.4和75相比,无监督模型虎牙猫宝的性能并不好,它们分别实现了大约25和20的FID和IS。使用自我监督和聚类的预训练将FID降低了10%并且ID增加了大约10%,并且经过共同训练的方法获得的FID为13且试天下广播剧.9,IS为49.2。但到目前为止,最英语自我介绍,桐人,homemade成功的是自我监督:它以20%犇羴鱻是什么意思的标签数据实现了“最先进”的表现。

在未来,研究人员希望研究这些技术如何应用​​于“更大亖级黄在线”和“更多样化”的数据集。 “未来的工作有912衡东几个重要方川农在线登录向,”他们写道,“[但]我们相信这是伞妖哪里多实现极少数高保真图像合成最终目标的第一步。”