刷新ImageNet记录,GAN不只是撒谎!DeepMind将其用于图像分类,迅速打破职业分类AI-量子比特
以往,GAN的光几乎集中在生成的图像上。
生一个不会发生的女孩。
△英伟达StyleGAN起
生成不发生的妻子。
△英伟达StyleGAN起
进化到帮助女孩子脱衣服。
△DeepNude
但是现在不一样了。
DeepMind两位大腕改造了“史上最强”BigGAN,让新算法进行图像分类,刷新了ImageNet无监督特征学习的记录。
换句话说,半出家的“BigBiGAN”迅速击败了20年来专注于分类的AI选手们。
(我有主角的圈子。)
同时,生成的图像质量依然优良。
但是,仅仅认为是“BigGAN”的升级版是很简单的。
我不叫BigBigGAN
GAN亲生父母Ian Goodfellow打造团队浪潮重点:
那嚒,我们从这里开始讲原理吧。
在GAN中添加编码器的想法是从自己的前辈BiGAN那里继承下来的:
实际上,以前BiGAN也用ImageNet进行图像分类。但是,据团队称,BiGAN的生成器是DCGAN中的东西,因为不能生成高质量的图像,所以编码器学到的意义受到影响。
因此,研究人员决定将BiGAN的编码器与BigGAN的发生器相爱。
但是,仅凭这一点是不幸福的。
鉴别器也是GAN的重要部分,要不断看透生成器的作品,不要忘记对方生产的假画会越来越逼真。
鉴别器本身就是一个强大的神经网络,团队希望能够在“语义”层面强调图像重建误差,而不太在意底层细节。
基于这个目标,团队开发了“联合鉴别器”(Joint Discriminator)
与通常的判别器不同,其输入不仅是图像数据(真图和假图),而且是图像数据+潜变量的对数据。
那么,不是真图和假图,而是区分由真图和潜变量构成的对子(来自编码器)和由假图和潜变量构成的对子(来自生成器)
新算法的名称“BigBiGAN”不是生成器的专有名称,但如果它是完整的“BigBiGAN”:
那我们现在就来看看成绩吧。
打破ImageNet记录
在ImageNet图像分类任务中,BigBiGAN成为无监视算法中地表最强的。
BigBiGANImageNet的top-1精度与现有的监视逻辑回归分类器相比提高到61.3%。
作为合格的GAN,BigBiGAN当然有制作“伪照片”的功能。
从未监视的模型中选择的图像重建的结果。第一行是实际图像,第二行是上面图像x的重构图像。
与大多数GAN不同,BigBiGAN更注重上层的表征学习,而不是像素级的图像重建,例如BigGAN。
论文指出,消融实验证明,强生成模型有助于学习表征,强推理能力反而可以提高大规模生成模型的表达。
参见BigBiGAN,在本文中:
https://arxiv.org/abs/1907.02544
前辈BigGAN:
https://arxiv.org/abs/1809.11096
前辈BiGAN:
https://arxiv.org/abs/1605.09782
都来自一个团队。