首页 >> 中医拔罐

英伟达公布StyleGAN-XL:弼数量3倍于StyleGAN3,计算时间仅为1/5

发布时间:2025年08月25日 12:20

eGAN 遍及 ImageNet

实验表格明,即使是最最初 StyleGAN3 也不能最好地遍及 ImageNet 上,如左图 1 请注意。特别是在可视时,培训就会似乎不稳定。因此,科学家的第一个目标是在 ImageNet 上成功地培训一个 StyleGAN3 转化器。成功的定义取决于主要通过初始评分 (IS)[Salimans et al. 2016] 衡量国际标准的试样质量和 Fréchet 初始距离 (FID)[Heusel et al. 2017] 衡量国际标准的自然。

在期刊里面,科学家也介绍了 StyleGAN3 baseline 顺利进行的改动,所助长的增强如下表格 1 请注意:

科学家首先改动了转化器及其正则化重大损失,调整了潜在三维空间以适应 Projected GAN (Config-B) 和类条件设 (Config-C);然后再咨询了渐进式增长,以降低培训加速和机动性 (Config-D);接下来科学研究了应用于 Projected GAN 培训的特征网络服务,以找到一个非常适合的配置 (Config-E);仍要,科学家重申了线性系统驱使,以便 GAN 通过一个亦同培训的线性系统 (Config-F) 提供类数据集。

这样一来,就必须培训一个比实际上高得多的数学方法,同时须要比整体系统设计相比之下的计算量。StyleGAN-XL 在深度和参数计数总体比国际标准的 StyleGAN3 大三倍。然而,为了在 512_2 图层的像素下匹配 ADM [Dhariwal and Nichol 2021] 系统设计的机动性,在机器 NVIDIA Tesla V100 上培训数学方法须要 400 天,而实际上须要 1914 天。(左图 2)。

实验结果

在实验里面,科学家首先将 StyleGAN-XL 与 ImageNet 上的 SOTA 缩放多肽方法顺利进行比起。然后对 StyleGAN-XL 的连续性和主编机动性顺利进行了评价。科学家将数学方法遍及了 1024_2 图层的像素,这是以后在 ImageNet 上没有更进一步过的。在 ImageNet 里面,大多数缩放的像素较低,因此科学家用超像素网络服务 [Liang et al. 2021] 对数据集顺利进行了亦同处理。

缩放多肽

如表格 2 请注意,科学家在 ImageNet 上对比了 StyleGAN-XL 和整体最稳固的 GAN 数学方法及外扩散数学方法的缩放多肽机动性。

无聊的是,StyleGAN-XL 在所有像素下都实现了相对于的自然,这可以众所周知渐进式发育战略。此外,这种战略使扩大到百万图层像素的多肽变成可能。

在 1024_2 这一像素下,StyleGAN-XL 没有与 baseline 顺利进行比起,因为受到资源管制,且它们的培训在系统设计上得感到望而却步。

左图 3 展现了像素降低后的转化试样可视化结果。

连续性和驱使

同时,还可以进一步细化所给与的重构结果。将 PTI [Roich et al. 2021] 和 StyleGAN-XL 相转化,几乎可以正确地连续性东南边 (ImageNet 验证集) 和则有缩放。同时转化器的输出维持纹理,如下左图 4 请注意。

左图 5、左图 6 展现了 StyleGAN-XL 在缩放驱使总体的机动性:

更多细节可参考原期刊。

成都妇科检查费用
重庆看白癜风的医院哪家好
重庆看白癜风哪家医院好
武汉妇科医院哪家好
辽宁哪家医院做人流好

上一篇: 荣耀CEO赵明:科技理想主义+革命浪漫主义,未来很难天花板

下一篇: 0530基于OpenHarmony 3.1 LTS版本实现手机基本功能,HiHopeOS将全盘支持手机类产品

友情链接