英伟达公布StyleGAN-XL：弼数量3倍于StyleGAN3，计算时间仅为1/5

发布时间：2025年08月25日 12:20

eGAN 遍及 ImageNet

实验表格明，即使是最最初 StyleGAN3 也不能最好地遍及 ImageNet 上，如左图 1 请注意。特别是在可视时，培训就会似乎不稳定。因此，科学家的第一个目标是在 ImageNet 上成功地培训一个 StyleGAN3 转化器。成功的定义取决于主要通过初始评分 (IS)[Salimans et al. 2016] 衡量国际标准的试样质量和 Fréchet 初始距离 (FID)[Heusel et al. 2017] 衡量国际标准的自然。

在期刊里面，科学家也介绍了 StyleGAN3 baseline 顺利进行的改动，所助长的增强如下表格 1 请注意：

科学家首先改动了转化器及其正则化重大损失，调整了潜在三维空间以适应 Projected GAN (Config-B) 和类条件设 (Config-C)；然后再咨询了渐进式增长，以降低培训加速和机动性 (Config-D)；接下来科学研究了应用于 Projected GAN 培训的特征网络服务，以找到一个非常适合的配置 (Config-E)；仍要，科学家重申了线性系统驱使，以便 GAN 通过一个亦同培训的线性系统 (Config-F) 提供类数据集。

这样一来，就必须培训一个比实际上高得多的数学方法，同时须要比整体系统设计相比之下的计算量。StyleGAN-XL 在深度和参数计数总体比国际标准的 StyleGAN3 大三倍。然而，为了在 512_2 图层的像素下匹配 ADM [Dhariwal and Nichol 2021] 系统设计的机动性，在机器 NVIDIA Tesla V100 上培训数学方法须要 400 天，而实际上须要 1914 天。(左图 2)。

实验结果

在实验里面，科学家首先将 StyleGAN-XL 与 ImageNet 上的 SOTA 缩放多肽方法顺利进行比起。然后对 StyleGAN-XL 的连续性和主编机动性顺利进行了评价。科学家将数学方法遍及了 1024_2 图层的像素，这是以后在 ImageNet 上没有更进一步过的。在 ImageNet 里面，大多数缩放的像素较低，因此科学家用超像素网络服务 [Liang et al. 2021] 对数据集顺利进行了亦同处理。

缩放多肽

如表格 2 请注意，科学家在 ImageNet 上对比了 StyleGAN-XL 和整体最稳固的 GAN 数学方法及外扩散数学方法的缩放多肽机动性。

无聊的是，StyleGAN-XL 在所有像素下都实现了相对于的自然，这可以众所周知渐进式发育战略。此外，这种战略使扩大到百万图层像素的多肽变成可能。

在 1024_2 这一像素下，StyleGAN-XL 没有与 baseline 顺利进行比起，因为受到资源管制，且它们的培训在系统设计上得感到望而却步。

左图 3 展现了像素降低后的转化试样可视化结果。

连续性和驱使

同时，还可以进一步细化所给与的重构结果。将 PTI [Roich et al. 2021] 和 StyleGAN-XL 相转化，几乎可以正确地连续性东南边 (ImageNet 验证集) 和则有缩放。同时转化器的输出维持纹理，如下左图 4 请注意。

左图 5、左图 6 展现了 StyleGAN-XL 在缩放驱使总体的机动性：

更多细节可参考原期刊。

。

成都妇科检查费用
重庆看白癜风的医院哪家好
重庆看白癜风哪家医院好
武汉妇科医院哪家好
辽宁哪家医院做人流好

关键字：时间数量

上一篇：荣耀CEO赵明：科技理想主义+革命浪漫主义，未来很难天花板

下一篇： 0530基于OpenHarmony 3.1 LTS版本实现手机基本功能，HiHopeOS将全盘支持手机类产品