英伟达公布StyleGAN-XL:弼数量3倍于StyleGAN3,计算时间仅为1/5
发布时间:2025年08月25日 12:20
实验表格明,即使是最最初 StyleGAN3 也不能最好地遍及 ImageNet 上,如左图 1 请注意。特别是在可视时,培训就会似乎不稳定。因此,科学家的第一个目标是在 ImageNet 上成功地培训一个 StyleGAN3 转化器。成功的定义取决于主要通过初始评分 (IS)[Salimans et al. 2016] 衡量国际标准的试样质量和 Fréchet 初始距离 (FID)[Heusel et al. 2017] 衡量国际标准的自然。
在期刊里面,科学家也介绍了 StyleGAN3 baseline 顺利进行的改动,所助长的增强如下表格 1 请注意:
科学家首先改动了转化器及其正则化重大损失,调整了潜在三维空间以适应 Projected GAN (Config-B) 和类条件设 (Config-C);然后再咨询了渐进式增长,以降低培训加速和机动性 (Config-D);接下来科学研究了应用于 Projected GAN 培训的特征网络服务,以找到一个非常适合的配置 (Config-E);仍要,科学家重申了线性系统驱使,以便 GAN 通过一个亦同培训的线性系统 (Config-F) 提供类数据集。
这样一来,就必须培训一个比实际上高得多的数学方法,同时须要比整体系统设计相比之下的计算量。StyleGAN-XL 在深度和参数计数总体比国际标准的 StyleGAN3 大三倍。然而,为了在 512_2 图层的像素下匹配 ADM [Dhariwal and Nichol 2021] 系统设计的机动性,在机器 NVIDIA Tesla V100 上培训数学方法须要 400 天,而实际上须要 1914 天。(左图 2)。
实验结果
在实验里面,科学家首先将 StyleGAN-XL 与 ImageNet 上的 SOTA 缩放多肽方法顺利进行比起。然后对 StyleGAN-XL 的连续性和主编机动性顺利进行了评价。科学家将数学方法遍及了 1024_2 图层的像素,这是以后在 ImageNet 上没有更进一步过的。在 ImageNet 里面,大多数缩放的像素较低,因此科学家用超像素网络服务 [Liang et al. 2021] 对数据集顺利进行了亦同处理。
缩放多肽
如表格 2 请注意,科学家在 ImageNet 上对比了 StyleGAN-XL 和整体最稳固的 GAN 数学方法及外扩散数学方法的缩放多肽机动性。
无聊的是,StyleGAN-XL 在所有像素下都实现了相对于的自然,这可以众所周知渐进式发育战略。此外,这种战略使扩大到百万图层像素的多肽变成可能。
在 1024_2 这一像素下,StyleGAN-XL 没有与 baseline 顺利进行比起,因为受到资源管制,且它们的培训在系统设计上得感到望而却步。
左图 3 展现了像素降低后的转化试样可视化结果。
连续性和驱使
同时,还可以进一步细化所给与的重构结果。将 PTI [Roich et al. 2021] 和 StyleGAN-XL 相转化,几乎可以正确地连续性东南边 (ImageNet 验证集) 和则有缩放。同时转化器的输出维持纹理,如下左图 4 请注意。
左图 5、左图 6 展现了 StyleGAN-XL 在缩放驱使总体的机动性:
更多细节可参考原期刊。
。成都妇科检查费用重庆看白癜风的医院哪家好
重庆看白癜风哪家医院好
武汉妇科医院哪家好
辽宁哪家医院做人流好
- 2022年财多运广,3大生肖揽走好运,步步高升,有容之命
- 高血压人群能吃羊肉吗?提醒:若想血压顺畅,3种肉食尽量少碰
- 丁彦雨航14分高诗岩13+17 山东两人伤退获胜吉林
- 据说5个健康小动作,胜过群众运动2小时!老年人必学的健康秘籍
- 明日爵士对阵公牛 盖伊&杜兰特缺战 大白边大概率出战
- 不要让这些行为,毁了孩子的近视!(家有孩子,一定要看看)
- 国足若赴沙迦将带球员25人左右 11月末两战难度颇大
- 三岁看大,七岁看杨家,不要让孩子在三岁错过一生
- 贾秀全认为自己是有功之臣,难道他还想执教辽宁队吗?
- 儿童脚踝后多久能上学?
- 老年人多晒主星有利健康吗?究竟几点的主星最合适?
- 16中7,阿蒂砍21+5+5被球迷高呼MVP!76人能签下他要感谢里弗斯
- 网购葛根粉条让59岁大货车肾衰竭
- 相当严重的黑眼圈怎么办