英伟达优化 DLSS 4:Transformer 模型显存占用减少 20%

内容摘要IT之家 6 月 29 日消息,除了推出 DLSS 4 正式版,英伟达还在其最新的 DLSS SDK 版本中对显存(VRAM)使用进行了优化。VideoCardz 发现,DLSS 310.3.0 将 Transformer 模型的显存使用量

IT之家 6 月 29 日消息,除了推出 DLSS 4 正式版,英伟达还在其最新的 DLSS SDK 版本中对显存(VRAM)使用进行了优化。VideoCardz 发现,DLSS 310.3.0 将 Transformer 模型的显存使用量降低了 20%。

此次更新后,DLSS 的显存占用情况更接近传统的 CNN 模型。此前,DLSS 的 Transformer 模型显存占用几乎是其替代的 CNN 模型的两倍。然而,经过英伟达的优化,现在的 Transformer 模型仅比 CNN 模型多占用 40% 的显存。具体而言,在 1080p 分辨率下,旧版 Transformer 模型占用 106.9MB 显存,而新版仅占用 85.77MB,相比之下,CNN 模型则占用 60.83MB 显存。DLSS 的显存占用会随着分辨率的提高而线性增加,例如在 4K 分辨率下,Transformer 模型的显存占用会增加 3.5 倍,达到 307.37MB。

据IT之家了解,显存占用的优化在实际应用中可能不太容易被察觉,例如,在 4K 分辨率下,DLSS 显存占用的减少仅为 80MB,而在 1440p 和 1080p 分辨率下,减少的显存容量则更少。对于现代显卡的显存容量来说,80MB 或更少的减少几乎可以忽略不计。不过,在 8K 分辨率下,DLSS Transformer 模型的显存占用仍然较高,即使经过优化后,其显存占用仍超过 1GB。

尽管如此,Transformer 模型显存占用减少 20% 仍然令人印象深刻,尤其是考虑到该模型的强大功能。DLSS 4 的 Transformer 模型参数数量是其 CNN 前身的两倍,能够实现接近原生图像质量的超分辨率效果。英伟达此前也曾对 DLSS 3.8.10 进行过类似的优化,未来 DLSS 4 的 DLL 文件有望进一步精简。

值得注意的是,此次显存优化仅针对 Transformer 超分辨率模型,而不涉及帧生成部分。DLSS 4 在帧生成方面也取得了显著进步,显存占用减少了 30%。帧生成部分的显存占用远高于 DLSS 的超分辨率部分。例如,英伟达在其一篇博客文章中提到,《战锤 40K:暗潮》在 4K 分辨率下使用 DLSS 4 帧生成功能时,显存占用比 DLSS 3 减少了 400MB。

 
举报 收藏 打赏 评论 0
今日推荐
浙ICP备2021030705号-9

免责声明

本网站(以下简称“本站”)提供的内容来源于互联网收集或转载,仅供用户参考,不代表本站立场。本站不对内容的准确性、真实性或合法性承担责任。我们致力于保护知识产权,尊重所有合法权益,但由于互联网内容的开放性,本站无法核实所有资料,请用户自行判断其可靠性。

如您认为本站内容侵犯您的合法权益,请通过电子邮件与我们联系:675867094@qq.com。请提供相关证明材料,以便核实处理。收到投诉后,我们将尽快审查并在必要时采取适当措施(包括但不限于删除侵权内容)。本站内容均为互联网整理汇编,观点仅供参考,本站不承担任何责任。请谨慎决策,如发现涉嫌侵权或违法内容,请及时联系我们,核实后本站将立即处理。感谢您的理解与配合。

合作联系方式

如有合作或其他相关事宜,欢迎通过以下方式与我们联系: