执行nvidia-smi.exe,显示的显存差1G多,比如原本是24G显存,结果只显示了22G多。
直接说结论:开启ECC导致可用显存少了一部分,那部分用于支持ECC功能了。
Tesla系列GPU默认开启了ECC(error correcting code,错误检查和纠正)功能,该功能可以提高数据的正确性,随之而来的是可用内存的减少和性能上的损失。
(资料图片)
关闭、开启各有利弊,一般不建议关闭--为了正确性
如果放弃保障正确性而单纯追求性能,那就关闭,看你自己
我自己的电脑是rtx2070 super显卡,8G显存,执行nvidia-smi.exe显示的显存是8192MB
执行nvidia-smi -q -d ecc查看ecc情况:
我电脑显卡不支持ecc
nvidia-smi -q -d ecc
通过 nvidia-smi -i n -e 0/1 可关闭(0)/开启(1)第n号GPU的ECC模式,重启后该设置生效。
nvidia-smi -L 显示了一个显卡,即0号显卡
关闭ECC:nvidia-smi -i 0 -e 0
开启ECC:nvidia-smi -i 0 -e 1
可惜我电脑显卡不支持ecc,消费卡便宜有便宜的道理(企业卡贵有贵的道理--支持ecc啊)
参考:https://blog.csdn.net/sxjcXiaomin/article/details/78652924
https://www.nvidia.com/content/Control-Panel-Help/vLatest/zh-cn/mergedProjects/nvwksCHS/To_turn_your_GPU_ECC_on_or_off.htm
关键词: