├── README.md # 说明文档 ├── benchmark.yaml # 配置文件,设置测试模型及模型参数 ├── run_all.sh # 执行入口,测试并获取所有生成对抗模型的训练性能 └── run_benchmark.sh # 执行实体,测试单个分割模型的训练性能 - 单机(单卡、8卡)
- 系统:CentOS release 7.5 (Final)
- GPU:Tesla V100-SXM2-32GB * 8
- CPU:Intel(R) Xeon(R) Gold 6271C CPU @ 2.60GHz * 80
- CUDA、cudnn Version: cuda10.2-cudnn7
BasicVSR模型因竞品torch模型只能测4卡,故这里也测4卡。
因REDS数据集较大,避免每次下载时间较长,需要在Docker建立好后,将REDS数据集放到/workspace/data/目录一下。
- 镜像版本:
registry.baidubce.com/paddlepaddle/paddle:2.1.2-gpu-cuda10.2-cudnn7 - paddle 版本:
2.1.2 - CUDA 版本:
10.2 - cuDnn 版本:
7
ImageName="registry.baidubce.com/paddlepaddle/paddle:2.1.2-gpu-cuda10.2-cudnn7" docker pull ${ImageName} run_cmd="set -xe; cd /workspace ; bash -x benchmark/run_all.sh" nvidia-docker run --name test_paddlegan -i \ --net=host \ --shm-size=128g \ -v $PWD:/workspace \ ${ImageName} /bin/bash -c "${run_cmd}" 如果需要打开profile选项,可以直接替换run_cmd为:
run_cmd="set -xe; cd /workspace ; bash -x benchmark/run_all.sh on" 执行完成后,在PaddleGAN目录会产出模型训练性能数据的文件,比如esrgan_mp_bs32_fp32_8等文件。