NVIDIA 3090 利用HSOpticalFlow代码测试docker GPU性能损失
docker介绍图如下:

 形象生动展示了他们之间的关系
 今天要测试docker容器运行HSOpticalFlow算法的性能损失,包括CPU和GPU
 上一篇博客
 http://t.csdnimg.cn/YW5kE
 我已经介绍了使用docker和nvidia containers toolkit使用容器复现的过程,加入计算时间的代码页贴出来了:
 http://t.csdnimg.cn/InxW0
 这篇文章与docker中的运行速度做比较
 因为GPU需要预热,所以计算2000次求平均
 CPU修改成10次求平均
 修改上一篇博客的代码
	for (int i = 0; i < 1000; i++) {ComputeFlowCUDA(h_source, h_target, width, height, stride, alpha, nLevels, nWarpIters, nSolverIters, h_u, h_v);}cudaEventRecord(stopGPU);cudaEventSynchronize(stopGPU);cudaEventElapsedTime(&millisecondsGPU, startGPU, stopGPU);printf("Average GPU Processing time: %f ms\n", millisecondsGPU / 1000);
docker里运行速度:
	root@04feecd3dc8a:/workspace/cuda-samples-master/Samples/5_Domain_Specific/HSOpticalFlow# ./HSOpticalFlow 
HSOpticalFlow Starting...GPU Device 0: "Ampere" with compute capability 8.6Loading "frame10.ppm" ...
Loading "frame11.ppm" ...
开始计算,预计3分钟
Computing optical flow on GPU...
GPU Processing time: 31.399443 ms
Computing optical flow on CPU...
CPU Processing time: 10634 ms
L1 error : 0.044308docker外运行速度:
yhp1szh@SZH-C-006RW:/mnt/workspace/xiebell/pytorch2404/cuda-samples-master/Samples/5_Domain_Specific/HSOpticalFlow$ ./HSOpticalFlow 
HSOpticalFlow Starting...GPU Device 0: "Ampere" with compute capability 8.6Loading "frame10.ppm" ...
Loading "frame11.ppm" ...
开始计算,预计3分钟
Computing optical flow on GPU...
GPU Processing time: 31.284836 ms
Computing optical flow on CPU...
CPU Processing time: 8843 ms
L1 error : 0.044308
性能损失计算方法
性能损失可以通过以下公式计算:


 对于GPU:
性能损失百分比≈0.365%
对于CPU:
性能损失百分比≈20.25%