|
我是用nvfortran 编译器对Fortran代码做的编译,
(1)用nvfortran -stdpar=multicore myprogram.F90 -o program_multicore
(2)用nvfortran -stdpar=gpu myprogram.F90 -o program_gpu
问题1:采用的是nv hpc 21.9 sdk安装的编译环境,GPU是RTX 3080,国产cpu(海光cpu),program_multicore无法运行,program_gpu可以运行,有什么解决办法吗?
问题2:在上面的机器上运行program_gpu,耗时6秒。但在另一个台式机上(intel I7的CPU)运行program_multicore,耗时1秒。有没有知道这会是什么原因呢?我以为program_gpu怎么也会比program_multicore快呢!
|
|