Fortran Coder

标题: 小白求指点,如何使用OpenMP [打印本页]

作者: Villain    时间: 2014-12-16 08:58
标题: 小白求指点,如何使用OpenMP
今天下了一个OpenMP的PDF并试验了一下,发现运算时间根本没有减少
以下是代码:
[Fortran] 纯文本查看 复制代码
integer::I
integer,dimension(100000)::a
real::stime,etime
!!$OMP PARALLEL
!Print*,"ok"
!!$OMP END PARALLEL

call cpu_time(stime)

!$OMP DO
do i=1,100000
  do j=1,100000
    k=J
  enddo
  a(i)=i**2+1
end do
!$OMP END DO
call cpu_time(etime)
write(*,*)stime,etime,etime-stime

pause
end


这个的运行时间是18.46812

而 把omp的语句删除之后运行时间是18.37692

是我打开方式有问题吗?

!$OMP PARALLEL
Print*,"ok"
!$OMP END PARALLEL
这段代码检查了一下,系统是8核的,也确实出现了八个OK,说明设置没有错误。

作者: li913    时间: 2014-12-16 10:25
两个问题:
1、OMP并行,检测耗时不用 CPU_time,用 OMP_get_wtime
作者: li913    时间: 2014-12-16 10:29
2、所有并行语句都必须包含在并行域中,否则视为串行。
!$OMP PARALLEL DO clause1 clause2 ...
...
!$OMP END PARALLEL DO

这里有中文资料
http://fcode.cn/resource_ebook-24-1.html
作者: Villain    时间: 2014-12-17 08:54
li913 发表于 2014-12-16 10:29
2、所有并行语句都必须包含在并行域中,否则视为串行。
!$OMP PARALLEL DO clause1 clause2 ...
...

谢谢指点。
也就是说在用OMP的时候,必须要人为的划分一片并行域并在这块域中执行并行代码,而不是说让计算机自己判断。
但是我用
!$OMP PARALLEL DO clause1 clause2 ...
...
!$OMP END PARALLEL DO
这个的时候老是报错,最后就是
!$OMP PARALLEL
...
!$OMP END PARALLEL
来划分并行域。
并且执行时间是23秒左右,反而比单线程的18秒还要慢
这就是传说中的不做死就不会死?

还有cpu_time 跟OMP_get_wtime()的区别是什么?是不是cpu_time只是返回当前运行cpu_time函数的线程的时间而非每一个线程执行完后的时间?

谢谢~~~~

作者: li913    时间: 2014-12-17 11:26
1、并行循环有两种表示,一是将并行和循环分开,二是联合表示;
!$OMP PARALLEL
!$OMP PARALLEL DO
...第1种
!$OMP END  DO
!$OMP END PARALLEL

!$OMP PARALLEL DO
...第二种
!$OMP END PARALLEL DO

2、并行处理不好可能比串行更耗时;
3、简单理解,cpu_time是所有核心耗时的总和,而OMP_get_wtime是程序运行的真实时间。n个核并行时,前者大致是后者的n倍。

1.jpg (69.53 KB, 下载次数: 185)

1.jpg

2.png (40.22 KB, 下载次数: 178)

2.png

3.png (36.14 KB, 下载次数: 179)

3.png

作者: li913    时间: 2014-12-17 11:29
4、对比效率时,需在release模式下,并关闭优化。
作者: Villain    时间: 2014-12-18 09:19
li913 发表于 2014-12-17 11:29
4、对比效率时,需在release模式下,并关闭优化。

太感谢了,谢谢指点!!
作者: andy8496    时间: 2014-12-18 16:13
li913 发表于 2014-12-17 11:29
4、对比效率时,需在release模式下,并关闭优化。

这个原因何在?
作者: li913    时间: 2014-12-18 17:54
1、debug模式下,会执行许多额外的调试代码,这些代码与程序任务本身无关;
2、编译器优化是非线性的(也可理解为不确定, 例如循环400次和200次的时间之比不一定是2倍),同样难以反映加速比(串行运行时间/并行运行时间)。
因此对比需在release模式下,并关闭优化。
作者: 百事可乐    时间: 2014-12-21 12:05
现在编译器有自动矢量化 , 多核 CPU 自动调度等.

所以简单的代码用 OpenMP 不一定就能快多少




欢迎光临 Fortran Coder (http://bbs.fcode.cn/) Powered by Discuz! X3.2