Fortran Coder

查看: 6726|回复: 9
打印 上一主题 下一主题

[并行] 小白求指点,如何使用OpenMP

[复制链接]

60

帖子

17

主题

0

精华

专家

F 币
454 元
贡献
266 点
跳转到指定楼层
楼主
发表于 2014-12-16 08:58:49 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
今天下了一个OpenMP的PDF并试验了一下,发现运算时间根本没有减少
以下是代码:
[Fortran] 纯文本查看 复制代码
integer::I
integer,dimension(100000)::a
real::stime,etime
!!$OMP PARALLEL
!Print*,"ok"
!!$OMP END PARALLEL

call cpu_time(stime)

!$OMP DO
do i=1,100000
  do j=1,100000
    k=J
  enddo
  a(i)=i**2+1
end do
!$OMP END DO
call cpu_time(etime)
write(*,*)stime,etime,etime-stime

pause
end


这个的运行时间是18.46812

而 把omp的语句删除之后运行时间是18.37692

是我打开方式有问题吗?

!$OMP PARALLEL
Print*,"ok"
!$OMP END PARALLEL
这段代码检查了一下,系统是8核的,也确实出现了八个OK,说明设置没有错误。
分享到:  微信微信
收藏收藏 点赞点赞 点踩点踩

835

帖子

2

主题

0

精华

大宗师

F 币
3926 元
贡献
2334 点
沙发
发表于 2014-12-16 10:25:29 | 只看该作者
两个问题:
1、OMP并行,检测耗时不用 CPU_time,用 OMP_get_wtime

835

帖子

2

主题

0

精华

大宗师

F 币
3926 元
贡献
2334 点
板凳
发表于 2014-12-16 10:29:20 | 只看该作者
2、所有并行语句都必须包含在并行域中,否则视为串行。
!$OMP PARALLEL DO clause1 clause2 ...
...
!$OMP END PARALLEL DO

这里有中文资料
http://fcode.cn/resource_ebook-24-1.html

评分

参与人数 1F 币 +12 贡献 +12 收起 理由
fcode + 12 + 12 很给力!

查看全部评分

60

帖子

17

主题

0

精华

专家

F 币
454 元
贡献
266 点
地板
 楼主| 发表于 2014-12-17 08:54:13 | 只看该作者
li913 发表于 2014-12-16 10:29
2、所有并行语句都必须包含在并行域中,否则视为串行。
!$OMP PARALLEL DO clause1 clause2 ...
...

谢谢指点。
也就是说在用OMP的时候,必须要人为的划分一片并行域并在这块域中执行并行代码,而不是说让计算机自己判断。
但是我用
!$OMP PARALLEL DO clause1 clause2 ...
...
!$OMP END PARALLEL DO
这个的时候老是报错,最后就是
!$OMP PARALLEL
...
!$OMP END PARALLEL
来划分并行域。
并且执行时间是23秒左右,反而比单线程的18秒还要慢
这就是传说中的不做死就不会死?

还有cpu_time 跟OMP_get_wtime()的区别是什么?是不是cpu_time只是返回当前运行cpu_time函数的线程的时间而非每一个线程执行完后的时间?

谢谢~~~~

835

帖子

2

主题

0

精华

大宗师

F 币
3926 元
贡献
2334 点
5#
发表于 2014-12-17 11:26:46 | 只看该作者
1、并行循环有两种表示,一是将并行和循环分开,二是联合表示;
!$OMP PARALLEL
!$OMP PARALLEL DO
...第1种
!$OMP END  DO
!$OMP END PARALLEL

!$OMP PARALLEL DO
...第二种
!$OMP END PARALLEL DO

2、并行处理不好可能比串行更耗时;
3、简单理解,cpu_time是所有核心耗时的总和,而OMP_get_wtime是程序运行的真实时间。n个核并行时,前者大致是后者的n倍。

1.jpg (69.53 KB, 下载次数: 233)

1.jpg

2.png (40.22 KB, 下载次数: 224)

2.png

3.png (36.14 KB, 下载次数: 238)

3.png

835

帖子

2

主题

0

精华

大宗师

F 币
3926 元
贡献
2334 点
6#
发表于 2014-12-17 11:29:27 | 只看该作者
4、对比效率时,需在release模式下,并关闭优化。

60

帖子

17

主题

0

精华

专家

F 币
454 元
贡献
266 点
7#
 楼主| 发表于 2014-12-18 09:19:14 | 只看该作者
li913 发表于 2014-12-17 11:29
4、对比效率时,需在release模式下,并关闭优化。

太感谢了,谢谢指点!!

131

帖子

34

主题

0

精华

宗师

F 币
1602 元
贡献
813 点
8#
发表于 2014-12-18 16:13:50 | 只看该作者
li913 发表于 2014-12-17 11:29
4、对比效率时,需在release模式下,并关闭优化。

这个原因何在?

835

帖子

2

主题

0

精华

大宗师

F 币
3926 元
贡献
2334 点
9#
发表于 2014-12-18 17:54:41 | 只看该作者
1、debug模式下,会执行许多额外的调试代码,这些代码与程序任务本身无关;
2、编译器优化是非线性的(也可理解为不确定, 例如循环400次和200次的时间之比不一定是2倍),同样难以反映加速比(串行运行时间/并行运行时间)。
因此对比需在release模式下,并关闭优化。

100

帖子

0

主题

0

精华

专家

F 币
550 元
贡献
291 点

规矩勋章元老勋章

QQ
10#
发表于 2014-12-21 12:05:06 | 只看该作者
现在编译器有自动矢量化 , 多核 CPU 自动调度等.

所以简单的代码用 OpenMP 不一定就能快多少
您需要登录后才可以回帖 登录 | 极速注册

本版积分规则

捐赠本站|Archiver|关于我们 About Us|小黑屋|Fcode ( 京ICP备18005632-2号 )

GMT+8, 2024-12-25 09:42

Powered by Tencent X3.4

© 2013-2024 Tencent

快速回复 返回顶部 返回列表