Fortran Coder

查看: 12773|回复: 8
打印 上一主题 下一主题

[并行] 为什么多线程并行速度会比单线程慢很多?

[复制链接]

13

帖子

5

主题

0

精华

入门

F 币
79 元
贡献
59 点
跳转到指定楼层
楼主
发表于 2017-7-28 13:09:44 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
代码如下:
[Fortran] 纯文本查看 复制代码
program main
implicit real*8 (a-z)
include 'omp_lib.h'  
  integer i
  integer,parameter :: s=320000
  open(1,file='./epf.dat')
  call cpu_time(t1)
  call omp_set_num_threads(4)
  !$OMP PARALLEL DO PRIVATE(epf,nobs)
  do i=1,s
    epf=2.0*i
    nobs=epf**2
    write(1,*) nobs,epf
  end do
  !$OMP END PARALLEL DO
  call cpu_time(t2) 
  write(*,*) t2-t1
end

测试发现多线程会比单线程慢很多,而且线程越多越慢。
分享到:  微信微信
收藏收藏 点赞点赞 点踩点踩

10

帖子

2

主题

0

精华

入门

F 币
61 元
贡献
35 点
9#
发表于 2017-11-30 16:48:18 | 只看该作者
Jackdaw 发表于 2017-11-25 11:30
检查是否打开支持OpenMP选项

是的,Project Property->Fortran->Process OpenMP Directives>disable改掉,就可以了。

63

帖子

9

主题

0

精华

专家

超凡脱俗

F 币
474 元
贡献
237 点
8#
发表于 2017-11-25 11:30:36 | 只看该作者
redasia 发表于 2017-11-23 17:50
我将这段代码复制到一个console程序里面,却无法运行,不知何故,出现以下错误:
错误        1         error LNK2019: ...

检查是否打开支持OpenMP选项
天下英雄出我辈,一入江湖岁月催。

鸿图霸业谈笑间,不胜人生一场醉。

63

帖子

9

主题

0

精华

专家

超凡脱俗

F 币
474 元
贡献
237 点
7#
发表于 2017-11-25 11:28:59 | 只看该作者
redasia 发表于 2017-11-23 17:50
我将这段代码复制到一个console程序里面,却无法运行,不知何故,出现以下错误:
错误        1         error LNK2019: ...

[Fortran] 纯文本查看 复制代码
program main 
  use omp_lib
  implicit none 
  integer :: i 
  
  call omp_set_num_threads(5)
  !$omp parallel private(i)
    i = omp_get_thread_num()
    write(*,*) "Hello, Fortran Coder. from thread.",i
  !$omp end parallel 

  write(*,*) 
  
  call omp_set_num_threads(3)
  !$omp parallel private(i)
    i = omp_get_thread_num()
    write(*,*) "Hello, Fortran Coder. from thread.",i
  !$omp end parallel 
end program main 
天下英雄出我辈,一入江湖岁月催。

鸿图霸业谈笑间,不胜人生一场醉。

10

帖子

2

主题

0

精华

入门

F 币
61 元
贡献
35 点
6#
发表于 2017-11-23 17:50:53 | 只看该作者
fcode 发表于 2017-7-28 19:04
我的理解:
1. 并行结构最好不要包含输入输出语句,因为它们并不具有可并行性能。
2. CPU_TIME在并行结构中 ...

我将这段代码复制到一个console程序里面,却无法运行,不知何故,出现以下错误:
错误        1         error LNK2019: 无法解析的外部符号 _omp_set_num_threads,该符号在函数 _MAIN__ 中被引用

47

帖子

3

主题

0

精华

大师

F 币
1634 元
贡献
119 点

规矩勋章

5#
发表于 2017-7-29 10:53:29 | 只看该作者
fcode 发表于 2017-7-28 19:04
我的理解:
1. 并行结构最好不要包含输入输出语句,因为它们并不具有可并行性能。
2. CPU_TIME在并行结构中 ...

学习了!

13

帖子

5

主题

0

精华

入门

F 币
79 元
贡献
59 点
地板
 楼主| 发表于 2017-7-29 09:59:17 | 只看该作者
fcode 发表于 2017-7-28 19:04
我的理解:
1. 并行结构最好不要包含输入输出语句,因为它们并不具有可并行性能。
2. CPU_TIME在并行结构中 ...

多线程好像不能同时打开一个文件,我输出是先用一个数组保存数据,在循环外write。
谢谢了!

13

帖子

5

主题

0

精华

入门

F 币
79 元
贡献
59 点
板凳
 楼主| 发表于 2017-7-29 09:54:10 | 只看该作者
fcode 发表于 2017-7-28 19:04
我的理解:
1. 并行结构最好不要包含输入输出语句,因为它们并不具有可并行性能。
2. CPU_TIME在并行结构中 ...

对,我昨天发完贴就发现这个问题了,我也用的system_clock计算时间,但好像计算出来的也不大对。。。不过比用cpu_time好

2022

帖子

12

主题

5

精华

论坛跑堂

臭石头雪球

F 币
1598 元
贡献
689 点

美女勋章热心勋章星光勋章新人勋章贡献勋章管理勋章帅哥勋章爱心勋章规矩勋章元老勋章水王勋章

沙发
发表于 2017-7-28 19:04:14 | 只看该作者

回帖奖励 +10

我的理解:
1. 并行结构最好不要包含输入输出语句,因为它们并不具有可并行性能。
2. CPU_TIME在并行结构中会重复计算,并不是真实的物理挂钟时间。你占用4个线程,每个·1秒,则cpu_time就是4秒,即使真实物理时间只过了1秒。
所以,如下是一个更好的测试程序。
[Fortran] 纯文本查看 复制代码
program main
implicit none
  include 'omp_lib.h' 
  integer i
  integer,parameter :: s=3200000
  integer :: t1 , t2
  real :: epf , nobs
  open(1,file='./epf.dat')
  call system_clock(t1)
  call omp_set_num_threads(4)
  !$OMP PARALLEL DO PRIVATE(epf,nobs)
  do i=1,s
    epf=2.0*i
    nobs=epf**2
  end do
  !$OMP END PARALLEL DO
  call system_clock(t2)
  write(*,*) t2-t1
end



您需要登录后才可以回帖 登录 | 极速注册

本版积分规则

捐赠本站|Archiver|关于我们 About Us|小黑屋|Fcode ( 京ICP备18005632-2号 )

GMT+8, 2024-11-23 23:26

Powered by Tencent X3.4

© 2013-2024 Tencent

快速回复 返回顶部 返回列表