Fortran Coder

标题: 关于fortran里指针的讨论 [打印本页]

作者: btx97    时间: 2014-2-20 00:58
标题: 关于fortran里指针的讨论
本帖最后由 btx97 于 2014-2-20 15:53 编辑

因为听说高手都是指针用的比较多的,所以最近在考虑fortran里指针的作用。特意发帖希望高手们能来一起讨论下,让我们学习中的新人长点知识。:lol:lol
在fortran 95/2003 for scientists and engineerings 书中指出,在数组交换的过程中,用指针交换的效率明显比用普通变量交换的效率要高。 所以自己写代码比较了一下效率,代码为
[Fortran] 纯文本查看 复制代码
program test_pointer
  implicit none
  real, dimension(100,100), target :: array1, array2
  real, dimension(:,:), pointer :: p1, p2, temp_p
  real, dimension(100,100) :: a1, a2, temp

  integer :: i
  real :: begin, end

  call random_number(a1)
  call random_number(a2)

  array1=a1
  array2=a2

  p1=>array1
  p2=>array2
  call cpu_time(begin)
  do i=1,1000000
     temp=a1
     a1=a2
     a2=temp
  end do
  call cpu_time(end)
     
  write(*,*) 'Time of variable exchange:', end-begin

  call cpu_time(begin)
  do i=1,1000000
     temp_p=>p1
     p1=>p2
     p2=>temp_p
  end do
  call cpu_time(end)

  write(*,*) 'Time of pointer exchange:', end-begin

end program test_pointer

运行结果为:

[Shell] 纯文本查看 复制代码
$ ./a.out 
Time of variable exchange:   4.5159998   
Time of pointer exchange:  8.00037384E-03




可以发现用指针的确比用普通变量有效。
不过我还有个疑问希望高手能解答下。 fortran中指针所占内存的是不是比它的Target要少很多?  因为如果fortran中指针所占内存跟它的Target一样,那么虽然代码效率是提高了,但所耗资源也提高了不少,就不见得很经济。 

此外,指针在链表里的应用很多书上都讲了。我觉得我们可以先不考虑指针在结构数据的应用。

十分希望各位高手能把自己使用指针的经验体会拿出来分享下, 共同讨论下fortran中指针的优缺点。




作者: 楚香饭    时间: 2014-2-20 09:49
Fortran 的指针具有特殊性。一般来说,所占的内存比它的Target要少很多很多。

if 指向单变量或结构体 then
  在32位编译器里,Fortran指针仅占 4 字节。通常叫 address
else 指向数组或结构体指针 then
  不同编译器会不同。它们会定义一个结构体来描述指向的数组。老外叫 descriptor
endif

单变量就不说了,与 C 的指针是一样的。C++如果不特别处理,指针也是4字节,仅仅表示目标的地址。
指向数组的话,descriptor 大概会是类似这样一个结构体:
Type Pointer_descriptor
  integer Pointer_address !// 这个是与 address 等效的
  integer Array_Dimension !// 数组的维度
  integer Array_Size_Element !// 数组每个元素的大小
  integer ArrayUBound( Array_Dimension ) , ArrayDBound( Array_Dimension ) !// 每个维度的上下限
End Type Pointer_descriptor

这个结构体在源代码中并不存在,Intel Fortran 会采用类似这样的结构来描述一个指向数组的指针。其他编译器会有类似的描述,但不完全相同。

由此可知,指向数组的指针所占的内存,通常在几十字节。如果你指向一个 a(2,2) 的数组,那么指针所占的内存反而比数组本身还大。如果你指向一个 a(100,100) 的数组,那么指针所占的内存就比数组小得多了。

Fortran 的指针,会比 C 的指针占的内存要大一些。

指针交换数组,通常也会比数组直接交换要高效。(注意是通常,上面的可作为反例)
这可以从生活中得到一些类比:

假设两家人,王家住在XX街18号,李家住在XX街9号。现在两家要搬家,各自搬到对方家。(交换房屋)
数组交换就好比:王家把家具床柜子桌子凳子日用品全部搬到临时住处,然后李家把家具床柜子桌子凳子日用品全部搬到王家,最后王家再从临时住处搬到李家。
而指针交换就好比:把18号门牌挂到临时住处,把9号门牌挂到原18号,最后把18号门牌挂到原9号。

显然,指针交换更高效。

Fortran 的指针与 C 的指针差别就是,C 的指针只有地址(门牌号),Fortran 的指针除了地址,还有数组的一些参数,如维度,单元素的大小,各维度上下限(可以类比王家李家的电费余额,水表底数)。
作者: jason388    时间: 2014-2-20 15:08
Fortran指针是Fortran90标准引进的,之前Fortran中没有指针(编译器扩展除外),所以Fortran77高手基本上不使用指针。

Fortran的强项在于数组操作,所以学习Fortran一定要下功夫学好数组相关的内容。

在Fortran中,指针一般用在一些特殊的场合,比如链表等动态数据结构的实现,与C的互操作以及楼主提到的通过地址操作才能实现高效的少数场合。指针的缺点是容易出现内存泄漏和dangling pointers,因此应用要非常小心。除此之外,可用于可分配数组的一些内部函数也不能用于指针。

作者: fcode    时间: 2014-2-20 15:28
楼上说得没错,严谨和灵活往往不可兼得。

实际上,Fortran 的参数默认是传址的,一定程度上就是指针。所以语法层面上不使用指针也能完成很多事情。

而 C 的参数默认是传值的,如果语法层面上也不使用指针,很多事情就捉襟见肘。

我对指针还是抱有挺乐观的观点的,如果有大量数据的操作,合理应用指针可以提高程序执行效率。

但稍不熟练就容易造成内存里分配了数据,指针都指走了,导致占用内存而且无法使用,如果这样的情况出现在循环里,就是内存泄露,情况就遭了。
作者: btx97    时间: 2014-2-20 16:12
chuxf 发表于 2014-2-20 09:49
Fortran 的指针具有特殊性。一般来说,所占的内存比它的Target要少很多很多。

if 指向单变量或结构体 then ...

谢谢讲解,又增长了点知识。

这样看来用指针指向大型数组是比较划算的:lol。 

单个变量是不是就不怎么样了,因为一个real好像也是4字节吧。 

另外也谢谢jason388和fcode能说出自己对指针的理解。
作者: fcode    时间: 2014-2-20 17:33
指向单变量的指针也是可以用的。

譬如,以前要相同的处理两个量。需要写两种可能,有了指针,只写一种就可以了。

[Fortran] 纯文本查看 复制代码
real :: rAmp , rPhz
if ( ... )
  call proc( rAmp )
  rAmp = func( rAmp )
  call write( rAmp )
else
  call proc( rPhz )
  rPhz = func( rPhz )
  call write( rPhz )
end if


用指针的话,可以很简单的写为:
[Fortran] 纯文本查看 复制代码
real , target :: rAmp , rPhz
real , pointer :: p
if ( ... )
  p => rAmp
else
  p => rPhz
end if
call proc( p )
p = func( p )
call write( p )


当然了,把那三句话写成子程序,用 rAmp 和 rPhz 分别做参数,也可以。但是相对还是麻烦些
作者: delta    时间: 2014-2-21 10:08
膜拜各位大虾

Fortran还不支持指针数组,不然在数值计算中也可以经常用用的
作者: 楚香饭    时间: 2014-2-21 10:29
delta 发表于 2014-2-21 10:08
膜拜各位大虾

Fortran还不支持指针数组,不然在数值计算中也可以经常用用的 ...

有一个像是“耍赖皮”的方法使用指针数组。

[Fortran] 纯文本查看 复制代码
type pST_Array
  real , pointer :: p( : )
end type pST_Array
Type ( pST_Array) , pointer :: pA( : )
integer :: i , j
Allocate( pA( 10 ) ) !// 产生10个指向数组的指针。
Do i = 1 , 10
  Allocate( pA(i)%p(2) ) !// 每个指针指向一个2元素数组
  Do j = 1 , 2
    pA(i)%p(j) = i*100+j
  End Do
End Do
Do i = 1 , 10
  write( * , * ) pA(i)%p( : )
End Do  
!// 尚未书写释放指针代码
End Program

作者: 楚香饭    时间: 2014-2-21 10:34
这里写 Fortran 代码有个 bug

p(:) 会被替换成表情。得写成 p( : )
作者: btx97    时间: 2014-2-21 16:33
本帖最后由 btx97 于 2014-2-21 16:37 编辑
delta 发表于 2014-2-21 10:08
膜拜各位大虾

Fortran还不支持指针数组,不然在数值计算中也可以经常用用的 ...

c 语言有指针数组和数组指针的区别,但fotran里好像没有这样的区别吧。

我的例子程序中p1指向了一个数组,这是数组指针的概念的吧。
但p1本身也是个数组,p1(i,j)可以取出所对应的变量值,这个是指针数组的概念吧。

c语言里可以移动一个指针到指定内存单元,如p+1。fortran里好像没这个功能。
而且fortran里也不能拿单个(非数组)指针去指向一个数组。
我哪说错了,你们随便指正哈。学习中,有人指出错误很重要。

作者: 楚香饭    时间: 2014-2-21 17:30
本帖最后由 chuxf 于 2014-2-21 17:36 编辑
btx97 发表于 2014-2-21 16:33
c 语言有指针数组和数组指针的区别,但fotran里好像没有这样的区别吧。

我的例子程序中p1指向了一个数组 ...

Fortran 里只有数组指针,指针数组可以像 8 楼的代码那样。

你的程序里 p1 是数组指针。p1 是指针,不是数组,只不过它指向的目标是数组。

p1(i,j) 可以取出对应的变量值,但 p1 依然是指针,不是数组。

关于指针 p+1 ,实现是非常容易的。只是地址加上每元素占用的字节数既可。但是 Fortran 语法不允许,目的是防止指针指向数组范围之外。

Fortran 指向数组的指针(数组指针),不单单是数组的首地址,而且包含数组的维度和上下限,因此,更可有效防范指针指向数组范围之外。

从编译器实现上看,Fortran的指针是受约束的,实现起来更难(换句话说,写一个支持指针的 Fortran 编译器,比写一个支持指针的 C 编译器难得多)。受约束会影响灵活性,但可增加数据安全。

这就好像 Discuz 论坛(咱们论坛使用的程序)一样,它使用了大量的代码来限制普通会员的 HTML 使用,比如会员发帖时输入 <iframe src="某恶意网址">,论坛程序会对这段代码进行改动,使得它并不会被浏览器当做插入页面来解释,所以在论坛发帖的时候你做不出漂亮的网页效果。但是,对论坛来说更安全。

最后,指向普通变量的指针,不能直接指向一个数组,但可以指向数组的某个元素,或者 type 派生类型的某一个普通变量成员。

[Fortran] 纯文本查看 复制代码
real ,pointer :: p
real , target :: a( 10 )
integer :: i
Do i = 1 , 10
p => a(i)
End Do









欢迎光临 Fortran Coder (http://bbs.fcode.cn/) Powered by Discuz! X3.2