内容简介
本书为并行计算系列从书之四,旨在介绍并行算法的具体编程实现以及与其相关的并行程序设计基础。全书从内容安排上分为上下两篇。上篇介绍并行程序设计导论,主要包括并行程序设计基础、并行程序编程指南和并行程序开发方法。下篇介绍并行算法编程实现,主要包括非数值并行算法及其MPI编程实现,数值计算并行算法及其MPI编程实现。本书可作为高等学校计算机及相关专业的本科学生和研究生的教材,其中上篇和下篇也可分别作为“并行程序设计导论”和“并行算法编程指南”单独使用。
目录
陈国良,中国科学技术大学教授,1938年6月生,安徽颖上人。1961年毕业于西安交通大学无线电系计算机专业。现任国家高性能计算中心(合肥)主任,博士生导师,国家教育部高等学校计算机科学技术教学指导委员会副主任,全国高等教育电子、电工与信息类专业自考指导委员会副主任,中国计算机学会理事,中国计算机学会开放系统专业委员会副主任,中国数学会计算数学并行计算专业委员会委员,中国计算机学会数据通信与计算机网络专业委员会委员,全国自然科学名词审定委员会委员。曾任中国科学技术大学计算机系主任和安徽省计算机学会理事长。享受国家政府特殊津贴。 陈国良教授长期从事计算机科学技术的教学与研究工作。主要研究领域为并行算法、计算机体系结构、计算机网络和神经计算等。先后主持完成了10多项国家863计划、国家攀登计划、国家973计划、国家自然基金、教育部博士基金等科研项目。取得了多项被国内外广泛引用的、达到水平的科研成果,发表论文100多篇,出版著作7部、译著5部,参与主编计算机类词典、词汇5部,主审、主编计算机类各种教材8部。曾获二等奖以及部、省、院级一等、二等、三等奖共11项。 十几年来,陈国良教授先后指导计算机专业硕士研究生40余名和博士研究生30余名,率先创建了我国第一个国家高性能计算中心,为我国培养了一批在国内外从事算法研究的人才。 日前,水利部淮河水利委员会在致中国科学技术大学的感谢信中说:“感谢陈国良教授项目组,在淮河今夏防洪战斗中亲临防洪调度第一线以及提供高性能计算支持,使我们取得了战胜特大洪水的胜利。”感谢信中提到的陈国良,人称“神算子”,现为中国科学技术大学教授,博士生导师,国家高性能计算中心(合肥)主任,高性能计算(亚洲)常务理事。不计名利,振兴国货陈国良教授是安徽省颍上人,父母都是地地道道的庄稼人,大字不识一个。由于家里困难,陈教授靠国家的助学金读完了中学。1956年考入上海交通大学电力系,成为方圆几十里的第一个大学生。进入大学不久,随大学整体搬迁到西安,他又成了西安交通大学的学生。1961年毕业后,参军从事国防科研工作,1973年,陈教授调入科大,至今在科大从事教育科研事业整整30年。 从大学时代起,陈教授就参加了电子管计算机和晶体管计算机等两代国产计算机的研制,对民族计算机事业深有感情。由于的影响,我国自行研制的计算机与世界水平的差距在不
摘要与插图
上篇 并行程序设计导论单元 Ⅰ 并行程序设计基础
第一章 并行计算机系统与结构模型
1.1 典型并行计算机系统简介
1.1.1 阵列处理机
按照Flynn的分类法,阵列处理机(或称阵列机)属于SIMD(Single Instruction Multiple Data,单指令多数据流机)并行机,其名称反映出它是由多台处理器(即处理单元PE,Processing Element)摆成阵列的拓扑结构,利用资源重复的方法开拓并行性。曲于单一的指令运行在大型规则的数据结构(如数组和矩阵等)上,使阵列处理机也常叫做数据并行结构(Data Parallel Architecture)。下面依次讨论它的基本结构、主要特点以及典型的阵列机Illiac-IV。
1.阵列机的基本结构
阵列机通常由一个控制单元CU(Control Unit)、n个处理单元PE、m个存储模块M和一个互连网络IN(Interconnection Network)组成。CU将单一指令(单指令流)播送至各个PE,而所有活动的PE将从相应的M中取出各自所需的数据元素(多数据流),以同步的方式执行该条指令。在阵列机中,IN常常是实现置换(Permutation)的网络,它用来提供各PE之间或PE与M之间的通信连接。按照存储模块的分布方式不同,阵列机可分为两种基本组态:分布存储的阵列机和共享存储的阵列机,它们分别对应图(a)所示的处理器一处理器组态(也称为闺房式)和图(b)所示的处理器一存储器组态(也称为舞厅式)。在分布存储的阵列机中,只要数据分配得当,各PE将从各自的局存M;中获得所需要的数据;CU中除了存放系统程序和用户程序外,也可以存放各个PE所需共享的数据。不管哪种结构,对于标量型指令,CU中的运算部件可直接执行;对于向量型指令,它就将此指令播送给各个PE同步执行。共享存储的阵列机结构中,PE没有局存,存储模块以集中形式为所有PE共享,当两个需要交换数据的PE之间无共享存储单元时,就需要经过多次传输方可实现交换。
……