高性能并行计算主要概念
· 高性能并行计算机分类
并行计算机主要可以分为如下四类:对称多处理共享存储并行机(SMP,Symmetric Multi-Processor)、分布式共享存储多处理机 (DSM,Distributied Shared Memory)、大规模并行处理机(MPP,Massively Parallel Processor)和计算机集群系统(Cluster)。
这四类并行计算机也正好反映了高性能计算机系统的发展历程,前三类系统由于或多或少需要在CPU、内存、封装、互联、操作系统等方面进行定制,因而成本非常昂贵。最后一类,即计算机集群系统,由于几乎全采用商业化的非定制系统,具有极高的性能价格比,因而成为现代高性能并行计算的主流系统。它通过各种互联技术将多个计算机系统连接在一起,利用所有被连接系统的综合计算能力来处理大型计算问题,所以又通常被称为高性能计算集群。高性能并行计算的基本原理就是将问题分为若干部分,而相连的每台计算机(称为节点)均可同时参与问题的解决,从而显著缩短解决整个问题所需的计算时间。
· 集群互联网络
计算机集群系统的互联网络大体上经历了从Ethernet到Giganet、Myrinet、Infiniband、SCI、Quadrics(Q-net)等发展历程,在“延时”和“带宽”两个最主要指标上有了非常大的改善,下表即是常用的互联方式: (图片) ANSYS主要求解器的高性能并行计算特性
ANSYS系列CAE软件体系以功能齐全、多物理场耦合求解、以及协同仿真而著称于世。其核心是一系列面向各个方向应用的高级求解器,并行计算也主要是针对这些求解器而言。
ANSYS的主要求解器包括:
Mechanical: 隐式有限元方法结构力学求解器;
CFX : 全隐式耦合多重网格计算流体力学求解器;
AUTODYN: 显式有限元混合方法流固耦合高度非线性动力学求解器;
LS-DYNA: 显式有限元方法非线性结构动力学求解器;
FEKO: 有限元法、矩量法、高频近似方法相互混合的计算电磁学求解器;
· 高性能并行计算的典型应用
现代CAE计算的发展方向主要有两个:系统级多体耦合计算和多物理场耦合计算,前者摒弃了以往只注重零部件级CAE仿真的传统,将整个对象的完整系统(如整机、整车)一次性纳入计算范畴;后者在以往只注重单一物理场分析(如结构力学、流体力学)的基础上,将影响系统性能的所有物理因素一次性纳入计算范畴,考虑各物理因素综合起来对分析对象的影响。因此,可以说,高性能并行计算也是CAE的发展方向,因为它是大规模CAE应用的基石。例如,在航空航天领域,需要高性能并行计算的典型CAE应用有:
– 飞机/火箭/导弹等大型对象整体结构静力、动力响应、碰撞、安全性分析,整体外流场分析,多天线系统电磁兼容性及高频波段RCS分析,全模型流体-结构-电磁耦合分析;
– 航空发动机多级转子/静子联合瞬态流动分析,流体-结构-热耦合分析;
– 大型运载火箭/导弹发射过程及弹道分析 ……
· ANSYS求解器对高性能并行计算的支持
作为大型商用CAE软件的领头雁,ANSYS在对高性能并行计算的支持方面也走在所有CAE软件的前列,其各个求解器对高性能并行系统的支持可用下表描述:(图片) · ANSYS各求解器并行计算部分算例简况
ANSYS Structural曲轴应力计算:8CPU AMD Opteron 64bit 集群(HP-MPI 2.1.1+Voltaire Infiniband),4400万自由度。1000M Ethernet互联8CPU并行加速比为3.46,InfiniBand互联8CPU加速比为5.36。
ANSYS CFX飞机外流场计算:32CPU AMD Opteron 64bit集群,Turbo Linux 8.0 for AMD64操作系统,1000M Ethernet互联。263万节点,256万单元。32CPU加速比为20。
ANSYS LS-DYNA汽车整车碰撞计算:32CPU AMD Opteron集群,Giganet互联,26万单元,32CPU加速比为13.4。
ANSYS AUTODYN装甲车地雷爆破冲击计算:25台Intel Pentium PC集群,1.2G Myrinet互联,25万单元,24CPU加速比为23.36。
ANSYS FEKO大型电大尺寸反射面天线辐射特性计算:64CPU AMD Opteron集群,1000M Ethernet互联。176606未知量,32CPU加速比接近26。
3/19/2006
|