| |
有限元分析软件在超级计算机上的移植和开发 | |
上海超级计算中心 李根国 金先龙 | |
为节省流量,手机版未显示文章中的图片,请点击此处浏览网页版 | |
摘要:
本文首先介绍了“神威I”超级并行计算机的配置和性能,其次论述了商业性大型有限元软件NASTRAN在“神威I”系统上进行二次开发的思路和实现方案,把MSC.NASTRAN强大的有限元分析能力与超级计算机的高性能计算能力结合起来,扩大了分析规模,提高了分析速度;然后用算例说明开发功能的正确性和高效性;最后对神威机的应用前景进行了展望。
一 、引言
伴随计算机和计算方法的蓬勃发展,科学计算已经成为继理论和实验之后,人类认知世界的第三大支柱。高性能计算能力及相关技术更是当今世界竟相争夺的战略制高点,是衡量一个国家综合国力的重要标志之一。国内外各种超级计算机应运而生。“神威”、“银河” 和“曙光”等超级计算机的研制和使用,说明我国在超级计算机硬件技术方面已达到国际先进水平。另一方面,作为数值计算方面的一个重要部分,各种有限元分析软件在航天航空、汽车、机械、建筑、化工等各个领域获得广泛应用。在技术上超级计算机一般是源代码兼容,国内超级计算机不能直接安装商业性有限元软件,更严重的是西方国家政府在高性能计算硬、软件方面,对我国进行严密控制,因此我国自主研制的超级计算机在工程领域的应用受到极大的限制。
从头开始为“神威I”开发并行有限元分析软件需要极大的工作量和各个方面技术人员的投入,因此需要很长的时间和雄厚的资金。而从有限元分析的理论和实践可以知道:有限元分析最主要的分析时间应用在科学计算(对于结构分析,主要是求解线性方程组和稀疏矩阵特征值求解),而这些计算的并行化开发开始得较早,相对成熟一些,有一些软件是可以免费拥有源码的。由此提出一个问题:能否通过对可以公开获得的串行有限元分析软件和超级计算机的科学计算软件库结合进行二次开发和系统集成,从而形成具有自主知识产权的超级计算机有限元大型分析软件?在上海市信息化办公室信息化专项资金的大力资助下,上海交通大学和上海超级计算中心经过一年多的研究和开发,成功地将商业性有限元分析软件NASTRAN在“神威I”超级计算机系统上进行了移植和并行计算功能的二次开发,从而为超级计算机应用软件的开发探索一条新的途径,同时为工程界应用高性能计算提供了平台。
二、神威I超级计算机系统简介
“神威I”计算机是一台可缩放的大规模并行处理的超级计算机系统。它吸收和发展了国际上巨型计算机的先进设计思想和技术,采用同构、分布共享主存储器、平面格栅网体系结构,是一台多指令流、多数据流的并行处理系统,其峰值运算速度高达每秒3840亿次浮点结果,主存容量48GB,磁盘容量1.28TB。整个系统主要由主机系统、前端系统、磁盘阵列系统和软件系统组成。“神威I”超级计算机适用于需要高速、大容量并行处理的各种计算领域。
“神威I”计算机软件系统主要包括以下几个方面:分布式并行操作系统、各种并行程序设计语言、并行程序开发及支撑环境、科学计算软件库、外围局域网系统、分布式数据库管理系统、科学计算可视化系统等等。其中,并行程序设计语言主要包括并行C、高性能FORTRAN(HPF)、并行FORTRAN、OpenMP及并行Java语言。科学计算软件库主要包括了HPF语言科学计算库和基于PVM/MPI的科学计算库。并行程序开发及支撑环境主要有PPME、PVM、MPI等。
三、开发的思路和实现方案
现有商业性大型有限元分析软件,例如:MSC.PATRAN、MSC.NASTRAN,具有很高的开放性,这些软件允许用户对其进行二次开发。通过开发,可以充分发挥商业性有限元软件在前后处理、人机交互界面等方面的优势。到目前,NASTRAN软件的并行处理功能也十分有限。本课题的总体开发思路就是充分利用大型并行计算机的速度优势,将有限元分析中最占用时间的方程求解、特征值求解部分移植到神威机上完成。采用二次开发工具PCL和DMAP编程技术,实现了商业性有限元软件和超级计算机并行计算软件的无缝集成和可视化集成。
在各种有限元分析软件中,包括NASTRAN,静力分析、模态分析、屈曲分析、动态响应等是最基本和最常用的分析功能,因此有限元软件在“神威I”上移植,首先应该考虑这些功能的并行化。本课题的目标是对上述四个基本模块的并行计算功能的开发。对静力分析模块,关键的计算是求解大规模稀疏矩阵线性方程组。动态响应分析也是类似的问题,不过其右端项随着时间(迭代步数)而变化,而且与以前的求解结果有关系。只要步长取得适当,这种简化仍能取得相当精确的结果。对于模态分析过程,关键的计算是求解大规模稀疏矩阵广义特征值问题。屈曲分析则是静力分析和模态分析的综合。从上面的分析可知,对有限元分析软件基本功能的计算并行化的核心问题是对大规模稀疏矩阵方程组求解和特征值计算。
串行处理版本的NASTRAN软件安装在“神威I”的前端机上(ALPHA工作站),并行计算需要在主机上进行,于是从前端机到主机的文件传输需要消耗时间,通过实际测算,在NASTRAN的静力分析计算中,解方程的时间约占整个分析过程的30%~50%。在模态分析和动态响应分析中数值计算的时间占到分析时间的90%甚至更高。由此可见,开发的关键是神威机上的求解程序具有极高的效率,足以补偿矩阵输入、输出带来的额外的时间损耗。
易用性的问题也是本课题考虑的重要因素。由于系统的最终用户可能对神威机了解不多,因此有关的选项、设置最好在用户熟悉的PATRAN界面下完成。
图1所示为课题完成后在“神威I”超级计算机平台上运行NASTRAN的流程图。
(图片) (图片) (图片) | |
电脑版 | 客户端 | 关于我们 |
佳工机电网 - 机电行业首选网站 |