项目介绍
TRW Automotive作为一家全球性的科技公司,正以其悄无声息的方式触动着大家的生活。制动器、安全气囊、安全带或转向装置所组成的TRW系统已成为我们的驾驶体验中必不可少的一部分。作为汽车业的一级供应商,TRW Automotive专注于汽车安全产品的制造和生产,并与世界上几乎所有的汽车与卡车制造商展开了合作。
挑战
在欧洲,安全系统的设计由多个TRW Automotive工程中心来完成。在 2005年,“底盘”项目组仔细研究了公司在欧洲的CAE需求及其现有的计算平台。发现其CAE工程师仅在台式工作站上工作。而该项目组要求计算能力更强,且工作流更顺畅。
TRW技术中心Duesseldorf的转向装置与悬挂欧洲CAE经理Dirk Vieker 说:“我们当时希望找到一个灵活和标准化的解决方案,位于欧洲的各个站点配合紧密,我们需要更好地进行协作。我们希望我们的CAE工程师能够专注于他们的工作,让计算环境来决定使用哪个硬件资源可达到最大的使用效率。最重要的是,我们希望确保我们的投资最有效且最明智。” PBS Professional工作负载管理软件让我们确信,新的解决方案可以完全满足这些要求。 (图片) 解决方案
“底盘”项目组不想依靠其有限的内部IT资源来开发新的CAE计算基础设施。它们请求Altair公司所推荐的系统集成商GNS Systems来为四个工程站点开发标准的CAE解决方案。GNS负责提供完整的解决方案,包括设计、采购、安装、实施以及持续的安装后支持。
从易用性、处理器使用率和投资回报率的角度出发,该项目组考察了可能会在其新的HPC集群上使用的以下三个工作负载管理系统:LSF、Sun GridEngine和PBS Professional。
Vieker说道:“我们对包括价格和优缺点在内的各个方面均进行了考察,最终我们发现,PBS Professional的功能最佳,且价格适中。它还允许我们查看代码,这样我们就可以按照我们想要的方式进行相应的配置。我们与 Altair 建立了很好的合作关系,实际上我们与其签订了全球软件合同。与值得信赖的合作伙伴展开合作,对我们来说非常重要。GNS还就PBS Professional的支持提供了很好的反馈。”
截止到2005年底,GNS Systems已在多个工程站点安装了基于Linux系统且使用了Intel芯片的PC集群,并在所有的系统上都配置了PBS Professional。同样的技术也将很快在位于东欧的一个站点得到应用。标准化会节省 TRW的管理成本,并简化各个工程站点之间的采购、变更、升级与协作。
对于项目组的工程师而言,从台式工作站到HPC集群在处理能力方面的提升主要体现在CAE的周转时间同台式工作站相比有了巨大改进。PBS Professional是保持集群高效运行并确保获得最大利用率的关键。
“PBS Professional通过前六周的运行给我留下了深刻的印象,它运行得属实非常好,”Vieker 说道,“关于此软件的功能,我已经从Dusseldorf和其它站点的CAE工程师那里收到了非常积极的反馈。我们尚不清楚的是它是如何做到的。我们仅是将作业置于PBS Professional队列中,它便会完全接管作业——自动判断向哪些节点发送作业,以及在哪个队列中运行效率会最高。”
“我们在不同的站点中有大约20名用户,他们都使用主CAE代码。尽管他们中的一些人起初对于将任务的控制权交给PBS Professional存有一丝顾虑,但是现在他们都很愿意这样做。他们只需在网页界面上输入数据并选择所需的代码,之后执行单击操作即可将作业提交给PBS Professional。从那时起,他们就彻底从陈旧的管理材料、UNIX上的Shell 脚本工作以及额外的文件处理中解脱出来。因此,它绝对是一款非常高效的软件。”
当我查看硬件的利用率时,我发现它始终保持均衡状态。未发现哪个节点负载过高,也未发现有人在等待作业。PBS工作负载管理的工作状态非常好。”(图片) 结论
“底盘”项目组在新的CAE基础设施中成功应用了PBS Professional,TRW Automotive的其他项目组也了解了这一消息。很多工程团队,包括一直在使用开源产品的项目组,都来询问PBS Professional在CAE环境中的表现。
“我希望一些其他的工程站点也来尝试使用PBS Professional,”Vieker说道。
“我想PBS Professional工作负载管理很有可能会成为TRW Automotive CAE社区的标准。”而对于“底盘”项目组所使用的标准硬件元件,他们也同样感兴趣。
Vieker意识到,使用 PBS Professional后,未来定会有更多的机会来提高生产效率。每名工程师都使用配有双处理器的工作站作为集群的前端设备,而这些处理器可能会在不久的将来成为 PBS Professional客户端,通过增加 CPU的数量来提升集群的效能。TRW也考虑过通过使用高速广域网在不同的CAE站点中建立网格计算。不过,目前系统已经满足了项目组对于生产效率和周转时间方面的需求。
9/16/2014
|