在线工博会

先进热管理技术提高系统可靠性
Nancy Pantone, Matt Wieborg
为节省流量,手机版未显示文章中的图片,请点击此处浏览网页版
对于几乎所有的嵌入式系统应用而言,热管理一直都是非常重要的设计考虑因素。将系统保持在其规定的工作温度范围内从而保护宝贵的计算资产,可以带来更高的可靠性和更长的部署使用寿命,最终降低成本。
未能在系统规定的限制内管理热问题会对系统性能产生不利影响,引起系统错误,或者可能损坏元器件或系统。此外,超过最高工作温度可能导致特定元器件的工作特性产生不可逆的变化。
因此,务必在设计周期的早期通过研究耗散功率和元器件位置、气流路径和常规散热性能来确定系统内部的发热方式,这一点至关重要。通过全面的热分析和测试来选择正确的热管理解决方案是设计整体取得成功的一大因素。误估和布局错误可能导致系统可靠性、现场故障、更高的工作成本和总体性能等方面的严重后果。
但是由于系统复杂性随着更高速度和密度的元器件、更小外形的电路板、更小的系统占板空间以及能在更加严苛的环境下工作的要求而增加,有效的热管理设计明显地变得更具挑战性。新型热管理方案仍在演进,新一代应用可能需要根据系统类型和具体的工作环境,提供更好的冷却解决方案,以便匹配新标准规范(例如,MicroTCA、CompactPCI、Pico-ITX和其它板外形)。
此外,应对独特或极端的嵌入式计算环境引起的复杂冷却问题,需要相当广泛的热知识以及对现成商品(COTS)标准与定制设计的总系统成本和方案的评估。当前,设计工程师拥有越来越多的热设计方案可供选择。
对于医疗、运输和军事等要求严苛、高度专业的嵌入式市场,完全的COTS冷却解决方案不可能满足散热要求。在这种情况下,半定制或全定制解决方案可以在使用资源、热专门知识和降低总系统成本等方面提供最佳解决方案。
热力学的基本前提是热量总是从高温区域传输到低温区域,它将发挥均衡温差的作用。但是系统设计工程师如何确定特定应用的最佳热管理冷却解决方案呢?
第一步是了解嵌入式系统中所用的主要冷却方法:通过板上风扇和系统风扇实现的主动冷却、无风扇被动对流冷却以及主动或被动传导冷却。产业趋势推动着有些应用中的热管理方法的发展,有些应用则采用半定制或全定制冷却系统,在不增加尺寸或重量或者不对计算环境产生不利影响的情况下,实现极具成本效益的热管理问题解决方案。
热管理的目标是确保所有系统元器件在规定的功能温度限制内工作,以获得最佳性能。采用的热管理方法完全取决于具体的应用和设计到系统中的各个器件。设计人员可以通过了解应用器件并全面分析具体应用的热结构,更轻松地找到最佳冷却方案。
主动冷却:板上和系统风扇
使用最广泛的热管理方法是主动对流冷却,采用板上或系统风扇强制空气在系统电路板、电源与其他系统元器件之间流通。这种方法可以通过两种方式实现:一种是通过消耗底座发热的对流冷却方法,另一种是强制热量在整个空心侧壁流通,然后将其传输到外部环境中的冷却方法。
此外,风扇还是一种成本效益最高的系统冷却方案。设计人员发现,采用风扇的最有效的散热方案之一是将风扇直接放在CPU板散热器上(图1)。是否成功取决于为应用选择合适的风扇并采用良好的底座设计实现空气流通。

(图片)

有关内部元器件如何影响空气流通路径以及空气如何有效地在器件中移动的考虑因素。是系统设计的关键。此外,底座没有“布线死区”也非常重要,在这种区域中,空气或多或少流通不畅或者聚集成涡流。一旦这些考虑因素得到满足,即可通过研究风扇的设计和结构来选择最适合项目的风扇。
最近在风扇刀片和承座设计方面的进步可以实现更通畅的气流,并降低噪声和振动,使系统更加安静地工作。每个板上和系统风扇都有不同的环境空气温度热限制,因此建议查看供应商提供的每个风扇的规格。
虽然风扇由于冷却效率高而大受欢迎,但是设计人员应注意某些应用中的可靠性问题。板上系统风扇主要是RPM较高的小型装置,这种装置在全天候工作时会引发较多的嵌入式应用故障。此外,若应用整合了多个需要冷却的板时也要注意。这种设计需要多个风扇,这样就会产生较多的振动,进一步降低了总系统可靠性。空间受限的嵌入式系统会耗散较多功率,并且无法容纳较大的风扇,因此对于这种系统而言,板上风扇可能是唯一可行的方案。
对于采用需要高可靠性和严格的平均无故障时间(MTBF)的高性能处理器的关键任务系统而言,最好整合一个或多个尺寸较大的风扇,使空气在系统的所有板中流通。当然,仍然可以在每个板上采用散热器来耗散关键元器件产生的热量。
主动冷却的效果取决于在板上流通的空气量。因此,散热量与获得尽可能多的与散热器接触的空气分子有直接的关系。在电路板布线时这一点尤其重要,因此系统配置会考虑特定电路板在采用中央风扇的主动冷却系统中将实现的气流量。另一个挑战是确保气流在整个系统中的均衡,从而为每个插槽提供差不多的气流量。
为了进一步方便进行热分析,电路板供应商可以提供指示在特定温度下足够使电路板冷却所需的气流量的图形。事实上,某些平台(诸如MicroTCA)的规格明确要求标准电路板的文档包含温度与气流的曲线。假定可以测量或计算每个电路板获得的气流量,设计人员可以通过温度和气流信息确定系统的热限制。
随着对尺寸更小,更稳健的系统的要求与日俱增,由于功率预算有限和MTBF要求较高,冷却风扇开始出现问题。尽管最近在风扇设计和结构方面出现了许多进步,但是这种热管理主流方法已经成为引起所有系统中机械故障的主要原因之一。在系统中提供易于更换的热插拔风扇以及通过软件监测风扇速度等应对方案有助于降低故障风险。
作为机械装置,风扇会产生机械磨损,并引起系统振动。在系统生命周期内,风扇的质量会慢慢下降,甚至完全失效,这会极大地影响系统的热管理效果。除了机械故障之外,使用风扇还增加了功耗,如果实现方式不佳的话,还可能给系统增加相当多的噪声。
此外,空间受限的系统(诸如必须完全密封的箱式PC和系统,如运输应用)无法在热管理中使用风扇。因此,多数板上和主动冷却风扇都应用于机架式工业PC、服务器系统和一些传导冷却系统。
被动对流冷却:无风扇解决方案
无风扇对流冷却是无法使用主动冷却方法和需要中等计算性能的系统的备用热管理解决方案。虽然这类方案被称为“无风扇对流”或“自然对流”方案,但是名称上有误用之嫌。无风扇应用中的对流冷却通过自然对流,达到使热空气降温的目的来实现。不过这种方案也采用辐射实现额外的散热。
与被动传导冷却相似的是,这种冷却机制允许采用无风扇系统(图2)。不过“自然对流”和辐射机制的冷却效率相当低,从而显示出大大减少的耗散功率。若板采用6U形状因子(比如VME),实际散热限制为15W左右;或者采用3U形状因子(比如CompactPCI),实际散热限制为12W左右。设计人员一般会考虑采用对流冷却。与功耗为70W或以上的传导冷却板相比时,该散热要求必须相当低。

(图片)

软件应用可用于对各种冷却方法进行建模(将在下文中讨论)。这些应用可能对自然对流冷却系统特别有用,借助软件应用可以方便确定更为精确的耗散功率阈值。对于外部空气温度不到60°C且嵌入式CPU结温约为105°C的应用而言,凭经验所得的耗散功率阈值范围一般为12W至15W。
过去,12W至15W的阈值会严重地限制微控制器应用和某些低功耗PowerPC应用的自然对流的适用性。不过随着英特尔Atom CPU系列的推出,具有可接受性能且适用于通用计算应用的完整单板机(SBC)现在就拥有这种能力。该架构允许所有的高速外设以全带宽工作,包括吉比特以太网、SATA和PCI Express。
系统级传导冷却
传导冷却主要用于需应对潮湿、腐蚀性气体、沙尘和其他不利因素的恶劣环境。系统板、电源和其他系统元器件被密封在密封外壳中,系统元器件的边沿以机械方式夹在外壳的侧面。系统元器件的发热通过底座结构传导,并通过以下四种方法之一耗散:
* 强制空气在空心侧壁中流通
* 强制液体在侧壁的各个通道中流动
* 通过外部风扇实现被动对流
* 通过一般装在装置底部的冷却板实现被动对流;冷却板本身可以作为被动冷却或主动冷却方案。
现在许多采用计算机模块或可堆叠PC-104单板机(SBC)的耐用系统需要各种不同的冷却机制,而不采用直接装在CPU上的传统翅片散热器。许多计算机模块或PC-104系统采用热间隙垫片和热管使元器件与底座直接相连来实现散热(图3)。

(图片)

传导冷却的弊端是成本——其特殊的底座设计使其较同等的对流冷却系统的成本更高。最重要的是,尽管这种冷却方案在实现较高的功率密度方面极具吸引力,但是液体冷却解决方案往往比较重、尺寸大并且结构复杂。
半定制和全定制解决方案
板形状因子和可用的冷却解决方案,往往是系统设计的关键。它们可以最大限度地降低设计风险、缩短面市时间,并提供可用性、长生命周期、可升级能力和互操作能力。不过嵌入式设计一般都需要定制的性能。
这种应用包括战场上的士兵或者紧急救援人员和救援队使用的可穿戴式计算机、集成到海上或空中应用的系统、密封或防滴式医疗成像系统,或者需要注意空气中的污染物(热,灰尘等)的工业系统。额外的要求进一步限制了系统内外部的气流。
熟悉或擅长解决由于这些恶劣环境引起的复杂热问题的设计人员,可能可以解决应用所要求的建模、计算、设计布局理念和冷却方案。不熟悉此领域的设计人员可以求助于供应商,从而最大限度地降低风险和缩短面市时间。现成的嵌入式PC会附带有经验的系统供应商解决热层问题以及规定和验证性能阈值的相关知识。
实现技术
了解热设计问题可以帮助系统设计人员在设计初期选择板级、模块和底座系统产品。例如,可以在进行大量机械设计工作之前完成深入的系统热建模工作,这可以规避成本高昂或者耗时费力的重新设计风险。主动和被动冷却解决方案(如散热器或均热片)会占用系统设计的大量空间。利用具有一定灵活性的COTS解决方案,许多方案可能只需针对热要求进行少量修改或者无需修改。
从SpeedStep技术开始,英特尔已在处理器系列中普及节能策略。Kontron公司的20至40W计算机模块就是其中一个例子,该模块整合了英特尔32nm架构的先进技术。该计算机模块具有英特尔Core i7/i5移动处理器提供的高达2.53 GHz的处理能力以及集成内存和图形控制器的新型集成式QM57平台控制中心。新型ETXexpress-AI模块的主动和被动散热器方案,可以帮助系统设计人员选择满足系统要求所需的散热方案。
45nm英特尔Atom处理器已经创建了许多新型设备和以前由于功耗要求而无法实现的性能级别。这种微型处理器(13 mm×14 mm)与单芯片英特尔系统控制中心US15W (22 mm×22 mm)的耗散功率不到5 W。其他处理器(诸如Kontron公司的功率不到8W的microETXexpress-XL模块所采用的英特尔Atom Z520PT)针对–40°C至85°C的工业温度范围而设计,适用于极端环境温度。
热管理的设计考虑因素
在确定合适的具有成本效益的热管理方法时,许多设计要求都有影响。例如,在被动冷却系统中,噪声限制可能会限制用于特定设计中的风扇、通风口和管道的尺寸和类型。一般在单个元器件级别进行评估,设计人员使用软件和仿真来精确地为应用的系统级热特性建模。
MIL-STD-810等用于定义环境方法和测试协议的工业测试标准,也可以为设计人员提供特定计算平台的热管理详情。有些应用取决于解决其基本规格中的冷却问题的工业标准,有些应用则受益于各种元器件构件来实现极具成本效益的热管理解决方案。
确定系统环境中的元器件温度,设计人员不仅需要考虑元器件,还必须考虑板和系统的热特性。为系统的热特性建模包含以下因素:
* 元器件外部的环境温度
* 任意元器件级热冷却解决方案
* 太阳能负荷(针对未受保护的现场应用)
* 海拔(针对军事/航空应用)
* 元器件和板上面和周围的气流
* 板级尺寸限制(可能限制热方案的尺寸)
* 总耗散功率
虽然已有大量科技实力投入到开发有效的热管理解决方案中,但是推测因素和过去的经验也在这个过程中起一定作用。要分析和正确测试热管理,设计人员必须对特定设计中的发热方式进行了解和仔细地建模。这个过程最好在设计初期进行,以作出有关气流路径和耗散功率位置的正确决策。这对于整个系统的成功也非常关键,它可以避免产生影响系统可靠性、性能、成本的错误或关键的现场应用中的故障。
例如,手术室中的防滴系统需保持元器件不受污染物的污染,因此在设计过程中需考虑精确指定的环境因素,包括热、震动、摆动、浮游粒子或湿气的规定。然后,设计人员可以通过可展示对初步硬件方案的热影响的仿真工具和建模方案来评估热性能。
热建模工具与测试
Mentor Graphics公司的FloTHERM等热建模工具,采用先进的计算流体动力学(CFD)评估技术精确地预测元器件、板甚至整个系统中的气流、温度分布和传热情况。工程师可以借助这种先进的数学建模,在所有设备原型进入生产阶段之前,创建其设计的虚拟模型、分析热性能并轻松地创建和测试修改。
通过三维模型查看和了解气流和温度分布,可以避免会造成损失的设计问题,如验证温度阈值和保护设计。例如,在三个层面解决热传导、对流和辐射,可以向工程师显示热是否会下移到印制电路板中,验证通过特定元器件顶部的散热器减少了多少热量。
进行计算机仿真,设计人员对设计的稳定性和规格目标的符合性充满信心之后,可以通过材料/器件/装配过程构建一个或多个非常接近最终产品的原型。一旦完成了这些原型,它们将根据客户的要求接受一系列真实世界的测试,包括热循环、震动和摆动、电磁干扰(EMI)和静电放电(ESD)。此外,器件通常还会在工作期间针对MIL-STD-810或SAE等以前参考的标准进行测试,以确保它们不会在危急情况下出现故障。
冷却趋势
被动冷却设计正在日益普及,这完全是因为系统元器件的功耗较低,这样通过外壳和外部空气之间的自然热交换就能实现足够充分的冷却。热是通过将其从各种发热板元件传送到系统外壁来耗散的。
处理器和芯片组功耗的发展使其价值日趋合理。例如,台式机CPU的典型热设计功耗为60至70W左右。因此,设计人员可以采用相当多的备用冷却方法,比如被动对流和传导技术。在许多情况下,英特尔嵌入式移动元器件(类似于用于笔记本电脑的元器件,但具有针对嵌入式平台的长使用寿命)适合采用被动冷却解决方案,因为这些元器件的功耗范围为30W或以下。
运输应用设计
采用基于COTS的定制是涉及需要各种应用的现代铁路、公路、空中和海上产业的运输设计的核心。在涉及乘客安全或保证世界正常运行的关键系统时,热故障是绝对不允许发生的。风扇在理论上有用,不过由于气流不够,无法确保性能和故障风险,它们在许多这类应用中并不可行。
以车队管理系统为例,布局包含铸铝外壳中具有扩展温度的Atom器件。在这种情况下,Atom处理器和芯片组被放在主板的顶部,然后与用于冷却的铝外壳顶部实现散热连接。
传热到外壳可以提供将元器件保持在其额定温度范围内所需的足够的冷却,而不依靠系统周围的自然空气对流或气流。外壳本身可以散热,但其散热量极少,在此应用可接受的性能级别内。此设计的热建模验证了具有扩展温度的元器件和极端温度下系统的耐受能力。
医疗系统应用设计
在医疗领域中,集成式元器件传热给外壳,散热器翅片的自然对流消除系统产生的热量。例如,针对无菌手术环境设计的集成式CPU和显示系统展示了对流设计的医疗和热方面的诸多挑战。许多这些系统部署在不接受冷却风扇所产生的额外工作噪声的环境中(即使在总系统可靠性至关重要时)。
因此,被动冷却就成了一个可行的方案。不过设计人员必须平衡足够全面的热要求和机械要求,以便实现适当的冷却,但是不能由于增重而变得过于笨重或者减少了系统美感。该系统需要重量适中且兼容IPx1的被动冷却解决方案,以确保安全,防止垂直滴水,允许设备采用医院级消毒剂消毒。
为这种手术环境建模涉及许多FloTHERM变量。采用最差情况热和功耗界线,以创建最牢靠的设计。热建模应始终考虑绝对最坏情况工作条件,包括温度和海拔等变量。为确保热模型足够,最好进行完整性检查。
在这个建模示例中,最高环境工作温度为40°C,从各种集成式元器件中汲取63W的连续功率。处理器内核在模拟配置中被设置为100%的工作负荷,这样产生的功率就可以游刃有余地低于63W的最高连续功率。
设计人员可以通过整合一个包含内部钢系统外壳的外部塑料外壳,创建一个热缓冲区,该缓冲区包含用于实现有效空气对流的内部通风口和按照IPx1设计的冷空气入口。对内部元器件进行布局并为其指定特性之后,在模型内部设置热监测点,跟踪整个建模过程中的温度。
之后在最高工作条件下验证上千次重复的关键测量(包括CPU和硬盘驱动器的个别环境条件)。CPU显示额定结温为105°C,裕量为15°C。这差不多就是元器件的最高额定工作温度,或者是元器件可以耐受的最高温度。像CPU这样的关键器件可以在达到其最高温度时进行调节,以防发生损坏,这种元器件优于超过其额定最高温度就可能导致系统损坏的元器件。
军事应用设计
Kontron公司通过拓展能力,已经可以处理具有AP Labs公司的采集系统的复杂军事系统。对于无人机项目,许多关键因素对其电子系统的成功至关重要。生存能力必须是军事应用中使用的所有移动电子系统的核心设计目标。如果系统无法在目标环境内连续可靠地工作,那么任何复杂功能都无法实现其任务。
经过验证的最为有效的设计方法,是在已获得耐用工作的认可(并非仅仅是“旨在满足”)的底座中实现所有的所需系统功能。例如,选择生产时满足MIL-E-5400 Class 1热性能、MIL-901D震动、MIL-167-1摆动等要求的底座,使设计人员确信它可以耐受规定的极端温度、摆动、震动、盐雾、沙尘和化学品环境。此外,它可以维持计算元件和电子器件内部的密封和温度控制环境。
底座可能需要以各种不同方式进行冷却和安装,这取决于任务要求。除在标准机架内安装系统或者将系统安装到ARINC形式的设备托盘中之外,在移动平台内拥有定制硬安装或防震安装方案是很有用的。
从冷却的角度来看,有些应用可以采用强制气流(有时称为强制对流,采用内部或外部风扇实现)。然而由于空间、重量和环境的限制,许多无人机(UAV)应用需要采用传导冷却技术(通过风扇协助或者不使用风扇)。因此,设计人员开始时就可以在各种冷却和安装方案中选择,然后再基于经过验证的基础构建优化系统,这对设计人员来讲非常有益。 6/10/2011


电脑版 客户端 关于我们
佳工机电网 - 机电行业首选网站