当今复杂的雷达与航空电子系统要求高处理性能,但同时又面临着小尺寸、轻重量与低功耗(SWaP)限制。驱动这些系统的功能都属于信号处理密集型,因此高效实施在高性能低功耗小型处理器上执行的数字信号处理 (DSP) 算法,能够为它们带来极大的优势。此外,这些系统还具有不断提高的设计与数据使用需求。为了满足 SWaP 的效率与自适用性需求,可编程DSP与片上系统 (SoC) 现已成为处理平台理想选择。它们能以极低的功耗为雷达与航空电子设备,以及雷达与航空电子常配套的软件定义无线电 (SDR)、影像以及视频应用提供无与伦比的信号处理功能。
要满足对SWaP高效率SoC不断增长的需求并非易事。这要求既要低成本地提供高性能,又要达到低功耗目的,以实现工作与环保目标。德州仪器(TI)基于KeyStone的多内核器件是实现SWaP效率的关键。它们可为TI领先TMS320C66x DSP内核进行多内核实施,以小型封装提供每瓦最低功耗。KeyStone器件以不同的性能提供,在整个系列产品中实现了软件兼容。这可满足多样化需求,在设计时为未来发展预留空间,实现高效开发。
KeyStone平台中的TI TMS320C6657与TMS320C6655器件是雷达与航空电子系统的理想选择。这些器件分别为引脚兼容型单内核与双内核KeyStone DSP。
定点与浮点处理
使用多个数字信号处理器(DSP)内核是通过日益复杂的信号处理技术推动波形密集型应用发展的重要技术,可充分满足航空电子设备、雷达、声纳、信号智能 (SIGINT)、影像与视频处理以及软件定义无线电的需求。多内核功能将各种不断丰富的AccelerationPac与面向多内核DSP的开发工具进行完美结合,能够以紧凑的封装在极低的单位功耗性能下实现高性能。
航空电子、雷达以及相关应用需要多内核DSP来满足这些任务关键型应用不断提高的要求,包括更高的处理吞吐量、更精细的分辨率、更高的精度以及高级I/O的集成。许多这些功能都依靠浮点数学运算来获得所需的精度。TI KeyStone架构能够逐指令地在单个器件内提供浮点或定点执行功能,可为设计人员带来高度的设计灵活性。浮点运算执行的时钟速率高达1.25 GHz,这一速率通常只有定点器件才能达到。设计人员再也不必为获得浮点精度而牺牲性能,或采用分离式定点处理器和浮点处理器进行设计。
主要特性 (图片) AccelerationPac
除优异的DSP性能外,C6657/55还具有维特比及Turbo AccelerationPac,在充分利用每个内核1MB L2存储器与1MB共享存储器的同时,还可在低功耗硬件中处理通信与波形算法。这些 AccelerationPac 可独立于可编程内核运行,将 DSP 资源释放出来用于其它处理,从而可降低时延,优化软件开发。KeyStone 架构的多内核导航器提供一个基于硬件的抽象层,可将软件开发人员从底层硬件设计的具体繁琐工作中解放出来。多内核导航器的队列与描述符可用于自动将软件任务指向适当的资源,使可扩展性与资源池化成为处理器的整体功能。使用多内核导航器的软件可运行在任何KeyStone器件上,无需变更便可提供从一个DSP内核到多个DSP内核的可扩展性。这些因素综合在一起,可提供以SWaP为导向的应用所需的低功耗高性能。C6657/55采用40纳米工艺技术,可在1.25GHz的频率下提供高达80GMAC和/或40GFLOP的性能。图1是C6657的功能图。(图片)
图1:TMS320C6657/55方框图 高性能I/O
一般情况下,这些系统不但需要与来自多个厂商的设备进行互操作,而且还要与其它原有系统进行互操作。C6657/55提供高性能外设集,支持现代系统所需的高数据传输速率,并具有支持原有设计的高灵活性。这些外设包括:
●双通道PCI Express端口,支持每通道高达5GBaud的GEN2;
●4 通道Serial RapidIO (SRIO),符合RapidIO 2.1规范,支持每通道高达5Gbps的运行;
●支持与其它KeyStone架构器件高达 50GBaud 互连的HyperLink可实现资源扩展;
●千兆位以太网 (GbE) 端口,具有一个支持高达1000Mbps的SGMII端口;
●32位DDR3,具有支持达1,333MHz 速率的ECC接口;
●16位外部存储器接口(EMIF),用于连接闪存存储器(NAND与NOR)以及异步SRAM;
●8位或16位双通道通用并行端口,每个通道都支持SDR与DDR传输;
●2个多通道缓存串行端口(McBSP)。
C6657/55可充分利用KeyStone架构中丰富的外设与AccelerationPac,以紧凑的外形与低功耗实现全面的多内核优势。
SRIO、PCIe以及HyperLink能够在多个SoC和/或FPGA之间实现高速互联。HyperLink是KeyStone架构内部总线的接口延伸,能够在点对点高速互连中提供50Gbps的速度。HyperLink 提供低开销协议,支持与其它KeyStone器件或FPGA的高速通信与连接。它可提供一款能够满足当前雷达、SDR以及航空电子系统可扩展性需求的解决方案。然而,SRIO与PCIe 则能够以较低的比特率实现基于各种标准的互连。
C6657中的32位DDR外部存储器接口(支持ECC)可提供支持8GB可寻址存储器空间的1,333MHz 总线。TI DDR3实施方案可降低相关外部存储器访问的时延,为高速运行这些应用相关的大量数据提供必要的支持。
尺寸与功耗
SWaP是对上述任务关键型应用的主要要求。TI长期以来始终致力于提供业界最低功耗的DSP与SoC。C6657 不但支持双C66x DSP功能,频率在1GHz时功耗不超过3.5瓦,同时还能提供性能与外设的理想组合,满足市场需求。紧凑的 21x21 毫米封装可满足任务关键型应用对小巧外形的要求。C6657/55/54器件还提供最新“超薄”封装(仅2.9毫米厚),可优化任务关键型应用对整体系统级封装的要求。此外,这些器件还支持-55至100℃的更宽泛工作温度,这就是通常所谓的航空电子应用要求。
此外,C6657还可支持软件定义无线电中最复杂的波形。VCP与VCP3d加速器、内部共享存储器(达 3MB)与接口带宽可提供必要的高性能,能够支持和生成众多SDR应用中使用的最为复杂的波形。
雷达设计要求
现代雷达设计将信号处理功能整合在雷达系统的前端(激励器/接收器),这其中可能包括波形生成、滤波、矩阵逆转运算以及信号关联。此外,雷达系统还需要进行数学函数运算,包括递归最小平方与平方根运算。许多设计人员都在基于C语言的处理器中实施了这些功能(采用定点十进制和/或浮点运算)。这些类型的设计可充分利用TI C6657中提供的小型双定/浮点内核满足系统需求。
例如,在自适应阵列设计与标准空间收发器阵列处理(STAP)中,矩阵逆转是一个重要因素。矩阵逆转可根据雷达系统中使用的阵列规模,充分利用C6657 DSP提供的并行处理功能缩短时延,降低系统功耗。随着系统中阵列规模的变大,所需浮点乘法也随之提高。雷达系统设计人员最可行的设计方法是使用DSP和内部存储器模块实施这一功能。C6657提供高达 40 GFLOP的性能以及3MB的内部存储器,是该应用的理想选择。
结论
TI C6657/55 DSP将外设与处理功能进行完美整合,可为系统设计带来众多优势,包括定点速率浮点性能、更高的系统灵活性以及更低的系统成本与功耗。器件上整合的外设可提供网络连接 (EMAC)、支持ECC的高速存储器接口、标准总线接口(PCIe) 以及高速低时延点对点接口(HyperLink)。该高级外设集可增强系统性能与可扩展性,再加上高集成度,可进一步降低系统成本。在需要运行雷达、SDR以及航空电子应用要求的复杂计算密集型算法时,C6657/55整合定浮点的数字性能可提供得天独厚的优势。
总而言之,TI C6657/55 DSP不但可为任务关键型应用提供优异的SWaP性能,同时还可为整体系统缩减芯片数量与板级空间。
作者:
Hector Rivera,TI多内核处理器业务发展经理
Tom Flanagan,TI多内核处理器技术战略总监
4/26/2012
|