"); //-->
高性能实时DSP和数据采集系统的设计者遇到的最大困难就是数据的传输。产生数据流问题的因素有很多,而处理这些问题的传统方法已不再可行。
Rodger Hosking
Pentek
最近我们看到许多有关一些快速DSP和RISC处理器的介绍,它们分别在关于缓存、数据传输和存取的流行算法和复杂硬件设备等方面具有显著的成果。 这些新的器件仅仅代表了目前由对高性能、低成本、低功耗、小体积DSP的需求在上升。例如,Analog Devices的21160 Hammerhead 处理器以100MHz的时钟频率运行,而且每10ns时钟周期可执行6条浮点指令,从而使峰值功率达600MFLOPS。其48位外部数据总线每15ns可传送6个字节,I/O传输速率最大为528MBps。
Motorola 400MHz的 PowerPC MPC-750尽管不是一种真正的DSP,但它可提供733MIPS以及400MFLOPS。通过外部64位数据总线,它与外围设备间的峰值I/O速率可超过1000MBps。
Texas Instruments的TMS320C6202在4ns的周期内可并行执行8条32位指令,运行速度达2000MIPS。片上多通道ALU和四通道DMA 控制器的结合可支持高速I/O外围设备。通过双 32位并行数据总线,它可以1,500MBps的组合速率向I/O设备传送数据。
通过采用这些处理器,计算机的速度不再成为实时应用的主要障碍。取而代之的是,一些在计算能力上的新成果可能会由于与外围器件间的数据传输瓶颈而很快丧失其优势。 任何实时系统底板中最明显的问题是它是唯一共享的资源,且板间所有数据流必须通过同一路径的仲裁。底板在高性能系统中的作用从高速数据传输通道转变为执行CPU和处理进程和外围任务的主板间的控制、状态和消息传送机制。
中间层底板总线
中间层总线通过在系统外围和处理器间提供专用数据通道来改善系统性能以满足实时性要求。它们可减小底板总线上的数据率,使得其他通信更加易于实现。它们还允许一个系统中的多条中间层总线以提高总的数据传输率。
PMC实际上获得了高性能系统总线业界每一个板卡制造商的关注和支持,首先是VMEbus制造商,现在又增加了Compact PCI总线制造商。PMC 规范是两个标准的结合:定义物理特性的通用中间层卡(CMC)格式和定义电气接口的PCI标准。PMC模块的几何尺寸约为7.5 x 12.5 cm,这样的尺寸允许多达两个模块级联到6U的VMEbus和Compact PCI板上。
模块可根据应用需要用2、3或4个64芯紧凑连接器级联到载板上。前两个连接器为32位传输提供电源和所有信号。第3个连接器将地址/数据总线从32位扩展到64位。第4个连接器用来将64位的用户定义 I/O引到主板上。在6U的VME应用中,这 64个引脚通常连到P2底板连接器上的64个用户定义引脚上。这样方便了诸如VSB和RACEway等P2接口标准的介入。
除了4个板间连接器外,PMC规范允许通过VME主板的前面板直接连接。一块单独的PMC前面板可通过一个小孔与VME前面板齐平,以适合模块所需的任何专用I/O连接器。大多数PMC模块采用32位接口,并可以132MBps的模块传输速率进行数据传输。
VIM规范领导着I/O性能的竞争,它是为满足诸如'C6x的新型高速DSP的需要而开发的。VIM
160脚的处理器节点直接连接到每个DSP的私有资源上,且包含三种类型的接口。对高速并行数据,采用32位并行总线与DSP板上的同步双向FIFO相连接,可支持高达100MHz的传输速率,以400MBps的速率与DSP交换数据。这一通道特别适合于高速并行通讯信道,如前面板数据端口(FPDP)、光纤信道和RACEway,以及高速数据采集器件,包括ADC和 DAC。DSP板上的FIFO缓冲区通过提供弹性存储方式可消除I/O时钟与DSP间的相互影响以支持DSP的有效DMA传输。对于串行数据,两个全双工的同步串行口可支持高达50Mbps的速率。这样的数据位率适合于许多数字通信产品、数字接收器和用于数据采集的串行编解码器。VIM模块上的功能控制和状态由一种通用微处理器接口支持,这一接口具有32位数据总线、16位地址总线和读、写、中断控制线。这样,DSP就具有了对模块上的每一个可编程器件的直接存储映象能力。
图1: 典型'C6x DSP板上的四种节点连接器,每个方块代表一个处理器。注意VMEbus P2底板旁的全局/P2连接器。
|
200芯的全局/P2 VIM连接器(图1)从全局总线上向中间模块引入了32位数据和地址线。通过这一通道,所有的四个处理器以及底板总线均可存取模块资源。这一连接器的最重要的部分是直接与VMEbus P2的64个用户定义引脚相连的64个引脚。这些引脚已被一些常用工业底板接口如VSB和RACEway所使用。
在所有VIM结构中,DSP板和所有连接的VIM模块共用同一个单VMEbus槽(图2)。这种方法的明显优点是灵活、高密度、低成本和更快的I/O通道。
图2: 连接到'C6x处理器主板上的两个VIM模块。
|
为了满足更多应用的不同需要,VIM规范中定义了5种不同形式的元素。目前可采用的VIM功能模块包括FPDP、 RACEway、数字接收器、并行 TTL I/O、串行I/O、多通道ADC和高速ADC。每种模块均利用了VIM提供的高速并行或串行接口,任何一个都与模块电路最佳匹配。
前面板总线
作为利用底板的另一种选择,发展了几种前面板数据互联策略,可通过采用高速并行、串行连接在板间传输数据来减小底板的通信量。两种常用的标准包括TMS320C40 DSP comm 口和FPDP。
TMS320C40 DSP芯片具有6个20MBps的通讯端口,称为“comm 口”。这些端口通常用来将'C40连接入不同的多处理结构中,但它们也可以用来连接许多系统外围设备,如ADC和DAC、数字接收器、SCSI接口、数字通信接口和TAXI适配器。
每个comm口包含一个带有独立'C40内部输入输出FIFO的异步、双向接口,可有效地缓冲输入、输出数据流。每一comm口可被分配到'C40中6个DMA通道中的任一个,作为主CPU计算的后台操作,自动进行数据传输。
FPDP现在已作为一种VITA标准被采用,它可在两个或两个以上VME板间提供32位的并行前面板总线。它是一种单向同步总线,可提供很高的数据传输速率,并可根据所选用的实现方式以80MBps或160MBps传输数据。
规范定义了四种类型的FPDP器件:发送器、发送控制器、接收器和接收控制器。每个系统可能只有一个控制器和一个发送器。控制器发布总线时钟,由它决定数据传送周期。发送器发送数据,接收器接收数据。FPDP系统具备可能有多于1个的接收器以支持多点或广播应用。尚未准备完成数据周期的任何接收设备可不响应发送器,直到它准备就绪。由于对每一个所连接的接收器总是只有一个发送器和数据流,因此不存在寻址或总线仲裁的概念。
FDPD规范中支持两种类型的数据选通: TTL选通和PECL选通。TTL选通可工作于50ns的总线周期,以使数据传输速率达80MBps。PECL选通采用25ns的周期支持160MBps传输。FPDP采用一种80芯扁平电缆,可一齐连接到80芯的连接器上,从而简化布线和电缆连接。FPDP现已被许多生产商采用,是一种公认的在系统各部分间传送高速数据的简单、快速、廉价的方法。
前面板串行接口
在系统实现中采用扁平电缆传输高速并行数据经常很不方便,因为电缆和连接器的尺寸相对较大,可支持的距离也比较有限。很难保证每一位数据都能无畸变地到达目的地。信号线之间也有可能产生串扰和不期望的RFI,除非电缆被很好屏蔽,这将增加连接的成本。
为了满足这些需要,更高速的串行连接出现了。它们提供的一些性能优势甚至可与最快的并行总线的性能相媲美。串行接口可采用同轴电缆和光纤电缆介质。与并行的扁平电缆相比,同轴电缆比较廉价、更为细小、屏蔽较好且易于安装和连接。光缆应用的距离很长且完全屏蔽辐射信号。它还很安全,任何电磁信号不会从光缆中泄出。
对于需要高层协议用于网络连接或诸如文件传输等带有消息和信息头的信号应用,光纤信道是常用的选择。它可用光纤或铜缆实现,通常建于1Gbps的低层原始串行数据信道之上,以惊人的100MBps传输数据。
光纤信道支持许多常用的高层协议,包括智能外围接口 (IPI)、Internet协议(IP)、和小型计算机系统接口(SCSI)。它还支持3种不同的系统拓扑结构:点对点、交换结构和仲裁环,可满足许多不同需求。
点对点系统连接两个设备,如高速ADC和SCSI硬盘。通过提供全双工工作方式,可方便地进行连接并以最小的响应时间和成本提供最大吞吐量。交换结构的系统支持计算机和设备的大型网络,且需要交换机对设备间的适当连接进行路由分支。交换机利用包含在消息中的网络设备信息进行工作,尽力维护结构中的多条通道,以使每一个网络设备得到最大限度的利用。
辅助底板总线
前面板串行和并行电缆为系统设计者解决了许多类型的互联问题,但却带来了一些复杂性,如必须构造、收集、安装和维护不同类型的电缆。如果系统各部分间的连接均可采用底板连接器来处理,优势是明显的。
由于VMEbus规范的起草者广泛采用P2底板连接器的三行32引脚中的两行作为专用接口,这64个用户定义引脚已被一些工业标准所采用,作为底板上的辅助数据通道。一些底板将这64芯总线并行穿过所有连接器,另一些则只简单地让每一个引脚悬空。已出现两种标准的VMEbus底板接口: VSB和RACEway。
作为一种为VME底板上的模块传输而设计的辅助数据通道, VSB需要64个用户定义引脚的总线底板结构,每一时刻有一块主板作为总线控制者。32位总线多路切换地址和数据,首先传送地址,随后是向目标板的序列地址加载的数据块。VSB已广泛应用了近15年,拥有来自约100个制造商的产品。其缺点是在某一时刻只能有一块主板发送数据,最大数据传输率仅为40MBps。
RACEway由Mercury Computer设计,用来解决非常高速的底板互联应用,它现在已被作为一种开放的工业标准而被接受且被十多家母板制造商采用。与VSB不同,RACEway允许多块主板同时发送和接受数据,传输速率是VSB的四倍。
RACEway实际上不是总线,而是一种互联结构,因此,它需要无总线的底板用于用户定义的引脚。RACEway通过一个独立的与VMEbus底板相连的PCB印制板连接,采用交叉的插槽将64个用户定义的引脚连接到P2连接器上。不同大小的印制板可连接最少2块、最多20个VME插槽。
每一RACEway通道同步工作在40MHz, 可提供160MBps的数据传输速率。不久将出现的RACE++技术可工作在66MHz,提供264MBps的传输速率。
图3: RACEway交叉开关的数据包路由。
|
RACEway印制板采用了一个智能交叉开关网(图3),每一开关具有6个节点,可同时支持3路160MBps的数据传输。 通过交叉点的数据流切换为每包512字(典型值)的数据包。 每一包的第一个字是包含9个3位域名的路由地址,每个域对应从源地址到目的地址的通道上的一个交叉开关。
接口技术是十分重要的。由于开放结构的嵌入式系统能够最大限度的利用最新的高性能DSP,因此它们完全取决于相互之间以及与系统I/O设备的连接。采用如VIM中间层接口提供的专用、高速数据通道进行直接连接可消除或大大减少共享资源的数据流瓶颈和仲裁。随着新器件的出现,这些新的接口策略将变得更加关键以满足处理器以及它们必须处理的外围设备日益增长的I/O要求。
欲了解更多信息,请联系Rodger Hosking
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。