DSP讲座:第三讲 TMS320C5000性能介绍
TMS320C54x是目前普遍使用的定点芯片。它的特点是功耗很低(在100MIPS时为60mW),可用于数字蜂窝通信、个人通信系统、寻呼机、个人数字助理(PDA)、ATM(异步传输模式)交换机、数字无线通信、等领域。
图1表示了C54x的发展过程及应用领域。
图1 TMS320C5000性能发展状况及应用领域 TMS320系列的同一代芯片具有相同的CPU结构,但根据市场的不同需要,形成新的与外设的不同组合,产生了多种派生器件。 TMS320C54x关键特性 图2是C54x功能结构图,它的主要性能如下:
指数器,可在单周期内计算(40位)累加器中数值的指数
两个地址产生器,包括八个辅助寄存器和两个的算术单元 ⒉ 存储器 可寻址存储空间达192K字(程序、数据及I/O各64 64bit),C548还可扩展程序存储器(8兆字) 典型C5400芯片存储器 ⒊ 片内外设 软件可编程等待状态产生器 可编程的块交换 片内时钟产生器 禁止外部总线的控制机制 ⒋ 指令集 重复单条指令与重复指令块 存储器块移动指令 32位数运算指令 可同时读取2或3个操作数的指令 具有并行保存和并行加载的算术指令 条件保存指令 ⒌ 功耗控制 IDLE1、IDLE2和IDLE3指令可控制其进入降功耗模式 可控制是否输出CLKOUT信号 ⒍ IEEE标准的1149.1边界扫描逻辑接口 TMS320C54x结构概述 'C54x由中央处理器CPU、存储器和片内外设组成,采用哈佛结构,有独立的程序空间、数据空间和I/O空间。图3是\'C54x的内部硬件框图。 对所有的\'C54x器件来说,图中下半部所示的中央处理单元(CPU)是通用的。 总线结构 一组程序总线(PAB、PB)和三组数据总线CAB、CB,DAB、DB,EAB、EB)将内部各部件联系起来。
EB-传送向存储器写入的数据,即"写"操作使用的数据总线;
PAB、CAB、DAB、EAB- 各对应的地址总线;
中央处理单元(CPU) ALU:算术逻辑运算单元 主要由40位ALU和两个40位累加器(AA和ACCB)组成,如图4所示。ALU和两个累加器用来完成40位补码的算术运算,也能完成布尔运算。当状态寄存储器ST1的C16位置1时,可做两个16位ALU,同时完成两个16位运算。输入: 16位立即数; 来自数据存储器的16位数; 来自暂存器T的16位数; 来自数据存储器读出的两个16位数; 来自数据存储器读出的一个32位数; 来自累加器(A和B)的40位数;
第二部分:TMS320C54xx性能介绍(二) TMS320C55是TI公司最新推出的定点DSP芯片系列,它比\'C54x的性能有很大提高,而且功耗大大降低,是目前TI公司推出的功率最小的DSP芯片,适用于便携式超低功率场合。
TMS320C55x主要特点: 图1是\'C55x的功能结构图,它的主要特点如下:
图1 TMS320C55x功能结构框图 超低功耗设计: 在硬件结构中采用双MAC,有4个40bit的累加器,因而在一个周期内可完成更多的任务。 有更多的"自动并行"指令。为发挥附加的硬件功能,有的指令隐含或装有并行化的能力;另一些指令通过\'C55x DSP核的最佳汇编器和C编译器自动安排成并行运行。 用户可自行编程达到并行操作,以便充分利用\'C55x DSP芯片的性能。 附加新的指令,扩展硬件处理能力。例如双16位的算术运算、双MAC、条件移位、条件加或减、比例并选择极值、偶或奇对称的FIR滤波、并行移位和存储、寄存器比较或交换等一系列新的指令。 先进的高级功率管理能力。其一是自动断电能力,\'C55x DSP核连续的对内存、外设和核心功能单元进行监视,自动的对不工作单元断电;其二是用户可以自己配置IDLE休闲域,\'C55x有64种休闲方式,通过改变休闲域寄存器对应的状态位就可以改变对应部件的通断。 通过增加硬件和操作的并行性,极大的提高了处理器的处理能力。 可变指令长度增加代码密度:指令长度为8/16/24/40/48 bit,选择不同长度可使编码密度达到最佳和有效地利用总线;指令预取由16 bit增加到32 bit;片上指令缓存单元自动的不包装指令,以便最有效地利用每一周期。 附加总线和扩充地址增加数据流量:\'C55x有一组程序总线,3组读总线,2组写总线,每组总线中的地址线有24 bit,因而极大的扩充了寻址能力。 外部存储器接口性能比\'C54x有很大提高:采用双字宽(32 bit)及高速低价格同步存储器,使存储器操作与CPU操作具有相同的速率。同时有自动断电功能,只在使用时接通。 指令高速缓存减少外部存储器访问:\'C55x是第一个采用指令高速缓存的器件,允许几条指令同时加载到高速缓存器中,CPU不必对每条指令都去访问存储器,并且在时钟速率下利用指令,增加速度,降低功耗。 改进的控制代码,改善了控制代码的密度:\'C55x 增加了几个控制代码的附件,包括新的指令缓存单元、数据存储器和ALU。对条件执行的两种可能性都有准备,使得一旦条件出现,DSP立即响应。
高级仿真缩短调试周期:代码与\'C54x兼容,维护消费者的软件投资。
TMS320C55x结构概述 \'C55x结构主要由下列各部分组成:
图1 TMS320C5000性能发展状况及应用领域 TMS320系列的同一代芯片具有相同的CPU结构,但根据市场的不同需要,形成新的与外设的不同组合,产生了多种派生器件。 TMS320C54x关键特性 图2是C54x功能结构图,它的主要性能如下:
指数器,可在单周期内计算(40位)累加器中数值的指数
两个地址产生器,包括八个辅助寄存器和两个的算术单元 ⒉ 存储器 可寻址存储空间达192K字(程序、数据及I/O各64 64bit),C548还可扩展程序存储器(8兆字) 典型C5400芯片存储器 ⒊ 片内外设 软件可编程等待状态产生器 可编程的块交换 片内时钟产生器 禁止外部总线的控制机制 ⒋ 指令集 重复单条指令与重复指令块 存储器块移动指令 32位数运算指令 可同时读取2或3个操作数的指令 具有并行保存和并行加载的算术指令 条件保存指令 ⒌ 功耗控制 IDLE1、IDLE2和IDLE3指令可控制其进入降功耗模式 可控制是否输出CLKOUT信号 ⒍ IEEE标准的1149.1边界扫描逻辑接口 TMS320C54x结构概述 'C54x由中央处理器CPU、存储器和片内外设组成,采用哈佛结构,有独立的程序空间、数据空间和I/O空间。图3是\'C54x的内部硬件框图。 对所有的\'C54x器件来说,图中下半部所示的中央处理单元(CPU)是通用的。 总线结构 一组程序总线(PAB、PB)和三组数据总线CAB、CB,DAB、DB,EAB、EB)将内部各部件联系起来。
EB-传送向存储器写入的数据,即"写"操作使用的数据总线;
PAB、CAB、DAB、EAB- 各对应的地址总线;
中央处理单元(CPU) ALU:算术逻辑运算单元 主要由40位ALU和两个40位累加器(AA和ACCB)组成,如图4所示。ALU和两个累加器用来完成40位补码的算术运算,也能完成布尔运算。当状态寄存储器ST1的C16位置1时,可做两个16位ALU,同时完成两个16位运算。输入: 16位立即数; 来自数据存储器的16位数; 来自暂存器T的16位数; 来自数据存储器读出的两个16位数; 来自数据存储器读出的一个32位数; 来自累加器(A和B)的40位数;
第二部分:TMS320C54xx性能介绍(二) TMS320C55是TI公司最新推出的定点DSP芯片系列,它比\'C54x的性能有很大提高,而且功耗大大降低,是目前TI公司推出的功率最小的DSP芯片,适用于便携式超低功率场合。
TMS320C55x主要特点: 图1是\'C55x的功能结构图,它的主要特点如下:
图1 TMS320C55x功能结构框图 超低功耗设计: 在硬件结构中采用双MAC,有4个40bit的累加器,因而在一个周期内可完成更多的任务。 有更多的"自动并行"指令。为发挥附加的硬件功能,有的指令隐含或装有并行化的能力;另一些指令通过\'C55x DSP核的最佳汇编器和C编译器自动安排成并行运行。 用户可自行编程达到并行操作,以便充分利用\'C55x DSP芯片的性能。 附加新的指令,扩展硬件处理能力。例如双16位的算术运算、双MAC、条件移位、条件加或减、比例并选择极值、偶或奇对称的FIR滤波、并行移位和存储、寄存器比较或交换等一系列新的指令。 先进的高级功率管理能力。其一是自动断电能力,\'C55x DSP核连续的对内存、外设和核心功能单元进行监视,自动的对不工作单元断电;其二是用户可以自己配置IDLE休闲域,\'C55x有64种休闲方式,通过改变休闲域寄存器对应的状态位就可以改变对应部件的通断。 通过增加硬件和操作的并行性,极大的提高了处理器的处理能力。 可变指令长度增加代码密度:指令长度为8/16/24/40/48 bit,选择不同长度可使编码密度达到最佳和有效地利用总线;指令预取由16 bit增加到32 bit;片上指令缓存单元自动的不包装指令,以便最有效地利用每一周期。 附加总线和扩充地址增加数据流量:\'C55x有一组程序总线,3组读总线,2组写总线,每组总线中的地址线有24 bit,因而极大的扩充了寻址能力。 外部存储器接口性能比\'C54x有很大提高:采用双字宽(32 bit)及高速低价格同步存储器,使存储器操作与CPU操作具有相同的速率。同时有自动断电功能,只在使用时接通。 指令高速缓存减少外部存储器访问:\'C55x是第一个采用指令高速缓存的器件,允许几条指令同时加载到高速缓存器中,CPU不必对每条指令都去访问存储器,并且在时钟速率下利用指令,增加速度,降低功耗。 改进的控制代码,改善了控制代码的密度:\'C55x 增加了几个控制代码的附件,包括新的指令缓存单元、数据存储器和ALU。对条件执行的两种可能性都有准备,使得一旦条件出现,DSP立即响应。
高级仿真缩短调试周期:代码与\'C54x兼容,维护消费者的软件投资。
TMS320C55x结构概述 \'C55x结构主要由下列各部分组成: