DSP编程的几个关键问题_DSP论文
关键词:汇编指令的歧义 bootload bug mcbsp multi-frame
dsp芯片凭其优异的性能在高速计算领域有着巨大的应用前景。但其应用所涉及的知识非常庞杂。本文以ti公司320c54x系列为蓝本进行提纯,所有认识都是笔者在实际工作中亲手实践所得。当程序调不通不知该从何处下手时,此文也许会有所帮助。这些关键点有些是tms320c5409所触有而有些是与dsp所共有的。
1 mcbsp(multichannel buffered serial port)串口利用dma中的多帧(multi-frame)方式通信的中断处理
在实际通信应用中,一个突发之后,程序必须为下一个突发作准备。因此一般采用串口的dma多帧方式但在串口以dma方式传输数据时却有一些问题要讨论。首先dma的传输同步事件应设mcbsp的传输事件即xevt,这样一字节传输后会自动准备另一字节(mcbsp的ready上升沿触发dma传输)。中断发生时意味着一个块已传完,这时dma的使能自动关闭,mcbsp的ready将一直保持高状态。但是在下一次突发传输直接使能dma时却启动不了传输(相信会有许多我遇到此类问题)。这是因为无法产生mcbsp触发启动所需的ready上升沿。解决办法是在中断程序中先关闭mcbsp的发送,使ready=0,随后在程序中发送使能dma,再打开mcbsp的发送即可。如先打开mcbsp的发送后打开dma,也是不会工作的。因为mcbsp的ready已经由0变到1了,无法再产生ready上升沿。
2 关闭dma与关闭mcbsp的区别
在通信领域,为了充分利用dsp的片上外设资源,常常利用dma把从串口来的数据或要发的数据放入缓冲区,再处理。对dma而言,只要其在数据缓冲区的指针指向了中断应发生的位置,就产生中断。但此时最后一个数据只是进入了mcbsp而并未真正发出去,所以在传送结束的中断程序中只能关闭dma不能关闭mcbsp。因为此时mcbsp的发寄存器dxr中还有一个字没有发出。
3 mcbsp串口配置的关键时序
主要是寄存器spcr2的配置:在保持rrst、xrst、frst各位为0的前提下,配置好其它串口控制寄存器。等待至少2个clkr/t时钟以确保dsp内部的同步。
(1)可以向dxr装载数据或使能dma。
(2)使能grst(grst=1)(如果需要dsp内部产生采样时钟)。
(3)使能rrst或xrst,注意此时要保证spcr中仅有此一位发生改变。
(4)使能frst(frst=1)(如果需要dsp内部产生帧同步)。
(5)等待2个r/t clk时钟周期后,收或发端便会有效。
4 汇编语言程序中的变量
汇编语言程序中的公用变量应在文件中定义,如.def carry。汇编语言程序中使用的局部变量不需定义,可直接声明,例如trn_num .word 00h。如果在两个asm文件中有两个都没有定义的同名变量,则编译程序会认为分他们不是同一变量。在汇编程序的开头应有.mmregs宏语句。它一方面表示对默认定义的确认(ah,bh,trn等),另一方面可以对所用寄存器重新定义。如:
.mmregs
dmprec .set 54h ;定义dma优先和使能寄存器地址在54h
dmsa .set 55h
dmsdn .set 57h
dxr10 .set 23h ;定义串口1的发送寄存器地睛在23h
5 st1寄存器中cpl位的影响
cpl位是编译模式控制位,它表示在相对直接寻址时采用哪种指针。当cpl=0时,使用页指针dp;当cpl=1时,使用堆栈指针sp。实际使用中二者没有什么差别,但使用sp寻址的程序更易读。在程序中经常使用cpl=1。
6 指令的歧义
6.1 比较下面指令
stlm b,ar4 ;把bl内容送入寄存器ar4 (×)
stlm b,*ar4 ;把bl内容送入寄存器ar4 (√)
前者实际执行的是把bl内容送入一个系统用的缓冲区,后者也可用:
mvdm bl,ar4 ;把bl内容送入寄存器ar4 (√)
其他易导致歧义的语句还有:
ld ar5,a ;把ar5的内容送入寄存器a (×)
ldm ar5,a ;把ar5的内容送入寄存器a (√)
andm #0x107e,ar4;把#107e加到寄存器ar4 (×)
andn #0x107e,*ar4;把#107e加到寄存器ar4 (√)
仅对某些寄存器有效的指令:
mvdd * ar2+,*ar3+ ;把以ar2为地址的内容拷入ar3的地址中
此类指令用作数据块搬移特别有效,但仅对ar2、ar3、ar4、ar5有效。
易错语句中对程序运行危害最大的是:
st #0,*(bsp0_out_sign) ;bsp0_out_sign是一个变量名(√)
stm #0,bsp0_out_sign ;此语句被编译为stm #0,pmst或stm #0,imr (×)
这种语句会导致程序运行中的随机故障,且极难发现。
6.2 流水冲突
分析以下程序:
stm to_dce_buff,ar4
ldm ar4,b
add a,b ;b=ar4+al
mvdm bl,ar4 ;ar4=to-dce-buff+al
实际上,上段程序得不到ar4=to-dce-buff+al的结果。这是因为dsp一般采用深度为3~6级的流水结构,产生了无法解决的冲突,所以它不能被正确执行。解决的办法是在赋值和引用之间插入一条或几条其他的指令,或nop语句即可。
7 汇编与c语言混合编程的关键问题
7.1 c程序变量与汇编程序变量的共用
为了使程序更易于接口和维护,可以在汇编程序中引用与c程序共享的变量:
.ref_to_dce_num,_to_dte_num,_to_dce_buff,_to_dte_buff
在汇编程序中引用而在c程序可直接定义的变量:
unsigned char to_dte_buff[buff_size]; //dsp发向pc机的数据
int to_dte_num; //缓冲区中存放的有效字节数
int to_dte_store: //缓冲区的存放指针
int to_dte_read; //缓冲区的读取指针
这样经过链接就可完成对应。
7.2 程序入口问题
在c程序中,程序的入口是main()函数。而在汇编程序中其入口由*.cmd文件中的命令决定,如:-emain_start;程序入口地址为main_start。这样,混合汇编出来的程序得不到正确结果。因为c到asm的汇编有默认的入口c-int00,从这开始的一段程序为c程序的运行做准备工作。这些工作包括初始化变量、设置栈指针等,相当于系统壳不能耐跨越。这时可在*.cmd文件中去掉语句:-e main_start。如仍想执行某些汇编程序,可以c函数的形式执行,如:
main_start(); //其中含有其他汇编程序
但前提是在汇编程序中把_main_start作为首地址,程序以rete结尾(作为可调用的函数)的程序段,并在汇编程序中引用_main_start,即.ref _main_start。
7.3 移位问题
在c语言中把变量设为char型时,它是8位的,但在dsp汇编中此变量仍被作为16位处理。所以会出现在c程序中的移位结果与汇编程序移位结果不同的问题。解决的办法是在c程序中,把移位结果再用0x00ff去“与”一下即可。
7.4 堆栈问题
在汇编程序中对堆栈的依赖很小,但在c程序中分配局部变量、变量初始化、传递函数变量、保存函数返回地址、保护临时结果功能都是靠堆栈完成。而c编译器无法检查程序运行时堆栈能否溢出。所以应尽量多给堆栈分配空间。c编译器的默认大小为1kb。在程序不正常跑飞时应注意检查是否堆栈溢出。
7.5 程序跑飞问题
编译后的c程序跑飞一般是对不存在的存储区访问造成的。首先要查.map文件并与memery map图对比,看是否超出范围。如果在有中断的程序中跑飞,应重点查在中断程序中是否对所用到的寄存器进行了压栈保护。如果在中断程序中调用了c程序,则要查汇编后的c程序中是否用到了没有被保护的寄存器并提供保护(在c程序的编译中是不对a、b等寄存器进行保护的)。
8 命令文件的编写
在编辑*.cmd文件时编译连接器默认:page 0就是rom区,page 1就是ram区。下列段必须放在rom区。
.text load=prog page 0 ;程序段
.const load=data page 0 ;常数段
.cinit load=data page 0 ;初始化段
.switch load=data page 0 ;switch指令常数表
值得注意的是尽量不要用fill选项,一旦进行填充会使生成的.out文件增大甚至超过内部的存储空间而无法bootload。
9 bootload问题
一般都采用从eprom引导,但通常很费脑筋。下面介绍一下可为54x系列dsp内部引导程序识别的eprom存储结构,如表1所示。
表1
eprom内容 | 地 址 |
08aah或10aah swwsr(等待状态产生寄存器)值16 bscr(页切换控制寄存器)值16 人口点xpc(外部存储器映射寄存器)值7 人口点pc(程序地址寄存器)值16 第一块的大小16 第一块的人口点xpc(外部存储器映射寄存器)值7 第一块的人口点pc(程序地址寄存器)值16 代码(1)16 …… 代码(n)16 最后一块的大小16 最后一块的人口点xpc(外部存储器映射寄存器)值7 最后一块的人口点pc(程序地址寄存器)值16 代码(1)16 …… 代码(n)16 0000h(标志引导表结束) …… …… …… eprom的启始地址(如8000h) | 首地址 |
假使已经生成了*.out文件,生成时必须带有芯片,此处为ms320vc5409,版本参数如:asm500 init_54x-v548)。
.hex文件与eprom的存储空间相对应,其生成的参数由.cmd文件决定。下面以实例介绍.cmd文件中的参数编写及意义。
cdpd.out ;将cdpd.out文件转换成.hex文件
-swwsr 7fffh ;将外部设备的等待时间设为7个等待状态
-bscr 0f800h ;设置4k为一页,页面切换时插入1个等待状态
-o cdpd.hex ;转换成cdpd.hex文件
-i ;intel格式
-boot ;把所有的程序块装入eprom
-bootorg 8000h ;从eprom存储器的8000h处开始写入程序内容
-memwidth 8 ;系统数据宽度转为8位,以避免生成2个文件
-romwidth 8 ;eprom数据宽度为8位
-e 0840h ;从8040h开始执行程序
-map wfcdpd.mxp ;生成eprom存储器占用映射
这时生成的cdpd.hex可以直接写入eprom。需要说明320c5409的外部ram范围从8000h~ffffh,所以设首地址为8000h。但是对c54x系列而言,其转换有个bug,即它总是不能在0xffff处写入从外部eprom存储器装载的开始地址,只好自己填入。对本例而言在0xfffe处写0x80,在0xffff处写0x00。