学海荡舟手机网

主页 > 实用文摘 > 教育文摘_04 > > 详细内容

高速Viterbi译码器的优化和实现_通信网络论文

摘要:大约束度卷积码作为信道纠错编码在通信中得到了广泛的应用,而其相应的viterbi译码器硬件复杂度大,限制了译码速度。分析了viterbi译码器的结构,优化了各模块,合理地组织了存储器结构,简化了接口电路。用fpga实现viterbi译码器,提高了译码器速度。

    关键词:卷积码 viterbi译码 acs 路径度量存储 fpga实现

viterbi算法是一种基于最大后验概率的卷积译码算法,应用广泛。cdma的is-95标准和wcdma 3 gpp标准将卷积码作为高速实时数据传输的信道纠错编码,使viterbi译码器成为移动通信系统的重要组成部分。

为保证纠错性能,卷积码结束度一般选择比较大的,在3 gpp中规定约束度k=9。出于实时性的考虑,移动通信系统中对译码时延的要求比较高,需要高速译码器的支持。可是viterbi译码算法的复杂度、所需存储器容量与结束长度成指数增长关系,成为限制译码器速度的瓶颈。viterbi译码器每解码一位位就需对2 k-1个寄存器的状态进行路径度量,并对相应的存储单元进行读写。这种情况下,可以采用状态路径存储单元分块的方法,以提高其译码性能,缺点是acs单元与存储器之间的接口电路十分复杂,不易实现。

本文分析和优化了viterbi译码器的结构,提出了一种fpga实现方案,简化了接口电路,提高了速度。用这种结构实现的单片集成译码器译码速率达350kbps、时钟频率30mhz。以下先分析译碱器总体结构,然后对各模块设计和实现做详细说明。

1 算法简述及译码器结构

本文采用3 gpp标准规定的k=9,码率r=1/2的(753,561)卷积码,卷积编码器送出的码序列c,经过信道传输后送入译码器的序列为r。译码器根据接受序列r,按最大似然准则力图找出正确的原始码序列。

viterbi译码过程可用状态图表示,图1表示2个状态的状态转移图。sj,t和sj+n/2,t表示t时刻的两个状态。在t+1时刻,这两个状态值根据路径为0或者1,转移到状态s2j+1和s2j+1,t+1。每一种可能的状态转移都根据接收到的有噪声的序列r计算路径度量,然后选择出各个状态的最小度量路径(幸存路径)。viterbi算法就是通过在状态图中寻找最小度量路径向前回溯l步,最后得到的即为译码输出。

    本设计采用xilinx virtex600e fpga芯片,在aldec公司的active-hdl仿真环境下,用verilog语言完成,并用xilinx的ise4综合实现。viterbi译码器系统框图如图2所示,主要由bmg(路径计算模块)、acs(加比选模块)、tb(路径回溯模块)、mmu(路径存储模块)等部分组成。采用并行流水线结构,各个模块在控制信号统一监控下工作,减少了读取数据所需时间,充分发挥了fpga高速计算的特性,提高了整个系统的效率。

2 子模块的优化和实现

2.1 acs模块

由于采用的卷积码约束度k=9,在译码过程中,每一时刻有2k-1=256个状态,512个度量路径值,为了获得高速率,需采用尽可能多的acs单元。但由于实际应用中需求电路面积小、功耗低,决定了acs单元的数目不能太多。经过实验证明,采用4个acs单元并行处理,完成可以达到应用要求。

图3 度量路径状态分组图

    acs单元用来计算选择状态的路径度量。它需要不断地读出路径度量作为操作数,然后将更新的度量写回各个状态。由于采用4个acs单元并行处理,为不造成流水线堵塞,如何对ram中的度量数据进行读写是关键。如前述,本文采用状态路径存储单元分块的方法。将所有状态分成4组,分别对应于4个acs。每次运算时,4个acs同时从各组状态值中读取数据进行操作。

由图1可知,状态sj和sj+2/n在状态转移中同时得到两个新状态s2j和s2j+1。因此为了acs能够同时取出这两个状态值,sj和sj+2/n必须存储在不同的ram组中。同样,两个计算出来的新状态s2j和s2j+1也应如此。遵循这种准则,则时也简化接口电路,采用如下的分组算法:假设待分配状态=sj=sk-2sk-1…s1s0,所对应的ram组为rm,由于ram共分成4组,则m=(sk-2s1)s0(两位二进制数表示)。状态分组图如图3所示,从中可以看出,从状态s128开始的后续状态都有规律地交错位置存储。由此,acs单元和状态路径存储单元的接口电路只需采用两个2×2交换器,如图4所示。每一个交换器上连着两个acs单元和两个ram组。这两个交换器由输入状态sj的最高位sk-2控制。当sk-2=1时,交换器交叉互联,如果sk-2为0时,各acs和ram直接相连。这种接口设计十分容易实现。

在viterbi译码算法中,译码状态的转移导致度量的读出和写入地址的不同,这样用fpga实现时就需要两块ram采用乒乓模式实现。本文更新路径存储采用原位运算方法,也就是找出状态转移的规律性,建立转移后的新状态和转移前的老状态际址映射关系,使度量的更新在原位上进行,使存储空间减小一半。

2.2幸存路径管理模块

幸存路径的存回溯是viterbi算法关键的一步,最终的译码输出从对幸存的回溯中得到。由于采用基2的状态转移算法,当前时刻对应的前序时刻状态只有2个,所以在路径回溯中采用1bit指针算法。也就是说,在每个状态路径更新时,只需写1bit路径状态转移。幸存路径存储单元可看作一个存储器阵列,每列对应一个状态,一列中的每个单元都有一个1位的指针。在实际设计中,考虑到数据总线的带宽有限,对于8位的幸存路径数据总线,在幸存路径存中将256个状态分成32块。对应幸存路径时,先通过当前状态地址寻址的方式来选择所对应的幸存路径块。

在实际应用中,为了保证译码的准确度,幸存路径的回溯长度通常取4~5倍约束长度,本文回溯长度定为64。如图5所示,当一个解码初始信号进来后,系统把当前所有状态中的最小状态,也就是最小状态值作为当前状态值,路径回溯模块把地址值送入mmu中,从32个分组块中选取相应的幸存路径存到幸存状态值(8位),然后根据当前状态的指针从这8位数据中得到1位幸存路径比特,而下一个状态值由当前状态的低7位和这个幸存路径比特决定。当回溯了64步后,控制信号给出一个输出指示时,当前状态值的最高位即是解码输出值。

图5 路径回溯模块框图

    本文重点从acs的并行处理、度量路径的存储管理和路径回溯上对viterbi译码方法进行了讨论。从实际应用出发,考虑到硬件功耗的面积的减小,采用了4个acs并行,路径的存储和管理都采取了分组的模式,简化了接口电路,译码达到了较高的速度,完全可以满足3 gpp标准的要求。用xilinx的virtex600e fpga芯片实现了k=9、码率为1/2、编码速率为350kbps、时钟频率40mhz的viterbi译码器。表1列出了xilinx ise对本设计综合布线报告中提供的参数。

表1 viterbi译码器布线参数表

number of slices:1,596 out of 6,192 23%
slice flip flops:620
4 input luts:1,320
number of slices containing
unrelated logic:0 out of 1,596 0%
number of bonded iobs:30 out of 153 19%
number of block rams:20 out of 72 34% 
total equivalent gate count for design:474,210