以太网到多路E1适配电路设计及FPGA实现_通信网络论文
关键词:fpga 反向复用 以太网数据 ei信道 适配电路
伴随着internet的迅速发展,ip已经成为综合业务通信的首选协议,其承载的量也在成倍增长,如何利用现有的电信资源组建宽带ip网络是近年来研究的热点。目前,比较成熟的技术主要有ip over sdh(pos)和ip over atm(poa)。pos将ip包直接装入sdh的虚容器中,通道开销少、实现简单,具有自动保护切换功能;poa的复接过程比较复杂,可以通过高系统开销提供较好的服务质量保证(qos)。从目前的市场看,各大通信设备商都推出了基于pos/poa的产品,但总体成本较高,主要面向的是一些高端应用。对于带宽需求在十几兆以下的点对点通信而言,上述两种技术的优势并不明显。本文介绍的适配电路将以太网数据适配到e1信道传输,通过配置e1信道数量控制带宽,针对这类应用提供了一种经济灵活的解决方案。
适配电路的一侧为mii标准以太网mac接口,采用100mhz/全双工模式,另一侧是8路e1(hdb3)差分接口。发送方向将以太网数据封装为hdlc帧,反向复用到1~8路可配e1信道传输,接收方向同步多路e1,还原出以太网数据。带宽从2mhz到16mhz(1~8路e1)可配,接收侧多路e1之间可以容纳16毫秒的延时。
鉴于目前国内类似产品较少,而asic开发成本较高,本电路采用vhdl编程→fpga实现设计流程。
1反向复用定义
反向复用的基本概念就是把一路高速数据适配到多路低速信道中传输,提供相当于多路低速之和的传输带宽。对于点对点通信,主要关心以下几点性能。
1.1 带宽利用率
低速信道在传输高速数据的同时,必然有附加的开销,会影响带宽利用率。在本设计中,以太网包进入适配电路后封装成hdlc帧需要四字节的附加信息。e1帧在传输hdlc数据的同时要携带的同步,占用6.25%带宽。综合上述两点,有效数据平均带宽利用率大约在90%。
1.2 容纳延时
由于各路低速信道在传输过程中经历的路径不同,到达对端后各路间会有延时,设计中要考虑如何消除这部分延时。
1.3 线路故障处理
算法设计中必需有同步保护状态机,保证传输信道出现错误时,算法不会产生过高的附加误码率,并且在信道错误恢复时,保证数据传输同步恢复。
1.4 数据包突发性
以太网的满发送速率为100mhz,而低速信道的最大可配带宽为16mhz,这将导致即使平均流量小于配置带宽,一个短时间内,接收的数据量还有可能远大于传输带宽。所以在以太网数据的输入侧必须设计高容量的缓存队列以容纳一定的突发数据包。
2 算法设计
以下就设计中一些核心电路的算法做具体说明。
2.1 以太网数据→多路e1反向复用
数据反向适配一般可以采用三种方式:包间插、比特间插和字节间插。所谓包间插就是指数据包到达后,连续检测各个e1信道,在第一个查到的空闲信道上顺序传输整个数据包,下一包到达后再重复这一过程。这种方式的优点是设计简单,在对端也不需要对多路e1进行同步,各路数据可单独处理。缺点是由于各路e1传输过程中经历延时不同,导致对端接收数据包的顺序与发端顺序有较大差别。考虑到发包比较稀疏的情况,一个长包完全可以在一路e1中传递,而其它e1通道没有数据包传送。这样,一方面造成带宽浪费,另一方面也引入较大的转发延时。
比特间插在传输过程中没有包的概念,只是顺序从以太网数据输入缓存区内读出比特流并按1→n(n路e1)循环编号,编号为i的比特在第i路e1中传输。这种设计电路十分复杂,对端要对多路e1同步到比特单位才能还原出有效数据。其优点就是没有带宽的浪费和输入输出包顺序的变化,转发延时也是固定的。
本设计采用的字节间插是比较折中的解决方案。它的基本原理与比特间插类似,但从缓存区读出的数据和编号都是以字节为单位,每个字节经过串并转后在对应编号的e1信道中传输。它继承了比特间插的优点,同时由于对端只需同步到字节单位上,处理时钟较为宽裕,同步电路设计也就相对简单。其具体的算法实现如下:
以太网数据包进入适配电路后封装成hdlc帧存入缓存区buff,buff的出口侧速率与多路e1信道传输速率匹配,一个2mhz时钟周期内完成的操作如图1所示。
图中,
fcnt:8比特帧计数(e1帧有256个bit);
mfcnt:8比特复帧计数;
l3:fcnt的低三位比特;
e1out:输出8路e1数据(8bit);
framecode:e1帧同步码“10011011”;
n:配置e1路数(1~8);
rdaddr:buff读地址;
p2s:2×8字节并串转换存储区,写一组8字节时,读另一组8字节;
wr:p2s读写区域指示(0,1)。
输出的e1帧格式如图2所示,帧同步码和复帧计数都是为接收端提供同步。
2.2 e1接收数据同步
e1接收侧要完成的功能是从多路e1数据中还原出以太网数据包。简单看就是发送侧反向复用的逆过程,通过高速时钟循环从1→n路e1中各读出一字节合成一路数据。但由于各路e1在传递过程中经过延时不同,同一时刻到达字节不对齐,在合并前必须对多路e1进行同步。考虑到同步过程的复杂性,在设计算法时采用了分步处理,以降低复杂度。
第一步处理是根据帧结构中帧同步码,通过置位同步法完成单路e1帧同步,同步原理图和状态机如图3所示。同步后每路输出数据产生独立的帧定时计数器tm,从0→31标记e1帧对应的32(256bit)字节,其中第0字节即帧同步码framecode,第一字节即复帧计数器mfcnt。这一步并未涉及多路间的延时消除。
根据状态转移图确定的状态参数,α(搜索保护帧数)=3、β(同步保护帧数)=4。设线中误码率pe=10-3,l(帧同步码长度)=8,ts(e1帧周期)=125μs,得出同步机的性能指标:
平均同步时间≈[1/(l×pe)β-(α-1/2)] ×ts≈8.5小时
同步失帧误码率≈1/2(α-1/2)(l×pe)β≈5×10 -9
可见在较高的误码率下(10 -3),同步机还是能够保证比较好的同步质量,平绝每8.5小时出现一次失步,引入的附加误码率也只有10 -9量级。
第二步处理根据e1帧同步产生的帧计数和每感数据中的复帧计数消除各之间的延时及时钟相位差。其基本原理见图4。在第0路数据延时最小的情况下,设第一步完成同步后到达ram(0)的数据为第m复帧第t字节,数据以各自计数为写地址存入ram,延时检测通过计数不停检测,直到所有路第m复帧t字节到达后,再统一以clk为读时钟,以m&t为起始地址顺序从ram中读出数据。由于mfcnt最大为255,第二步同步能容纳的线路时延在(-128,+128)帧之间,超过这个范围mfcnt所代表的时延就可能是(n(任意整数) ×128+mfcnt)帧,所以该算法能承受的最大线路延时为:
128×ts(帧周期)=16ms
在线路误码率较低时,e1帧同步丢失较少,帧定时计数tm可以确定,影响第二步处理的只有数据中的复帧计数字节。在没有保护的条件下,假设目前某一路mfcnt由于误码使其读数由正确值a变为b,因为下一轮开始时a、b位置帧会重写,不会对数据整体逻辑产生较大影响,其它位置的误码会在后续的hdlc帧同步处理中检测。如果线睡误码率较高,由于e1会频繁失步使第二步处理根本无法进行。出于述考虑该步算法设计没有采用状态机保护。
2.3 hdb3时钟提取
从接收的e1信号hdb3编码中提取时钟的原理如图5所示。首先通过一个高速时钟采样hdb3的码流(code)得到数据变化沿(edge),再根据edge位置由高速时钟分频出对应的2mhz时钟。
3 电路设计
整体电路结构如图6所示。在输入数据缓存和消延时两部分处理中,由于需要较大存储空间,采用两块外挂的ssram。内部处理以字节为单位,全同步电路设计,对应以太网侧处理速率为12.5mhz,对尖e1侧时钟为256khz(2.048mhz/8)。两侧速率匹配通过高速时钟采样低速时钟完成。
4 时序分析
从逻辑验证到fpga实现主要区别是增加了实现布线、引脚间的时延。使系统失效的时序问题主要有以下几点:
(1)输入经内部逻辑到输出的建立时间、保持时间和引脚时延大于一个时钟周期。
(2)并行处理的信号彼此之间时延过大,不能同时采样。
(3)在内部对时钟信号进行过多操作,引入时钟毛刺。
(4)对同一时钟,既使用上升沿,又使用下降沿触发,使时钟最高频率损失一半。
(5)在交叉时钟域中,直接采样由另一时钟作为触发的信号,引入不确定态。
对于这些常见问题,设计中采用如下相应对策:
(1)所有输入、输出引脚信号都经过时钟采样,减少引脚的时延。
(2)内部信号操作增加d触发器,两级触发器之间尽量减少组合逻辑,比较复杂的处理经多个时钟周期完成,减小信号保持时间。
(3)并行逻辑经过相同的处理流程,时分复用完成,并行引脚也尽量分配在一起。
(4)内部处理由单一系统时钟完成,低速时钟经高速时钟采样统一到高速时钟上,减少交叉时钟域。
(5)不对系统时钟进行操作,只使用上升沿触发器。
(6)必需进行时钟转换时,通过双端口ram或fifo完成,不直接操作交叉时钟。
在设计中注意上述问题后,quartus ii的后仿真结果能够很好地满足时序要求,其中系统时钟(12.5mhz)最在能够满足20.59mhz,2mhz时钟能够满足41.03mhz。此结果在实际硬件测试中得到了验证。
5 实际产品性能分析
本文介绍的以太网/多路e1适配电路设计已实际应用在华环公司h0el-1100 e1/100 base-tx适配器中,表1是实际产品的吞吐量测试结果。由于以太网吞吐量包括ieee802.3规定的导和sfd字节,而这部分是固定值,不需要经过e1信道传输到对端,所以测试值可能大于实际e1信道容量。表2是在8路e1配置下,以15mhz速率发包测得的以太网数据两端设备的传输延时。该设计在apex ii 20k100器件中占用的逻辑单元为3608个(共4160个逻辑门)。
表1 吞吐量测试结果(单位mbit/s)
路数/包长 | 64 | 128 | 256 | 512 | 1.24 | 1280 | 1518 |
1 | 2.44 | 2.19 | 2.05 | 1.99 | 1.97 | 1.97 | 1.97 |
2 | 4.85 | 4.33 | 4.06 | 4.00 | 3.98 | 3.93 | 3.93 |
3 | 7.25 | 6.41 | 6.09 | 5.93 | 5.75 | 5.75 | 5.75 |
4 | 9.57 | 8.57 | 8.06 | 7.97 | 7.83 | 7.80 | 7.80 |
5 | 11.88 | 10.76 | 10.25 | 9.88 | 9.75 | 9.75 | 9.75 |
6 | 14.47 | 12.72 | 12.06 | 11.75 | 11.74 | 11.43 | 11.43 |
7 | 16.82 | 15.07 | 14.25 | 13.87 | 13.50 | 13.50 | 13.50 |
8 | 19.27 | 17.26 | 16.13 | 15.75 | 15.37 | 15.37 | 15.37 |
表2 以太网口传输时延(单位μs)
包长 | 64 | 128 | 256 | 512 | 1024 | 1280 | 1518 |
cut trough | 400.4 | 437.0 | 516.9 | 670.4 | 976.9 | 1130.1 | 1278.1 |
store and forward | 395.3 | 426.8 | 496.5 | 629.5 | 895.0 | 1027.7 | 1156.7 |
在开发过程中由于采用高级硬件编程语言→编程器件的设计实现过程,大大缩短了开发周期,增加了硬件设计的灵活性和可移植性,也避免了专用集成电路设计的高风险。采用逻辑仿真与后时序仿真相结合的验证方法,基本可以保证设计的可靠性。基于上述优点,这种开发方式在中小指集成电路开发中已得到广泛的应用。尤其是近年来,硬件方面伴随着微电子工艺的迅速发展,编程器件的集成度正在成倍增长,越来越多的asic单元如微处理器、专用接口等嵌入编程器件中,使其适用范围更广;软件方面eda开发商提供了众多的ipcore及仿真工具,使得编程过程进一步简化,可靠性也不断增强;在此基础上sys on programmable chip技术也开始走向商业化,为编程器件的发展提供了更为广阔的空间。