学海荡舟手机网

主页 > 实用文摘 > 教育文摘_09 > > 详细内容

基于TM1300的可视电话终端研究_通信网络论文

摘要:简要介绍philips公司的多媒体数字信号处理器tm1300,重点阐述以tm1300为核心实现可视电话终端的一种方案。本方案按照itu-t制订的h.324系列标准建议,对输入音频和视频信息分别进行了基于g.723.1协议和h.263标准的信源编码,然后,根据分组复用h.223标准和通信控制规程h.245标准在pstn上进行传输。

    关键词:tm1300 h.324 g.723.1 h.263

引言

1996年itu-t制订了在pstn上传输多媒体信息的h.324系列标准建议,主要包括视频编解码(video codec)h.263标准、信息流分组复用(multiplex)h.223标准、通信控制规程(control)h.245标准、低码率语音编码(speech codec)g.723.1标准以及调制解调器(modem) v.34bis标准等。其中g.723.1协议可将64kb/s的pcm语音信号压缩至6.3kb/s甚至5.3kb/s,h.263协议可将视频信息压缩到20kb/s左右;因此,压缩后的语音和图像信号的码速率低于28.8kb/s,而v34调制解调器已实现了pstn上的33.6kb/s码速率的传输。这样,就可以在普通模拟电话网络(pstn)上利用v.34调制解调器实现实时传输多媒体。

h.324终端可以有两种实现形式:基于pc机支持的可视电话终端和无需pc机支持的“独立式”可视电话终端。前者需要pc机、摄像头、视频捕获卡、内置或外置modem;后者需要将显示器、摄像头、普通电话集成一体,形成一独立的小型可视电话终端。本文介绍的可视电话终端属于后者。它是以philips公司的tm1300多媒体dsp为核心来实现的,主要包括话音和图像的采集、编解码、显示、回放,码流复用及通信控制等功能模块。

1 tm1300处理器简介

tm1300是philips公司于1997年以来推出的系列多媒体dsp trimedia的最新一款性能优良的多媒体处理芯片。它以多媒体处理和通信功能为主,融合了cpu芯片原有的计算功能,已广泛应用于多媒体专用设备、家电及宽带通信设备。tm1300结构框图如图1所示。

tm1300特别针对数字视频和音频应用进行了结构优化,集成视频输入、输出接口,音频输入、输出接口以及通信线路接口等围设备。其核心32位的处理器,能够进行32位的线性寻址,寻址能力可达到4gb;同时,它含有128个通用寄存器,这些寄存器不像其它dsp的寄存器那样分段,所有的操作都可以使用这些寄存器,其核心处理器采用的是vliw(very long instruction word)超长指令字结构,可以在每一个时钟周期内同时进行5个操作。vliw结构还可以减少处理器的工作量,核心cpu的运行由实时操作系统内核进行控制。相互独立的多媒体输入、输出单元可以接收和输出格式化数据。tm1300提供4个通用的定时器,其中三个可被编程用来产生cpu时钟周期、数据/指令断点、cache跟踪、音频/视频时钟等等。其spdif输出单元可输出高速的串行数据流,主要应用于向外部音频设备输出spdif格式的数字音频数据。由于数据流内容完全由软件控制,因此,spdif输出单元也可用作通用的高速输出设备,如uart。tm1300内部有专用的16kb的数据高速缓存和32kb的指令高速缓存,并且数据高速缓存是双端口的,允许同时进行双向访问。此外,tm1300还带有一些专用的协处理器和专用的多媒体指令,其内部和功能单元之间通过一个高性能的总线和存储系统进行通信,开发者可以充分利用tm1300硬件体系结构的特性,提高视频、音频编解码算法的运算速度。变长解码协处理器(vld coprocessor)可以完成h.261、h.263、mpeg-1、mpeg-2和mpeg-4码流的哈夫曼解码;图像协处理器icp(image coprocessor)可以在不需cpu参与的情况下对图像进行缩放和滤波处理。

多媒体应用要求系统资源和活动得到高效的管理,tm1300处理器支持psoc实时多任务操作系统内核,psos操作系统由美国isi(integrated system inc)公司开发。它基于开放式操作系统标准,并且针对多媒体应用作了专门的优化。psos真正实现了抢先式、基于优先级的任务调度及合理的中断处理。内核保证在任务时刻,正在运行的任务在所有准备好的任务中具有最高的优先级,更高优先级的外部事件可以抢先改变调度的行为,通过改变抢先特性,或调度任务时间片,用户可以改变调度的行为。psos还具有以下特点:动态的、基于对象的多任务及动态的存储分析;灵活的计时管理和时钟服务;先进的错误处理和故障恢复等。psos操作系统在内核层将与硬件有关的操作放在一个模块中,对系统服务层以上则屏蔽了具体的硬件特性。

2 可视电话终端构成与工作原理

2.1 系统框图和工作原理

图2是基于tm1300的“独立式”可视电话终端的基本框图。图2右边的的eeprom、flash存储器和sdram可分别看作pc中的bios、harddisk(硬盘)和ram(内存),v.34/isdn为通信端口。在给终端加电后,tm1300首先从eeprom中读取系统启动的一些重要信息,例如cpu工作的时钟频率,外围sdram的大小等。然后cpu从eeprom中把启动程序读入sdram,再由启动程序把flash memory中的主程序读入sdram并开始执行。图2左边的视频输入/输出(vi/vo)单元和音频输入/输出(ai/ao)单元功能描述如下:

(1)视频输入/输出单元(video in/video out)

视频输入单元接收符合ccir601/ccir656标准的yuv 4:2:2格式的数据。数据在输入后先被拆分成独立的y、u、v数据,然后送入sdram中。另外,可根据需要对输入的视频数据进行水平方向的亚采样。视频输出单元输出符合ccir601/ccir656格式的视频数据,它还可对输出的数据进行内插,以使亚采样后的数据恢复为640点/行或720点/行。

(2)音频输入/输出单元(audio in/audio out)

音频输入/输出单元分别与串行的adc(模数转换)、dac(数模转换)芯片相连,采样时钟受tm1300控制,采样频率可从直流到100khz。输入输出的数据可是8位或16位的串行单声道立体声数据。

本终端工作过程简述如下:首先,本地a机摄像头输入数据,经视频解码器解码转换为符号ccir601/ccir656标准的yuv4:2:2格式的数据,同时麦克风输入的数据经音频编解码器解码完成a/d转换。解码后的音频、视频数据随即传送给tm1300的音频、视频输入端品,tm1300将输入的数据分别按g.723.1和h.263协议编码,然后以h.223标准实现对音频、视频数据流复用,再按h.245规程将复用后的数据流经v.34或isdn通信端口发送至传输网,传送到远端b机。b机收到a机传送过来的数据后,先以h.223标准对音频、视频数据流解复用,然后分别完成基于g.723.1和h.263协议的音频、视频解码,再由音频、视频输出端口发送给音频、视频编码器,经编码转换后由喇叭、电视机输出。b机传送给a机的数据处理过程如此相同,这样通信的双方就实现了可视电话通信。

    2.2 外围芯片的选择

在本终端中,tm1300的主要外围芯片的选取情况如下:

①视频解码器。本方案选用了philips公司的saa7113,实现视频a/d变换,反混迭滤波,线性相位锁定,行、场同步信号检测,数字亮度分离等功能;能够将ntsc、pal或cvbs等模拟视频信号解码为符合ccir601/ccir656标准的yuv4:2:2格式的数字视频信号。

②视频编码器。选用philips公司的saa7121,将输入的数字yuv视频数据编码为ntsc、pal或cvbs等模拟视频信号输出。

③音频编解码器。选用philips公司的uda1344,该芯片将a/d和d/a转换功能集于一身,可以对麦克风输入的模拟声音信号进行a/d转换成为数字信号,形成串行数字音频流送到tm1300的音频输入口。同时,它也可将从vo输入的数字信号进行d/a转换成模拟立体声信号,然后输出至喇叭;

④sdram。选用三星公司的k4s641632e_ti/p75,其存储结构为1m×16bit×4banks,工作速度可达到133mhz,选用高速、大容量的sdram可为今后的系统升级提供方便;

⑤flash。用于存储主程度,它是一种高密度、高稳定性、低成本、可快速擦写的非易失性存储器。它与rom、eprom相比,提供了更高的性能,更大的灵活性;与sram、eeprom相比,它有更高的密度和更合理的价格。这里选择是amd公司的am29lv400bt芯片,它内部有32个128位可擦除块,存储容量为32m位,数据线可选择为8位或16位。

结语

由于实时多媒体数据处理算法比较复杂,运算量大,因此它对dsp的处理能力有很高的要求。tm1300运算能力可达6.5bops(每秒十亿次操作),具有良好的内部接口,灵活的外部接口和强大的多媒体处理能力,因而它完全可以满足多媒体数据处理实时性的要求。在选定了dsp之后,我们选择了它的外围芯片并进行了电路设计。但是由于实时多媒体数据处理算法比较复杂,运算量大,因此为获得更好的图像和语音质量,仅仅依赖硬件的高效是不够的,还需不断改进视频、音频数据处理的算法,同时对tm1300的程序代码进行优化。