基于TM1300的可视电话终端研究_通信网络论文

摘要：简要介绍philips公司的多媒体数字信号处理器tm1300，重点阐述以tm1300为核心实现可视电话终端的一种方案。本方案按照itu-t制订的h.324系列标准建议，对输入音频和视频信息分别进行了基于g.723.1协议和h.263标准的信源编码，然后，根据分组复用h.223标准和通信控制规程h.245标准在pstn上进行传输。

关键词：tm1300 h.324 g.723.1 h.263

引言

1996年itu-t制订了在pstn上传输多媒体信息的h.324系列标准建议，主要包括视频编解码（video codec）h.263标准、信息流分组复用（multiplex）h.223标准、通信控制规程（control）h.245标准、低码率语音编码（speech codec）g.723.1标准以及调制解调器（modem） v.34bis标准等。其中g.723.1协议可将64kb/s的pcm语音信号压缩至6.3kb/s甚至5.3kb/s，h.263协议可将视频信息压缩到20kb/s左右；因此，压缩后的语音和图像信号的码速率低于28.8kb/s，而v34调制解调器已实现了pstn上的33.6kb/s码速率的传输。这样，就可以在普通模拟电话网络（pstn）上利用v.34调制解调器实现实时传输多媒体。

h.324终端可以有两种实现形式：基于pc机支持的可视电话终端和无需pc机支持的“独立式”可视电话终端。前者需要pc机、摄像头、视频捕获卡、内置或外置modem；后者需要将显示器、摄像头、普通电话集成一体，形成一独立的小型可视电话终端。本文介绍的可视电话终端属于后者。它是以philips公司的tm1300多媒体dsp为核心来实现的，主要包括话音和图像的采集、编解码、显示、回放，码流复用及通信控制等功能模块。

1 tm1300处理器简介

tm1300是philips公司于1997年以来推出的系列多媒体dsp trimedia的最新一款性能优良的多媒体处理芯片。它以多媒体处理和通信功能为主，融合了cpu芯片原有的计算功能，已广泛应用于多媒体专用设备、家电及宽带通信设备。tm1300结构框图如图1所示。

tm1300特别针对数字视频和音频应用进行了结构优化，集成视频输入、输出接口，音频输入、输出接口以及通信线路接口等围设备。其核心32位的处理器，能够进行32位的线性寻址，寻址能力可达到4gb；同时，它含有128个通用寄存器，这些寄存器不像其它dsp的寄存器那样分段，所有的操作都可以使用这些寄存器，其核心处理器采用的是vliw（very long instruction word）超长指令字结构，可以在每一个时钟周期内同时进行5个操作。vliw结构还可以减少处理器的工作量，核心cpu的运行由实时操作系统内核进行控制。相互独立的多媒体输入、输出单元可以接收和输出格式化数据。tm1300提供4个通用的定时器，其中三个可被编程用来产生cpu时钟周期、数据/指令断点、cache跟踪、音频/视频时钟等等。其spdif输出单元可输出高速的串行数据流，主要应用于向外部音频设备输出spdif格式的数字音频数据。由于数据流内容完全由软件控制，因此，spdif输出单元也可用作通用的高速输出设备，如uart。tm1300内部有专用的16kb的数据高速缓存和32kb的指令高速缓存，并且数据高速缓存是双端口的，允许同时进行双向访问。此外，tm1300还带有一些专用的协处理器和专用的多媒体指令，其内部和功能单元之间通过一个高性能的总线和存储系统进行通信，开发者可以充分利用tm1300硬件体系结构的特性，提高视频、音频编解码算法的运算速度。变长解码协处理器（vld coprocessor）可以完成h.261、h.263、mpeg-1、mpeg-2和mpeg-4码流的哈夫曼解码；图像协处理器icp（image coprocessor）可以在不需cpu参与的情况下对图像进行缩放和滤波处理。

多媒体应用要求系统资源和活动得到高效的管理，tm1300处理器支持psoc实时多任务操作系统内核，psos操作系统由美国isi（integrated system inc）公司开发。它基于开放式操作系统标准，并且针对多媒体应用作了专门的优化。psos真正实现了抢先式、基于优先级的任务调度及合理的中断处理。内核保证在任务时刻，正在运行的任务在所有准备好的任务中具有最高的优先级，更高优先级的外部事件可以抢先改变调度的行为，通过改变抢先特性，或调度任务时间片，用户可以改变调度的行为。psos还具有以下特点：动态的、基于对象的多任务及动态的存储分析；灵活的计时管理和时钟服务；先进的错误处理和故障恢复等。psos操作系统在内核层将与硬件有关的操作放在一个模块中，对系统服务层以上则屏蔽了具体的硬件特性。

2 可视电话终端构成与工作原理

2.1 系统框图和工作原理

图2是基于tm1300的“独立式”可视电话终端的基本框图。图2右边的的eeprom、flash存储器和sdram可分别看作pc中的bios、harddisk（硬盘）和ram（内存），v.34/isdn为通信端口。在给终端加电后，tm1300首先从eeprom中读取系统启动的一些重要信息，例如cpu工作的时钟频率，外围sdram的大小等。然后cpu从eeprom中把启动程序读入sdram，再由启动程序把flash memory中的主程序读入sdram并开始执行。图2左边的视频输入/输出（vi/vo）单元和音频输入/输出（ai/ao）单元功能描述如下：

（1）视频输入/输出单元（video in/video out）

视频输入单元接收符合ccir601/ccir656标准的yuv 4：2：2格式的数据。数据在输入后先被拆分成独立的y、u、v数据，然后送入sdram中。另外，可根据需要对输入的视频数据进行水平方向的亚采样。视频输出单元输出符合ccir601/ccir656格式的视频数据，它还可对输出的数据进行内插，以使亚采样后的数据恢复为640点/行或720点/行。

（2）音频输入/输出单元（audio in/audio out）

音频输入/输出单元分别与串行的adc（模数转换）、dac（数模转换）芯片相连，采样时钟受tm1300控制，采样频率可从直流到100khz。输入输出的数据可是8位或16位的串行单声道立体声数据。

本终端工作过程简述如下：首先，本地a机摄像头输入数据，经视频解码器解码转换为符号ccir601/ccir656标准的yuv4：2：2格式的数据，同时麦克风输入的数据经音频编解码器解码完成a/d转换。解码后的音频、视频数据随即传送给tm1300的音频、视频输入端品，tm1300将输入的数据分别按g.723.1和h.263协议编码，然后以h.223标准实现对音频、视频数据流复用，再按h.245规程将复用后的数据流经v.34或isdn通信端口发送至传输网，传送到远端b机。b机收到a机传送过来的数据后，先以h.223标准对音频、视频数据流解复用，然后分别完成基于g.723.1和h.263协议的音频、视频解码，再由音频、视频输出端口发送给音频、视频编码器，经编码转换后由喇叭、电视机输出。b机传送给a机的数据处理过程如此相同，这样通信的双方就实现了可视电话通信。

2.2 外围芯片的选择

在本终端中，tm1300的主要外围芯片的选取情况如下：

①视频解码器。本方案选用了philips公司的saa7113，实现视频a/d变换，反混迭滤波，线性相位锁定，行、场同步信号检测，数字亮度分离等功能；能够将ntsc、pal或cvbs等模拟视频信号解码为符合ccir601/ccir656标准的yuv4：2：2格式的数字视频信号。

②视频编码器。选用philips公司的saa7121，将输入的数字yuv视频数据编码为ntsc、pal或cvbs等模拟视频信号输出。

③音频编解码器。选用philips公司的uda1344，该芯片将a/d和d/a转换功能集于一身，可以对麦克风输入的模拟声音信号进行a/d转换成为数字信号，形成串行数字音频流送到tm1300的音频输入口。同时，它也可将从vo输入的数字信号进行d/a转换成模拟立体声信号，然后输出至喇叭；

④sdram。选用三星公司的k4s641632e_ti/p75，其存储结构为1m×16bit×4banks，工作速度可达到133mhz，选用高速、大容量的sdram可为今后的系统升级提供方便；

⑤flash。用于存储主程度，它是一种高密度、高稳定性、低成本、可快速擦写的非易失性存储器。它与rom、eprom相比，提供了更高的性能，更大的灵活性；与sram、eeprom相比，它有更高的密度和更合理的价格。这里选择是amd公司的am29lv400bt芯片，它内部有32个128位可擦除块，存储容量为32m位，数据线可选择为8位或16位。

结语

由于实时多媒体数据处理算法比较复杂，运算量大，因此它对dsp的处理能力有很高的要求。tm1300运算能力可达6.5bops（每秒十亿次操作），具有良好的内部接口，灵活的外部接口和强大的多媒体处理能力，因而它完全可以满足多媒体数据处理实时性的要求。在选定了dsp之后，我们选择了它的外围芯片并进行了电路设计。但是由于实时多媒体数据处理算法比较复杂，运算量大，因此为获得更好的图像和语音质量，仅仅依赖硬件的高效是不够的，还需不断改进视频、音频数据处理的算法，同时对tm1300的程序代码进行优化。

主页 > 实用文摘 > 教育文摘_09 > > 详细内容

基于TM1300的可视电话终端研究_通信网络论文