摘要本文首先详细阐述了视频通信技术的发展状况,包括承载网、框架协议和编解码技术,然后简单介绍了基于IP网络的H.323视频通信体系结构,并对视频通信技术的应用现状和发展前景进行了分析。
1、引言
随着现代通信技术和业务的发展,人们对通信的需求已经由最初的单一语音需求转变为对视频和音频的通信需求,以传送语音、数据、视频为一体的视频通信业务成为通信领域发展的热点,以点到点或多点视音频通信为主要形式的视频会议、远程医疗、远程教育等服务得到越来越多的使用。
2、视频通信技术的发展状况
(1)承载网
视频通信业务可以承载在不同技术的底层网络上,从早期的公共电话网,到窄带ISDN,DDN,ATM以及现在广泛使用的IP网络都可以成为视频通信业务的承载网。由于视频通信的实时性和图像传输的特点,要求承载网具备足够的带宽、短时延、低误码率等特点。
公共电话网。窄带ISDN和DDN是基于电路交换的网络,电路交换网络是面向连接的网络,传输速率和时延稳定,端到端时延小,误码率低,因此视频通信质量容易得到保证。但它的缺点是连接固定,除公共电话网、ISDN网上是可以进行拔号外,其他网络的应用都必须进行点对点的永久连接,带宽利用率较低,开放性很差,设置连接不方便。H.320标准就是1990年ITU-T最早制定的满足和适应这类电路交换网络的视频通信框架协议,最早进行商用的视频通信系统就是建立在此基础上的。在公共电话网中是采用话带数据来传递视频信息的,遵循的标准是1995年以来ITU-T推出的H.324系列,目前主要应用于可视电话业务。
ATM以快速分组交换和统计时分复用的方式进行信息传输。由于其技术复杂、设备昂贵,加上ATM的各项标准制定迟缓,未能得到大规模的应用,目前ATM网络已经不可能实现端到端的应用,而是成为一种支持多种应用的传送平台。ITU-T的H.321标准和H.310标准正是针对ATM网络结构的视频通信标准和规范。
近几年来,通信网络的IP化成为网络发展的主流,基于IP网络的视频通信得到普遍应用和广泛发展。IP网络是使用TCP/IP协议的面向无连接的网络,H.323标准是ITU-T在1996年制定的应用于IP网络的视频通信标准,称为“不保证服务质量的局域网上的多媒体视听系统”,并在1998年扩展为“基于分组的多媒体通信系统”,即ITU-TH.323v2,后来又推出了H.323v3还和H.323v4版本,它是目前拥有大量商业用户的视频通信标准,并受到世界各国的广泛重视。
(2)视频通信的框架协议
随着通信网络技术的不断发展,视频通信系统的承载网从电路交换网向灵活、扩展性强的IP网络演进,视频通信的框架协议因此产生了H.320,H.324,H.310和H.323四种标准,目前基于H.323的视频通信系统应用占市场的主导地位。
H.320是一个系列标准,传输速率在64kbit/s-2Mbit/s之间,它的主要组成部分为H.221提供把音频、视频、数据和控制信息复用进单个比特流的标准,使用时分复用(TDM)系统,帧长为10ms。H.230/H.242提供用于方式命令和指示以及功能交换的标准。H.261提供用于视频编码的标准。H.263是一个新的可选方式,能提供更好的图像质量。G.721提供用于音频编码标准。G.722和G.728是可选的代替方式。除了视频和音频信道外,在需要时可以传送数据。例如T.120会议。
基于H.324的可视电话系统运行于公众电话网(PSTN)之上,传输速率为28.8-64kbit/s,可提供语音、图像和其他数据的实时通信。H.324是一个系列协议,包括V.34调制解调器协议、H.223数据复接和分路协议、H.245系统控制协议、G.723.1语音算法、H.261和H.263图像算法。
H.323标准涵盖了音频、视频及数据在以IP包为基础的网络(LAN,EXTRANET和Internet)上的通信,H.323V2标准的分层结构主要包括:H.225.O标准的分组和同步,H.26l和H.263标准的视频编解码,G.711,G.722,G.728,G.723等标准的音频编解码,以及有关通信控制协议H.245等,另外,T.120标准为H.323终端增加和扩展了数据会议的功能,实现了诸如多点电子白板(T.126)、多点文件传输(T.127)、多点应用共享(T.128)等数据会议功能。
(3)视频通信的编解码技术
视音频的编解码技术是视频通信中的关键技术。1988年ITU-T颁布了H.261建议草案,该建议以混合编码为核心,以后制定出一系列的视频编码标准,如ITU-T的H.262.H.263.ISO的MPEG-1,MPEG-2等。
H.261是最早的运动图像压缩标准,是ITU-T为IS-DN开展可视电话、视频会议而制定的,速率为64kbit/s的整数倍。它详细制定了视频编码的各个部分,包括运动补偿的帧间预测、DCT变换、量化、熵编码以及与固定速率的信道相适配的速率控制等部分。H.261只对CIF和QCIF两种图像格式进行处理,每帧图像分成图像层、宏块组(GOB)层、宏块(MB)层、块(Block)层来处理。
H.263是国际电联ITU-T的一个标准草案,是为低码流视频编码而设计的。随后出现的第二版(H.263+)及H.263++增加了许多选项,使其具有更广泛的适用性。H.263的编码算法与H.261相比做了一些改善和改变,以提高性能和纠错能力。1998年IUT-T推出的H.263+是H.263建议的第2版,它提供了12个新的可协商模式和其他特征,进一步提高了压缩编码性能。另外,H.263+对H.263中的不受限运动矢量模式进行了改进,加上12个新增的可选模式,不仅提高了编码性能,而且增强了应用的灵活性。H.263已经基本上取代了H.261。H263++在H263+基础上增加了3个选项,这3个选项为:选项U、选项V和选项W,主要是为了增强码流在恶劣信道上的抗误码性能,同时为了提高增强编码效率。
MPEG是活动图像专家组(Moving Picture Exports Group)的缩写,于1988年成立,是为数字视/音频制定压缩标准的专家组,目前已提出MPEG-1,MPEG-2,MPEG-4等标准。MPEG-1标准于1993年8月公布,用于传输1.5Mbit/s数据传输率的数字存储媒体运动图像及其伴音的编码。该标准包括五个部分:第一部分说明了如何根据第二部分(视频)以及第三部分(音频)的规定,对音频和视频进行复合编码。第四部分说明了检验解码器或编码器的输出比特流符合前三部分规定的过程。第五部分是一个用完整的C语言实现的编码和解码器。MPEG组织于1994年推出MPEG-2压缩标准,以实现视/音频服务与应用互操作的可能性。MPEG-2标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定,MPEG-2在系统和传送方面作了更加详细的规定和进一步的完善,特别适用于广播级的数字电视的编码和传送,被认定为SDTV和HDTV的编码标准。运动图像专家组MPEG于1999年2月正式公布了MPEG-4(ISO/IEC14496)标准第一版本。同年年底推出了MPEG-4第二版,且于2000年年初正式成为国际标准。MPEG-4与MPEG-1和MPEG-2有很大的不同,MPEG-4不只是具体压缩算法,它是针对数字电视、交互式绘图应用(影音合成内容)、交互式多媒体(WWW、资料撷取与分散)等整合及压缩技术的需求而制定的国际标准。MPEG-4标准将众多的多媒体应用集成于一个完整的框架内,旨在为多媒体通信及应用环境提供标准的算法及工具。
H.264/AVC是目前由ITU-T的视频编码专家组(VCEG)及ISO/IEC的活动图像专家组(MPEG)大力发展研究的、适应于低码率传输的新一代压缩视频标准。2003年3月由两个专家组组成的联合视频专家组(JVT)公布了这一压缩视频标准的最终草案,此标准被称为ITU-T的H.264协议或ISO/IEC的MPEG-4的高级视频编码部分。H.264的编解码框架与以前提出的标准,如H.261、H.263及MPEG-1/2/4并无显著变化,也是基于混合编码的方案:整个系统被划分为视频编码层和网络抽象层。视频编码层主要描述要传输的视频数据所承载的视频内容。而网络抽象层则是考虑不同的应用,如视频会议通信、H.32X连续包的视频传输或RTP/UDP/IP的通信。H.264不仅比H.263和MPEG-4节约了50%的码率,而且对网络传输具有更好的支持功能,它引入了面向IP包的编码机制,有利于网络中的分组传输,支持网络中视频的流媒体传输。H.264具有较强的抗误码特性,可适应丢包率高、干扰严重的无线信道中的视频传输,支持不同网络资源下的分级编码传输,从而获得平稳的图像质量。
3、基于IP网络的H.323视频通信体系结构
根据H.323建议,IP视频通信系统由终端、网关、网守、IP网络以及多点控制器组成(见图1)。终端是提供单工或双工实时通信的客户端,需支持信令和控制功能,编解码功能等。网关用于实现与非H.323终端的连接。网守执行地址翻译、呼叫控制与管理、带宽控制与管理、域管理等功能。多点控制器用于支持三点或多点之间的用户会话,由多点控制器(MC)和多点处理器(MP)组成,MC确定所有终端的音视频处理能力并控制资源,MP混合、交换和处理音频、视频和数据流。 (图片)
图1基于IP网络的H.323视频通信体系结构 4、视频通信技术的应用现状
2003年SARS的爆发促进了中国视频通信业的迅速发展,各大运营商纷纷加大力度投资建设视频通信网络。目前中国电信、中国联通、中国铁通和中国网通都已经建立了商用的视频通信运营网络,其中中国电信和中国联通的网络规模较大,并且拥有大部分的用户数量。
1994年中国电信建成国内第一个会议电视党政专网,采用点对点结构的非标准视频网络,容量较小,没有采用多点控制设备(MCU)。这种点对点的网络结构简单,单个设备的故障不影响其他点,系统稳定性高。其缺点是成本高,操作复杂。1996年建成全国公众会议电视网,这个网络采用了多点控制设备的两级级联技术,以北京MCU为中心点,八大区各设一台MCU为二级中心点,各省终端通过2M专线电路接入本大区的MCU。随着视讯技术的发展和通信市场的变化,中国电信又先后于2002年和2003年建成供集团公司内部使用的2M和8M高清晰会议电视网,8M高清晰会议电视应用了MPEG-2编解码技术。2002年,中国电信推出了定位于市场中低端用户的“新视通”业务,系统兼顾了H.320和H.323协议。支持数字专线、ISDN/LAN/ADSL以及其他多种接入方式。支持接入的终端包括H.320终端、H.323终端、H.320/H.320一体化终端,为用户提供全方位、多样化的服务。
中国联通“宝视通”视讯网是基于中国联通数据综合业务承载平台,采用基于IP技术的H.323技术体制,用户可通过专线或宽带互联网接入到联通宽带视讯网使用该业务。全网采用多级GK组网,交换容量大,全网支持15000个点对点可视电话呼叫,支持同时召开600个多方会议以上,单个会议最大支持300方,全网视讯交换设备(MCU)互为备份。
5、视频通信技术的发展前景
中国的视频通信业发展已经有10年的发展历程了。过去视频通信的用户主要是政府部门,直到近期,由于运营商视频网络的建设和投入,很多的企业用户开始参与进来。但网络兼容互通、QoS、业务模式等问题影响视频通信快速发展。由于视频通信协议不断地发展,存在着支持不同协议的产品和网络,这些产品和网络之间的兼容互通都需要解决。另外,视频通信设备功能还需完善,基于IP的H.323视讯网络在技术标准和协议方面,对服务质量保证还做得不够。关于业务模式主要存在着业务模型和市场定位不清晰的问题,在资费、计费和结算方面不够完善和灵活。
目前,由于网络的发展、个人收入的增加,以及人们消费观念转变等诸因素的影响,我国在教育、医疗、金融、政府、企业等各行业中出现了对视频通信业务的巨大需求。随着视频通信向着开放性、综合化、普及化、移动化、个人化发展,“贵族化”的视频通信业务将逐步进入家庭,进一步走向大众化,使交互式的视频通信业务如同上网和打电话一样方便。
2/21/2006
|