可控音视频流技术 1999年 第15期 34版 “可控音视频流技术”的核心主要由三部分构成: 1.高效的实时视频信号要在网上传输几乎是不可能的,一帧648×480的真彩图像为980Kb,若网络传输速度为500Kb/s(10M网较好的传输速度),则一帧图像的传输就要用2秒,显然这毫无实用价值。对图像进行压缩倒不难,问题是要处理好高压缩比和实时压缩耗时的矛盾。可控音视频流技术采用了一种高效快速的实时音视频压缩算法,有效地解决了这个问题。在800×600的屏幕上实现了每秒5帧图像的传输,基本满足了教育网的功能要求。 2.崭新的音视频数据流技术:在网上传输声音、图像,传统做法是将声音、图像文件从服务器传到客户机,再用客户机播放。就像先放满一桶水后,再从水桶放水一样。声音的实时传输用传统方法无法办到。我们的做法是当服务器接到客户机请求后立刻将设备(光驱、硬盘、声卡)上获取的数据送往客户机,当客户机收到数据就立刻播放,尔后边收数据边播放。就像流水一样,我们称它为音视频数据流。音视频数据流在传输过程中,根据客户端的接收情况还可自动调节速度(广播方式不采用这样方法),所以也称为可控音视频数据流。 3.独特的多路声音合成技术:利用音视频数据流技术可以解决两方的实时通话,但客户机间通话的语音信号若要第三方收听,则需要将这两路声音信号叠加合成后发往第三方。三方以上同时通话时这个算法的复杂程度就更大。独特的多路声音合成技术成功地解决了此难题,使网上的语音讲座、电话会议能得以实现。