可控音视频流技术

 
1999年 第15期 34版

    “可控音视频流技术”的核心主要由三部分构成：
    1.高效的实时视频信号要在网上传输几乎是不可能的，一帧648×480的真彩图像为980Kb，若网络传输速度为500Kb/s（10M网较好的传输速度），则一帧图像的传输就要用2秒，显然这毫无实用价值。对图像进行压缩倒不难，问题是要处理好高压缩比和实时压缩耗时的矛盾。可控音视频流技术采用了一种高效快速的实时音视频压缩算法，有效地解决了这个问题。在800×600的屏幕上实现了每秒5帧图像的传输，基本满足了教育网的功能要求。
    2.崭新的音视频数据流技术：在网上传输声音、图像，传统做法是将声音、图像文件从服务器传到客户机，再用客户机播放。就像先放满一桶水后，再从水桶放水一样。声音的实时传输用传统方法无法办到。我们的做法是当服务器接到客户机请求后立刻将设备（光驱、硬盘、声卡）上获取的数据送往客户机，当客户机收到数据就立刻播放，尔后边收数据边播放。就像流水一样，我们称它为音视频数据流。音视频数据流在传输过程中，根据客户端的接收情况还可自动调节速度（广播方式不采用这样方法），所以也称为可控音视频数据流。
    3.独特的多路声音合成技术：利用音视频数据流技术可以解决两方的实时通话，但客户机间通话的语音信号若要第三方收听，则需要将这两路声音信号叠加合成后发往第三方。三方以上同时通话时这个算法的复杂程度就更大。独特的多路声音合成技术成功地解决了此难题，使网上的语音讲座、电话会议能得以实现。


 