访中银集团夏乐冰和廖杰远先生 1998年 第14期 02版   IBM近期在中国推出的VIA VOICE汉语语音识别系统,以零售、PC捆绑、征集二次开发伙伴等方式在中国国内“攻城掠地”。不久,福建中银国际实业有限公司也于年初正式向外界宣布推出能让电脑开口说话的软件——“天音话王”,并在BOC及LEAP2000系列电脑中进行了预装。“天音话王”与“VIA VOICE”,一个会说,一个会听。这两者之间有没有什么特殊的关联呢?为此,记者专程采访了福建中银集团总裁夏乐冰先生及负责开发“天音话王”的中银天音计算机有限公司总经理廖杰远先生。   记者:夏总,先请你简单介绍一下“天音话王”。   夏乐冰:“天音话王”的最大特点是可以让电脑开口说话,可以将任意汉字或拼音文本实时地转换为高自然度、高清晰度的语音输出;也可以将任意汉字文本转换为相应的拼音文本。由于运用了大量的人机工程学原理和汉语语言规则去控制输出语流的韵律特征,较好地实现了对汉语声、韵、调的控制,使合成语句避免了一般语音合成中出现“一字一蹦”的现象,使输出的合成语句清晰、自然。它可以广泛应用于文稿朗读、文稿有声校对、标准普通话学习、多媒体合成、多媒体教学等领域,也可应用于各类基于电话网的多媒体声讯服务,以及Internet网上的文语转换等。   记者:在IBM推出其具备语音识别功能的VIA VOICE之后不久,天音即推出了具备语音输出功能的“天音话王”。这一个说,一个听,是有意这样安排的呢还是一种无意的巧合?   夏乐冰:(笑)这当然不是什么有意的安排啦。语音合成和语音识别这两项技术已经日渐成熟,及时把它们推向市场是必然之举。至于两个产品在推出的时间上,可以算作是巧合吧。   记者:据闻IBM的VIA VOICE的开发历时十几年,且投资巨大,仅其在北京的实验室就投入资金达数千万元,请问廖总,作为与其份量相当,且技术类型也极为类似的“天音话王”,在研制开发过程中是否也耗费了巨资呢?   廖杰远:我们的开发经费十分有限,但我们把有限的科研费用都真正用在了刀刃上,我们的“天音话王”差不多搞了十年,如果经费充足的话,也许就不会要这么久的时间。   记者:夏总,请你给我们的读者简单介绍一下汉语语音合成技术研制开发的一些发展过程。   夏乐冰:国内的汉语语音合成技术研究从八十年代初就基本上与国际上研究同步发展,大致经历了共振峰合成、LPC合成至应用PSOLA技术的过程。近年来,汉语文语转换系统研究取得了令人瞩目的进展,如中国科学院声学所的KX-PSOLA、联想佳音、清华大学的TH-SPEECH、中国科技大学的KD-863等系统。“天音话王”就是源于KD-863。同时,我们在语音合成技术方面推出的产品除了现在的“天音话王”外,还将在近日推出一系列基于语音合成技术的产品。如:天音电话E-MAIL系统、天音智能电话信息系统等。   记者:大名鼎鼎的求伯君对管理软件企业尚有“一肚子苦水”,请问廖总,你在管理你的企业时有没有什么“苦水”?你们用较短的时间便开发出这套“天音话王”,有没有什么诀窍?   廖杰远:的确,搞软件非常辛苦,尤其是我们的民族软件业需要大力发展的时候。我们资金不如外国人雄厚,实力也不够强,在一些关键性技术方面也跟国外有一定的距离。这些就可以算是“苦水”了(笑)。我认为,搞软件除了技术、资金等以外,企业自身的体制也是相当重要的一点。在天音公司内部,就是真正把每个人的职责、工作范围及权限等作了严格的分配,让每个人都能完全发挥自己的才能。   记者:目前“天音话王”在走向市场的时候,是否面临着巨大的市场压力?   夏乐冰:市场压力倒是没什么感觉,因为我们的产品也跟VIA VOICE一样,在市场上几乎没有人和我们竞争,而且“天音话王”与VIA VOICE的市场方向也不一样,和IBM也就没有什么市场冲突。如果说有压力的话,我们的压力都集中在技术的后续开发上。虽然目前我们的技术处于领先地位,但太多的前车之鉴使我们不敢有丝毫的松懈。   记者:对于发展民族软件事业,夏总你个人有何看法?   夏乐冰:发展民族软件产业,还得靠我们中国人自己一起来努力。实际上,我们能真正完全掌握的计算机本土技术也只有汉字的输出、输入和汉语的输出、输入两大块,但即便是这么两大块,我们也已经丢失了不少的市场。让电脑能够开口说话和让电脑能够听话,是今后相当一段时期内电脑应用领域中一个主要发展趋势。IBM已经占据了语音识别这块领地,我们现在则要牢牢守住语音输出这片领地。所以我们现在的处境可以用“许胜不许败”来形容。业界人士都知道,在支持民族软件业的发展上,《电脑报》可谓是最好的表率了,我们国内这些搞软件的也确实需要一大批像《电脑报》这样热心为民族产业呐喊助威的有识之士的大力支持才行。   记者:请问语音合成技术的应用前景如何?   夏乐冰:可以肯定地说,语音合成技术有着相当重要的经济价值和广阔的应用市场。除了大家都已经知道的会“说话”的电脑外,还包括:针对各行各业的动态查询系统,即使用电话作为终端,从公共或专用的数据库中查询信息。在这个领域,我们还没有太强劲的对手;另外,语音合成技术还可以提供网络上的多媒体通信服务,比如有声电子邮件、文摘检索、网上教学等。其中值得一提的是中文电话E-MAIL系统。它用于邮局的E-MAIL服务器上,可以将中文E-MAIL的接收由现在的用电脑上网接收简化为用电话接收,由原来的被动查阅过渡到实时接收。“中文电话E-MAIL”系统的成功,完全有可能引导一场Internet中文通信方式的重大变革。毋庸置疑,语音合成技术将会日益趋向完善和成熟。   记者:前段时间BOC及LEAP2000系列电脑均预装的是“天音话王”的测试版,请问“天音话王”的正式版本何时推出?   夏乐冰:我们现在已经在加紧制作正式版本的产品包装盒及说明书等。估计很快就会将正式版展现在大家的面前。   记者:谢谢夏总能在百忙之中接受采访,最后请你给我们的读者朋友们讲几句吧。   夏乐冰:很高兴有这个机会通过《电脑报》来跟各位朋友进行交流,我们希望大家能对我们的“天音话王”及其它的产品多提些宝贵的意见和建议。最后还是那个不可不说的老话题:请大家多多支持我们的民族软件事业的发展。谢谢!