日本大百科全書(ニッポニカ) 「音声合成装置」の意味・わかりやすい解説
音声合成装置
おんせいごうせいそうち
主情報処理装置からの指令によって、指定された情報を音声波形としてつくりだす(出力する)装置。音声の生成を、音源の生成と調音作用(口の形を変えることによって音源に音韻の特徴を付与する働き)とに分け、音源をパルス列と雑音で、調音作用を特性が時間的に変わるフィルターで近似することを基本的原理とする。
音声を合成するには、人間の声を分析して情報要素を取り出し、それから逆に音声波形を再現する分析合成法と、文字情報だけから人間の音声を使わずに任意の音声波形をつくりだす規則合成法とがある。現在実用化されているのは前者であるが、将来は後者のほうが重要と考えられ、その実現によって、目の見えない人のための音読機とか、口のきけない人のための意志表現手段や発音付きの電子辞書などが可能になる。現在音声合成の主流となっているのはPARCOR(パーコル)方式(偏自己相関方式といい、partial autocorrelation systemの略称)で、この方式は日本の電信電話公社電気通信研究所の板倉文忠(ふみただ)と斎藤収三が共同で発明開発したものである。
その原理は、PARCOR係数k(k1からkpまでのp個)が合成フィルターの特性を決めており、これらを10~20ミリ秒に1回ずつ新しく与えることによって連続的な音声が合成される。この方式によれば、1秒間の音声波形を合成するのに必要な情報の量は2.4キロビット以下となる。これは原音声波形をそのままデジタル化して記憶するのに必要な情報量の20分の1~30分の1である。音声合成装置の最近の話題は、装置がLSI化(高集積回路化)されて小型小電力となり、マイクロコンピュータと組んで自由に使えるようになったことである。その結果、家電品や教育機器、ゲームや玩具(がんぐ)にまで使われるようになった。自動車に積まれ、速度の出しすぎやガソリンの欠乏を音声で警告したり、電子レジスターの入力を音声で復唱したりするのがよく知られている。
[中田和男]