音声認識装置(読み)おんせいにんしきそうち

日本大百科全書(ニッポニカ) 「音声認識装置」の意味・わかりやすい解説

音声認識装置
おんせいにんしきそうち

人間の音声を機械によって自動認識する装置。たとえば、「0」から「9」までの数字音声を認識して計算機にデータを入力する装置とか、荷物の荷札に書かれた送り先地名を読み上げる音声を認識して、荷物を宛先(あてさき)別に仕分けする装置などがある。 人間の音声波形には、音声の言語としての内容のほかに、性別、年齢、話す人の発音の個性といった、さまざまな情報が含まれている。そのため、機械による認識は簡単ではない。

 現在主流となっている技術では、以下のような方法で個性をも含めた音声を再現する。まず、音声波形から導かれるスペクトル情報(パターン)を分類しておき、それらを組み合わせて単語短文の音声を表現する。しかるのち、各パターンに対応するサンプル音声によって、音声を推定する。同じことばでも、状況によって話し方が変わるし、ことばの組合せが変化する。しかも人ごとに変化のパターンが違う。このサンプルの取り方が緻密(ちみつ)であればあるほど、特定の個人の限定された語彙(ごい)だけではなく、音声の認識を可能にする。この方法は、サンプル音声の集め方がむずかしいが、うまく集めれば音声認識そのものは高速であり、かつ実用的である。

[中田和男]

出典 小学館 日本大百科全書(ニッポニカ)日本大百科全書(ニッポニカ)について 情報 | 凡例

今日のキーワード

焦土作戦

敵対的買収に対する防衛策のひとつ。買収対象となった企業が、重要な資産や事業部門を手放し、買収者にとっての成果を事前に減じ、魅力を失わせる方法である。侵入してきた外敵に武器や食料を与えないように、事前に...

焦土作戦の用語解説を読む

コトバンク for iPhone

コトバンク for Android