音声認識(読み)おんせいにんしき

ASCII.jpデジタル用語辞典の解説

音声認識

人間の音声コンピューターが自動的に認識すること。特定話者認識と呼ばれることもある。一般には、キーボードやマウスに代わる新しい操作方法として研究が行われ、実用化が進めんでいる。音声認識を行うアプリケーションとしては、IBMが開発したViaVoiceなどがある。

出典 ASCII.jpデジタル用語辞典ASCII.jpデジタル用語辞典について 情報

知恵蔵の解説

音声認識

人間の発音する音声をコンピューターで処理可能な情報として処理する技術。ロボットの耳に当たる。音声情報を音響モデルと単語辞典に基づいて語彙列に区分、認識エンジン(デコーダー)が意味のある情報に置き換える、という流れで認識を行う。現在は不特定話者の音声を無理なく聞き取る技術(dictation system)の開発が焦点になっている。

(築地達郎 龍谷大学准教授 / 2007年)

出典 (株)朝日新聞出版発行「知恵蔵」知恵蔵について 情報

デジタル大辞泉の解説

おんせい‐にんしき【音声認識】

speech recognition》人間の声などを、コンピューターに認識させること。音声の特徴から発声者を識別したり、話し言葉を文字列に変換したりする機能を指す。

出典 小学館デジタル大辞泉について 情報 | 凡例

百科事典マイペディアの解説

音声認識【おんせいにんしき】

人間が話した声を機械(コンピューター)が認識できるようにすること。例えば,〈はい〉〈いいえ〉といった音声の波形をデジタル化して登録しておき,マイクから入ってきた声の波形と比較して両者が一致していればコンピューターが動作するようにすれば,キーボードなどに代わって音声で命令を与えることができる。パーソナルコンピューター用の音声認識ボードも市販されている。北米ではすでに不特定の人間の音声指示により基本的な操作が可能になっている。
→関連項目人工知能

出典 株式会社平凡社百科事典マイペディアについて 情報

世界大百科事典 第2版の解説

おんせいにんしき【音声認識 speech recognition】

音声の意味内容や,音色に関する情報(発声者,性別,喜怒の感情など)を聞き分ける処理を音声認識という。従ってこれらの情報の機械による認識に限らず,人間の認識機能にも使われるが,最近は前者に限定されることが多い。機械による音声認識には,その意味情報を認識する(狭義の)音声認識と,音色情報の内で発声者がだれかを認識する話者認識とがある。前者では1952年に作られた数字音声の認識機械が最初で,アメリカのデービスK.H.Davisらによる。

出典 株式会社平凡社世界大百科事典 第2版について 情報

大辞林 第三版の解説

おんせいにんしき【音声認識】

コンピューターを用いて音声による指示を識別・判断すること。また、それにより電子機器を操作・制御すること。また、その技術。

出典 三省堂大辞林 第三版について 情報

ブリタニカ国際大百科事典 小項目事典の解説

音声認識
おんせいにんしき
speech recognition

マイクロホンで収音して得られた音声信号を解析することによって発話内容を出力する技術。音声信号に含まれると考えられる音素の音響的特徴を記述した音響モデル,認識しようとする言語に含まれる単語がどのような音素から構成されるかを記述した発音辞書,単語がどのようにつながって文となるかを記述した言語モデルなどを総合して,入力として与えられる音声信号に対して最も確からしい単語列を推定し,出力する。従来の音声認識では,音声信号の対数パワースペクトルのおおまかな形状(スペクトル包絡。→包絡線)を音響的特徴とし,音響モデルの構築に「隠れマルコフモデル」HMM; Hidden Markov Modelを用いて,音響的特徴の並びを確率的に記述した。また,発音辞書や言語モデルには確率正規文法が用いられてきた。これらのモデルのパラメータ(→媒介変数)は正解データの与えられる「教師あり学習」(→機械学習)で獲得する。自由に発話された文を対象とした大語彙連続音声認識システムでは,30~70種類の音素,1~100万個の語彙,2~5個程度の単語の並びの頻度を扱う。認識精度の向上のため,学習用データを用いたトレーニングを 100~1000時間程度行なう。ディープラーニングパターン認識の諸問題に広く適用されるようになった 2010年前後からは,音響モデルの構築にディープラーニングの手法が用いられて認識精度が高まり,一般消費者用の端末でもアップルのソフトウェア Siriなど,音声認識機能が広く使用されるようになった。(→計算機科学

出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報

世界大百科事典内の音声認識の言及

【音声情報処理】より

…これによって得られる特徴パラメーターをもとに,音声を合成したり認識・理解したりする。最近の技術の進展により,音声認識・理解の応用技術として音声ワープロや人と機械とが音声で対話がきるようになってきた。しかし,まだ機械の能力は人の能力に遠く及ばない。…

【協調分散システム】より

…(1)分散問題解決 分散問題解決は,疎に結合した(すなわち,通信にコストを要する)エージェントが協力して一つの問題を解くもので,結果共有,タスク共有という二つの問題解決モデルが提案されている。結果共有は,独立の見地に立つ複数のエージェントが問題の中間結果を持ち寄る協調の方式で,音声認識や分散センシングに応用された。これらの応用の特徴は,エージェントが収集可能なデータが不完全で,他のエージェントのデータと矛盾する可能性があることである。…

【入出力装置】より

…また,音声出力のためには,その逆の変換をしてスピーカーで出力する。しかし,このようにして人間の音声をディジタル量に変換しても,それをただちに言葉として理解することはできず,さらに音声認識,形態素解析,構文解析などの知的な変換が必要である。また,音声出力においても音声合成という知的な変換が必要である。…

※「音声認識」について言及している用語解説の一部を掲載しています。

出典|株式会社平凡社世界大百科事典 第2版について | 情報

今日のキーワード

多文化主義

マルチ・カルチュラリズムともいう。さまざまな人種,民族,階層がそれぞれの独自性を保ちながら,他者のそれも積極的に容認し共存していこうという考え方,立場。「人種のるつぼ」的な同化主義に対抗する考え方で,...

続きを読む

コトバンク for iPhone

コトバンク for Android

音声認識の関連情報