翻訳|voiceprint
声の各周波数成分の時間的変化を機械を用いて視覚的に表示したもの。われわれは日常生活で,声をきいただけで,それがだれの声であるか判断できることをよく経験する。これは話し声にその人の特徴があらわれているからにほかならない。このことを応用して,たとえば犯人の割出しができるのではないかという考えは,すでに1930年代からあって,有名なリンドバーグ2世の誘拐事件の捜査で犯人の声を事件発生から3年後に証人に鑑定させたことが記録されている。
このような記憶を手掛りにした聴取り判定と別に,人間の声が音響信号の一種であり,その信号の性質,たとえば各周波数成分の強度などが時間軸上で複雑な変化を示すことから,もしある人の声をパターンとして表示できれば,ちょうど指紋のようにその人の特徴として目で見ることが可能となるのではないか,と考えられた。
1945年ごろアメリカで,このような音の性質を視覚的なパターンとして分析表示する器械,サウンドスペクトログラフが開発された。この器械は,音声信号のスペクトル分析を行って記録紙上に表示するもので,得られたパターンは横軸に時間,縦軸に周波数をとって各周波数成分の強さが濃淡で表される。このようなパターンを一般にサウンドスペクトログラムという。サウンドスペクトログラムには,そこに記録されたことばの音の性質が表示され,たとえば各種の母音や子音にそれぞれ特徴的なパターンを呈する。ここでいう各音の性質とは,発音する人は異なっても共通な要素であって,いわば個人性というものを除外した共通項である。しかし人が異なればことばの音に個人差が生ずるのも事実であるから,ある人のことばを視覚表示したサウンドスペクトログラムから話し手を認定できるのではないかと考えられ,個人の同定のために用いられる指紋fingerprintに対比させて,これを声紋と名づけ,犯罪捜査などに応用の可能性が検討された。当初はサウンドスペクトログラムのうちでも音の強さを等高線表示したものを,とくに声紋と呼んだが,現在ではこの種のパターン表示を総称して声紋という。
それでは実際に声紋によって個人が認定されるであろうか。犯罪捜査などでは,しゃべっている犯人がだれであるかを決めようとすることを話者識別という。声紋が話者識別に使えるかというテーマについては,とくにアメリカで多数の研究があり,1970年代に警察や法務省の援助のもとに大規模な検討が行われた。その結果,二つの声のサンプルを,同一人の声であると判定した場合にも,同一人のものでないと判定した場合にも,それぞれかなりの率で誤判断が入る余地のあることが示された。このような事実から,声紋の確実性は指紋と比べものにならないほど低く,アメリカ音響学会は,声紋による話者識別は信頼性の点で不十分であり,裁判の証拠として用いるには問題があると結論している。また他の研究では,話者識別を,視覚的なパターンすなわち声紋で行うよりも,もとの声を耳できいて行うほうが確実性が高いという結果を得ている。要するに,わざわざ目で見るパターンにするまでもないことが明らかにされた。
声紋という問題から離れて声による話者識別や話者照合(話者識別と逆に,記録されている既知の声に,どのサンプルの声が該当するか決めること)は,将来応用性のある分野で,声による銀行口座からの引出しなどについての研究が現在も進められている。
→声
執筆者:廣瀬 肇
出典 株式会社平凡社「改訂新版 世界大百科事典」改訂新版 世界大百科事典について 情報
個人的な声の特徴を機械によって分析し、模様化したものをいう。音声の生成過程は、呼気、発声、調音の3種類がおもな生理的要素となっている。すなわち、呼気運動で生じた呼気流は左右の声帯を振動させ、音波(声帯音源)を生じ、これが調音器官(口蓋(こうがい)、上下顎(がく)、舌、唇、鼻中隔など)によって形成された咽頭(いんとう)、口腔(こうくう)、鼻腔(一括して声道という)を通過することによって共鳴的特性をもった言語音声となる。この言語音声は声帯振動、声道、発話運動などの個人差によって個人的特徴が生ずる。一般に声紋というときは、サウンドスペクトログラム(ソナグラフ)で分析した結果をいう。サウンドスペクトログラムには分析フィルターによって、広帯域(300ヘルツ)と狭帯域(45ヘルツ)の2種類のパターンがある。広帯域フィルターでは、音声のフォルマント周波数(フォルマントとは、周波数分析によって得られるエネルギーの強い部分。周波数の低いほうから順次、第一フォルマント、第二フォルマントとよぶ)、およびフォルマント帯域幅など、声道に関連する変化のようすをみることができる。声道の個人的特徴は、おもに高次フォルマント(第三、第四フォルマント以上)の構造、およびフォルマント帯域幅などに現れてくる。一方、狭帯域フィルターでは、母音などの声帯振動の基本周波数(ピッチ周波数)の調和構造をみることができ、声帯音源に関連する変化が観察される。声帯音源の個人的特徴は、平均の基本周波数、基本周波数の規則的変化、および振動波形の違いとして現れる。
声紋の識別において、親子、兄弟、姉妹、双生児などの声紋は類似している。これは発声、調音器官の固有の長さ、大きさ、運動などが類似しているためである。大人と子供、男と女などの声の違いも、発声・調音器官が主要な相違の原因である。一般に女性の声は、男性の声に比較してピッチ(音の高低)が高く、その分析は男性の声よりも困難であるとされているが、高いピッチをもった音声は500ヘルツの帯域フィルターを用いるとよい分析結果が得られる。また、同一の話者が音の高さ、強さなどを変えた場合、音声の波形は変化するが、全体の変わり方は、ほぼ変えない場合と類似した規則性を示す。さらに修飾発声(鼻つまみ、マスクかけなどをした発声)をしても、母音のフォルマントには影響がないことなどが知られている。
犯罪捜査上での個人識別では、電話回線を通した声の識別が多く、その録音には電話の音声以外の雑音を除去できるように、ローゼットからコンデンサーを介して直接録音する方法、カプラーを用いて受話器から録音する方法、電話ピックアップコイルを用いて録音する方法、電話専用録音機を用いて録音する方法などがある。このようにして録音した資料を基に、声紋の個人識別を行っている。声紋の個人的特徴を識別するには、聴取試験、声紋採取、声紋比較などを行い、両者の声紋の再現性、特異的な位置の一致などが数多く存在すれば、両者の音声は同一人の音声と判断される。声紋の個人識別はかなり高い確率で識別可能である。なお、最近ではコンピュータを用いた自動話者識別の研究が広く行われ、自動的に話者の識別を行った例も報告されている。
[杉江秀明]
出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報
出典 株式会社平凡社百科事典マイペディアについて 情報
年齢を問わず、多様なキャリア形成で活躍する働き方。企業には専門人材の育成支援やリスキリング(学び直し)の機会提供、女性活躍推進や従業員と役員の接点拡大などが求められる。人材の確保につながり、従業員を...
10/29 小学館の図鑑NEO[新版]動物を追加
10/22 デジタル大辞泉を更新
10/22 デジタル大辞泉プラスを更新
10/1 共同通信ニュース用語解説を追加
9/20 日本大百科全書(ニッポニカ)を更新