聴覚(読み)ちょうかく(英語表記)audition

翻訳|audition

ブリタニカ国際大百科事典 小項目事典の解説

聴覚
ちょうかく
audition

ある範囲内の周波数の音波鼓膜に作用し,その興奮が聴神経を経て大脳皮質聴覚中枢に伝えられることによって生じる感覚をいう。音波が耳に入ると鼓膜の振動が起る。この振動は中耳を経て内耳蝸牛にある基底板および有毛細胞に伝わり,有毛細胞が興奮する。この興奮により聴神経にインパルスが送られる。人間が音として聞きうる音波は,通常 20Hzから2万 Hzの範囲内であるが,年齢や性別などによる個人差が著しい。

出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報

百科事典マイペディアの解説

聴覚【ちょうかく】

音波に対する感覚。主として昆虫,脊椎動物に発達。昆虫には聴覚器官としての鼓膜器官が発達する。人間では外耳から入った音波は鼓膜,耳小骨を振動させ,内耳のリンパ,さらに基底膜を介してコルチ器の有毛細胞を興奮させ,これによって生じた蝸牛(かぎゅう)神経の神経興奮が中枢に伝わり聴覚が生起する。聴覚により音の三要素(高さ,大きさ,音色)が識別されるが,そのうち最も特徴的なのは高さの知覚(いいかえれば聴覚器官の音波周波数分析機能)で,これを説明するためヘルムホルツの共鳴説(1863年)をはじめ多数の聴覚理論が提出され,現在最も有力なのはG.vonベケシーの基底膜進行波説である。また両耳に感じる音の強さや到着時間の差から音源の方向,距離をある程度認知できるが,視覚に比べはるかに劣る。
→関連項目人工内耳内耳

出典 株式会社平凡社百科事典マイペディアについて 情報

世界大百科事典 第2版の解説

ちょうかく【聴覚 audition】

ある範囲の周波数の音の刺激によって生じる感覚で,視覚が利用できない暗やみや森林,草むらの中で生活する動物にとっては,遠く離れた周囲の状況を知るのに重要な感覚である。例えば動物は,迫ってくる危険を避けたり,種内の交信,雌雄の求愛,交尾などに聴覚を利用する。 聴覚が発達した動物の一つに昆虫が挙げられる。昆虫のうち,直翅(ちよくし)類のキリギリスコオロギ,バッタやセミ類のように発音する昆虫では,同種個体間の交信に聴覚が用いられるが,ヤガカゲロウなどでは,コウモリから逃れるためにコウモリの出す音を聞き分けている。

出典 株式会社平凡社世界大百科事典 第2版について 情報

大辞林 第三版の解説

ちょうかく【聴覚】

音を感じる感覚。昆虫類と脊椎動物にみられ、後者のうち鳥類・哺乳類では、音波が鼓膜を振動させることに始まり、内耳の渦巻管に達することで生じる。

出典 三省堂大辞林 第三版について 情報

日本大百科全書(ニッポニカ)の解説

聴覚
ちょうかく

聴覚は音響刺激によっておこる感覚であって、音響を媒介として、身体より隔たったところのできごとを認知することができる。音響は空気の疎密波であり、外耳、中耳はこの音波を内耳に伝導するための装置である。普通、音波は外耳、中耳を経て内耳に達する(これを空気伝導という)。これに対し、空気の振動が頭蓋骨(とうがいこつ)を経て直接内耳に伝えられるのを骨伝導(こつでんどう)という。聴覚の受容器は、内耳の蝸牛(かぎゅう)にある聴細胞である。[市岡正道]

聴覚系を構成する諸器官

(1)耳介・外耳道 俗に耳ともよばれる耳介は、音波を集める働きをしている。また、外耳道は耳介と鼓膜との間にある空間で、音波の強さを減ずることなく、それを鼓膜に伝える。ウマ、イヌ、ネコなどでは、音波刺激によって反射的に耳介を音源の方向に向ける。これをプライヤーの反射〔ドイツの生理学者・心理学者W. T. Preyer(1841―97)にちなむ〕という。
(2)鼓膜 鼓膜は中耳側にくぼんで張られた漏斗(ろうと)状の膜(厚さ約0.1ミリメートル)である。形状は不整な円形をなし、その緊張も不均一である。さらに中耳側にはツチ骨柄が付着している。こうした形状のため、鼓膜は固有振動数をもたない膜として、広い範囲の振動数の外来音波に対して均等に共振できることとなる。
(3)耳小骨 鼓膜の内方には3個の耳小骨(ツチ骨、キヌタ骨、アブミ骨)が関節で連結し、全体として一つの角槓杆(かくこうかん)をなしている。鼓膜の振動は、耳小骨によって、音圧が約20倍に増強されて卵円窓に伝えられる(図A)。
(4)耳管 耳管は中耳腔(くう)と鼻咽頭(びいんとう)を連結しているが、通常は閉じている。しかし、嚥下(えんげ)、そしゃく、あくびなどのときには開き、鼓膜内外の気圧を等しくし、鼓膜の振動を容易にする。
(5)蝸牛 ヒトの蝸牛は螺旋(らせん)状に2回と4分の3回転した管で、基底膜と前庭膜とによって、蝸牛の全長にわたって3階〔前庭階、蝸牛管(中央階)、鼓室階〕にくぎられている。前庭階と鼓室階は外リンパに満たされ、蝸牛管は内リンパに満たされている。基底膜の上には、有毛細胞(聴受容器)を主としたコルチ器(ラセン器)がある。卵円窓に伝えられた振動は、蝸牛頂→鼓室階→正円窓と伝わり、最後には中耳に出るが、この間に基底膜を振動させる。このため、コルチ器の有毛細胞が興奮し、その興奮は蝸牛神経によって中枢に伝えられる(図B)。二次ニューロンは中脳の蝸牛神経核よりおこり、下丘→視床内側膝状体(しつじょうたい)→大脳聴覚領に達している。卵円窓の振動は前庭階の外リンパを振動させるが、これは基底膜に沿って縦方向に進行する外リンパの波を発生させる。この進行波は、低音ほど蝸牛頂に近いところに、また、高音ほど蝸牛頂に遠いところに振幅の最大がみられる。このようにみると、音の高低は蝸牛で解析されていることがわかる。[市岡正道]

感覚としての音

感覚としてわれわれが感受する音は、純音、楽音、騒音に分けられる。純音とは倍音を含まない音(たとえば音叉(おんさ)の音)であり、楽音とは基音と倍音との合成音であり、しかも、音波が反復するというパターンを示す。これに対し、騒音では音波が非周期的であり、反復しない形となる。騒音の強さをデシベル(dB、後述)で表すと、ささやき・20dB、会話・60dB、交通量の激しい所・80dB、走行中の地下鉄・100dB、耳に痛みを感じる音・140dB、飛行中のジェット機・160dBといわれている。
 音には大きさ(強さ)、高さ(調子)、音色という三つの性質がある。大きさは音波の振幅と、高さは音波の振動数とそれぞれ関係をもっている。すなわち、だいたいにおいて振幅が大きいほど音は大きく、振動数が多いほど音は高くなる。これらに対し、音色は、その音に含まれている上音の含まれ方によって決められるものである。
 音の強さと振動数とを変数としたとき、音の聞こえる範囲を「聴野」という。ヒトは約20ヘルツから約2万ヘルツまでの音を聞くことができ、最低の聴覚閾値(いきち)は、主言語の振動数帯である約200ヘルツから約3000ヘルツの間にあることがわかる。また、音波があまり強いときには、痛さを感じる。さまざまな振動数をもつ純音をイヤホンを通じて聞かせ、その閾値を正常者の閾値のパーセントとして描かれたグラフを聴力図(オーディオグラム)といい、このための装置を聴力計(オーディオメーター)という。
 音波の圧力で示された音の強さ(S)は、普通、デシベル(dB)単位で表される。すなわち、S0を閾値の強さとすると、Sは20logSデシベルとなる。S=S0のときは0dBであり、したがって閾値の強さも0dBということになる。なお、閾値の強さS0は、
  S0=0dB=0.000204dyne/cm2
と決められている。
 高低2音が耳に入るとき、低音によって高音は聞こえにくくなる。これを「音の隠蔽いんぺい(マスキング)」という。大脳皮質の聴覚領では、音の調子を感受する部位が一定の配列をなしている。それは、ちょうど蝸牛を聴覚領の上に広げたような配列となっており、低音は前外方で、高音は後内方で感受されるようになっている。また、音源の位置や方向の認知は、音波が両耳に到達する時間差、その結果としての両耳における音波の位相差、および、音源に近いほうの耳では音が大きく聞こえることなどが総合されて初めて可能となる。[市岡正道]

動物の聴覚

聴覚は振動覚の一種である。聴覚以外の振動覚や平衡覚など、他の機械的感覚に関係する受容器は、動物界に広く分布する。これと対照的に、聴覚器は脊椎(せきつい)動物と節足動物に知られているにすぎず、比較的遅れて進化した受容器と考えられている。節足動物、とくに昆虫類に発達した聴覚器には、空気や水の動きを直接受容するものと、圧受容器として音圧を受容するものとがある。ゴキブリの尾毛のような触毛(または聴毛)や、ハエやカなど多くの昆虫の触角にあるジョンストン器官は前者に属する。昆虫の鼓膜器官は、表皮と気管壁からできた鼓膜をもった、音圧を受容する真の聴覚器であり、キリギリス、コオロギでは前肢に、バッタ、セミでは腹節に、ドクガ、ヤガでは後胸にある。ヤガの鼓膜器官は、天敵であるコウモリの発する超音波に反応する。脊椎動物の聴覚は、鳥類、哺乳(ほにゅう)類においてよく発達し、同種間の情報伝達のほかに、コウモリやイルカなどの反響定位に活用されている。[村上 彰]

出典 小学館 日本大百科全書(ニッポニカ)日本大百科全書(ニッポニカ)について 情報 | 凡例

精選版 日本国語大辞典の解説

ちょう‐かく チャウ‥【聴覚】

〘名〙 感覚の一つ。水・空気などの媒質を伝わる音波刺激を認知する感覚。定位運動や空間認知に重要。聴覚器官によって伝達され、聴覚中枢で認知される。聴感。〔改訂増補哲学字彙(1884)〕

出典 精選版 日本国語大辞典精選版 日本国語大辞典について 情報

最新 心理学事典の解説

ちょうかく
聴覚
hearing(英),Gehörsinn(独)

聴覚とは基本的には大気中を伝わる振動(疎密波compression wave)を通して音を感じる知覚機能のことである。したがって,聴覚現象が生じる際に与えられる物理刺激は大気中を伝わる疎密波,すなわち音波sound waveである。また,音波を神経信号に変換する際に機能する感覚器が聴覚器であり,一般的には耳として知られる器官である。

【聴覚の成立と役割】 地球上の環境では,生物の周囲は水や空気などの弾性を備えた媒体で満たされている。これは哺乳類の祖先が水中に棲息していたころから成立していた環境である。このような環境では,ある1点に生じた振動(変異)はそれを取り囲む媒体も変形させ,疎密波としてその周辺に伝播していく。この伝播してきた振動を感知することによって,生物は周辺の変化を検知して,適応的な行動を取る際の情報を得ることができる。聴覚の原型は,まずこのような振動検出器として発生したと考えられており,生物が陸上へ進出した後も水中を伝わる疎密波の検知に使用していた器官を,大気を伝わる疎密波の検知に合うように適応進化させた形態が,ヒトの聴覚として考えられている知覚様相である。

【聴覚刺激auditory stimulus】 聴覚的印象をもつ場合には音波が聴覚に到来しているはずである。この音波は外界に存在する物体になんらかの変形が加わることによって発生する。つまり,物体が存在するだけでは聴覚刺激は生まれず,事象が生起したときに聴覚刺激が生じる。この点が,視覚刺激と好対照をなす。視覚刺激の場合,事象の生起がなくても物体の存在だけで刺激作用は生まれうるからである。伝播過程に介在する物質や空洞の周波数応答特性により,周波数に応じた伝播の効率の違いが生じ,聴覚器に伝わる振動の有効性が異なってくる。この効率が著しく低い周波数領域の音波は聴覚刺激とはならない。聴覚刺激としての有効性をもつ周波数帯域が可聴帯域であり,ヒトの場合はおよそ20㎐から20k㎐であると推定されている。

 聴覚刺激はその物理的な性質に応じて,種別分けされて参照されることが多い。まず,周期音periodic sound,非周期音non-periodic sound,過渡音transient soundの種別がよく使われる。周期音は時間波形に明確な繰り返しが観察される音であり,この音のフーリエ変換によって得られるパワースペクトルは基本周波数とその整数倍の周波数をもつ成分(調波成分)から成り立つ調波構造となる。この複数の調波構造をもった正弦成分のみで構成される音が調波複合音であり,これに対して単一の周波数の正弦波で構成される音を純音pure toneとよぶ。さらに複合音で,調波関係にならない正弦成分から構成される場合が非調波複合音ということになる。基本周波数の整数倍にならない成分に対して,上音という用語を用いる場合もある。音刺激としての存在期間が限定されている場合は過渡音といわれる。過渡音は当然ながら周期音ではなく,非周期音の一つと考えることもできる。ただし,非周期音であっても過渡的とは考えにくい場合も存在する。たとえば,過渡音であるパルスはすべての周波数成分を等しい割合で含むが,同じ振幅スペクトルをもつ白色雑音は過渡音とはならない。パルスと白色雑音との間には位相スペクトルの違いがあり,前者はコサイン位相であり,後者はランダム位相であるという。

【知覚的次元】 聴覚刺激の物理的な変化に対して心理量の変化が系統的に生じる場合,それら感覚量の変化は知覚的次元を形成する。まず,第1に考えられ調査されてきた次元はラウドネスloudness,すなわち音の大きさの次元である。ラウドネス()は基本的には聴覚刺激の強度に対応して変化する心理量と考えられる。強度()は音圧()と粒子速度()の積であり,粒子速度は音圧を大気の密度(ρ)と音速()の積で割った関係が成り立つ。密度と音速とをほぼ一定とみなせば,強度は音圧の2乗に比例する。聴覚刺激として適正な強度のダイナミック・レンジは非常に広く,エネルギー(単位W/m2:ワット毎平方メートル)で表わすとおおよそ10-12W/m2から103W/m2となる。そのため,聴覚刺激の呈示レベルを記述する際には強度レベルないし音圧レベルを使用する慣例がある。強度レベルは,音圧レベルはで算出し,単位は㏈を使用する。ただし,ここで00はそれぞれ基準強度,基準音圧であり,10-12W/m2,20μPaである(Pa:圧力の単位パスカル)。強度レベルと音圧レベルは厳密には異なるものであるが,実際上は両者の値に大きな差が生じることはなく,聴覚刺激の呈示レベルを記述するにあたって強度レベル,音圧レベルのいずれを用いてもかまわない。実際の物理的な測定では,大半のトランスデューサ(マイクロフォン)が音圧を測定するものであるため音圧レベルが使用される場合が圧倒的に多い。

 ラウドネスと強度の対応づけをする際には,外耳・中耳などの周波数伝達特性と内耳の基底膜振動や聴神経発火に備わる非線形特性を考慮する必要がある。前者は物理的には同じ強度の純音信号を与えた場合でも,周波数frequency(音圧が周期的に変動するとき,この変動が毎秒繰り返される回数)に依存して内耳に振動を伝える効率が異なってくることの主たる原因を作る。後者は,強度を2倍にしてもラウドネスが2倍とはならず,スティーブンスStevens,S.S.のベキ法則として知られるようにkI0.3の関係がほぼ成立する(ただし,は比例定数)ことの背景となっている。このラウドネスの周波数依存性と非線形性は図1に示す等ラウドネス曲線に表現されている。等ラウドネス曲線は1000㎐の純音をそれぞれの音圧レベルで呈示し,それとラウドネスが主観的に等しくなるように各周波数の純音の音圧レベルをマッチングすることによって求める。たとえば1000㎐,40㏈の純音とラウドネスが等価となる場合,それぞれの音は40ホンphonのラウドネス・レベルをもつと表現する。この等ラウドネス曲線が周波数軸に対して平坦にならないのは,外耳や中耳における周波数伝達特性によっておおよそ説明可能である。また,ラウドネス・レベルが上昇するにつれて曲線の谷は浅くなる傾向が観察されるのは,聴覚系の非線形応答を反映している。ホンの単位で表示されるラウドネス・レベルは,感覚量を表わす尺度ではない。すなわち10ホンの増加が10㏈(10倍)相当のラウドネスの増加を意味するものではない。スティーブンスのベキ法則が成り立つ範囲では,10㏈の強度の増加はラウドネスのおよそ2倍の増加となる。このラウドネスの感覚尺度の単位はソンsoneとなる。ラウドネス・レベルとソン値の関係は図2(横軸の単位はdB SLであるが,これは聴取者ごとの絶対閾を0dBとしたラウドネス・レベル値である)のようになる。なお図2の中のシンボルマークは,さまざまな研究のデータを表わす。

 ラウドネスと並んで研究の歴史をもつのがピッチpitch,すなわち音の高さの次元である。ピッチは純音の場合は物理信号の周波数に対応した知覚次元であると言える。しかし,複合音については若干の留保が必要となる。まず,複合音は複数の周波数成分から成り立つのでその中のどの周波数に対応するのかという問題がある。さらに,複合音には調波構造をもつ場合ともたない場合があり,後者は前者に比べて一般にピッチ感は不明瞭になる。自然界に存在する明確なピッチをもつ音の大半は,調波複合音とみなしてかまわない。それは基本周波数とその整数倍の調波成分から構成され,そのピッチは基本周波数の純音のピッチとほぼ一致する。聴覚説の一つである場所説に従うと,複合音のピッチは聴覚系で周波数分析された成分のうちの最低の周波数によって決定されるという予想が導かれる。しかし,実際には基本周波数成分が欠落した場合(ミッシング・ファンダメンタル)にも,その複合音に対するピッチは(欠落している)基本周波数のピッチと等しいと知覚される場合が多いことが知られている。これは聴覚説のうちの時間説にとって有利な証拠とされた。たとえば,800㎐,1000㎐,1200㎐の正弦波成分が存在する場合,それは基本周波数200㎐の調波複合音の第4次,第5次,第6次の高調波だけが出ていることになるが,その場合に知覚されるピッチは200㎐に相当するものとなり,800㎐相当とはならない。現時点での信頼度が高い聴覚モデルの大半が採用している考え方に従うと,このような知覚が生じる基本は蝸牛の基底膜における周波数分解と,それを中枢に送る神経信号が基底膜振動の位相に固定した活動の時間パターンを示すことにより,信号に備わる5ミリ秒(200㎐の逆数)の周期性の存在を手がかりにしているということになる。このようなピッチの明確さは,刺激の周波数が3~4k㎐を超える辺りから低下することが知られており,その一方で位相固定性の周波数の上限も3~4k㎐辺りであることが哺乳類を用いた生理実験により確認されている。

【ピッチの尺度と音楽的なピッチ】 ラウドネスのソン尺度と同様に,ピッチについての感覚尺度としてメルmel尺度が推定されており,周波数との対応は図3に示すようになっている。ピッチについては音楽的な音階も存在しており,音楽家は半音や全音などの音程pitch intervalの感覚をもっていると考えられる。半音や全音は周波数が等比的になる関係であり,周波数を対数尺度で表現したときにその上で等幅となる。ただし,音階自体は主観的に等幅のピッチの移動を保証するために作られたものとは必ずしもいえない。音楽家のもつ音程感とは学習性のものである可能性があるため,メル尺度の構成にあたっては,あえて音楽的な音程を使わないような配慮がなされた。その結果として,メル尺度は音階とは異なる関係となった。仮にメル尺度が音階と一致するものならば,図3は直線状になるはずである。メル尺度が具体的にどのような感覚を反映しているのかについては議論の余地が残る。

 音楽的なピッチ,すなわち旋律を奏でることのできるピッチについてはオクターブ等価性が成り立ち,さらには移調可能性が成り立つ。この音楽的なピッチが成立するのは可聴帯域(20㎐~20k㎐)の一部に限定され,およそ30㎐~4k㎐である。オクターブ等価性とは,周波数が2倍になった音は音楽的には同じ音名で参照されることに対応する。このような構造の成立は,基底膜における周波数分解にその根拠を求めることは難しく,周期性を反映した神経活動の位相固定性が起因となっていると考えられる。周期性のうえでは1オクターブ上の音は半分の周期を与える一方で,基の音と共通の周期性も備えているからである。このような周期性を反映した循環構造は,図4に示すようなピッチの二重らせん構造モデルとして提案され,多次元尺度法を用いたピッチの知覚空間へも出現することが確認されている。つまり,ピッチは基本周波数に対応した単純な1次元の知覚属性ではなく,それ自体が多次元性を備えているとも考えられる。

【音色timbre】 ラウドネスとピッチの違いが音の違いでないことは,それほど熟慮を労することなくわかる。われわれはピッチとラウドネスがほとんど等しいけれども明らかに異なる音が存在することを日常でも体験しており,その違いについては音色の違いであるということにしている。ISO(国際標準化機構)やJIS(日本工業規格)の音色の定義もそのようなものとなっているが,実際には音色がラウドネス,ピッチに並ぶ知覚的な属性であるというには留保が必要である。その理由は,音色の違いの存在が疑わしいというからではなく,音色の違いとして参照される概念が多義的であるからである。実際に音色に関する先駆的な研究は因子分析や多次元尺度法を用いて音色が多次元的なものであることを示している反面で,推定された各次元については共通性があるのかないのか判然としていない。聴覚刺激が与えられた場合,ラウドネスはその刺激に対する興奮の総量に対応し,ピッチは支配的な周期性に対応するといえるのに対して,音色は聴覚的なスペクトル・パターンに対応しているということしかいえない。パターンという概念は1次元の量では決してなく,したがって音色をラウドネス,ピッチと同列の知覚属性として扱うことは概念規定上も破綻している。その中で,スペクトル・パターンの違いを生む一要因として共鳴体のスケールがあることが示唆されている。共鳴体のスケール,すなわち空洞の寸法は聴覚的な情報から外界に存在する物体を推定するにあたって重要なものであり,ラウドネス,ピッチ以外にこのような次元が存在していても不思議はない。

【周波数分解能とマスキング】 聴覚器の機能は,振動を神経信号へ変換するものである。その際に振動の周波数の違いを精度よく符号化するために,受容細胞である内有毛細胞が乗っている基底膜の物理的な共振特性を変えて基底膜上の場所に応じて異なる周波数に反応するようなしくみが,哺乳類へと進化する段階で生まれていく。ベケシーBékésy,G.vonによる観察で実証されたこの基底膜による機械的周波数分析機能は,バンドパスフィルタ(特定の範囲の周波数のみを通すフィルタ回路)の集合として基底膜の機能を考えることへ十分な根拠を与えている。このフィルタの特性を推定するため人間の屍体を用いたり,実験動物を用いるなどする一方で,心理物理学的な実験によって生きている人間の特性を推定する手法がいろいろと提案され,それらは聴覚的な検出マスキング実験として知られている。聴覚マスキングauditory maskingとは,一般的には一つの音の存在が別の音を聞こえにくくする現象である。マスキング実験ではある特定の対象音をマスキーとして,妨害音すなわちマスカーが存在する状態での検出閾(マスキング閾)を測定する。

 一連の研究の発端はフレッチャーFletcher,H.による矩形フィルタ・モデルの提案と臨界帯域の概念の提唱であった。このモデルでは,基底膜のある場所の機械特性はほぼ矩形の通過幅をもつバンドパスフィルタとして模擬できると仮定し,そのバンド幅はマスキング効果の臨界点によって推定できるとした。たとえば,ある周波数を中心として純音のマスキングを帯域ノイズによって行なう場合,帯域ノイズのバンド幅が臨界帯域よりも小さいうちはノイズのバンド幅を広げるにつれてマスキング効果は上昇していくはずである。しかし,ノイズのバンド幅が臨界帯域を超えると臨界帯域外に落ちるノイズのパワーはマスキングには関係しないため,マスキング効果の上昇はそこで頭打ちとなるはずである。当初のマスキング実験はこのような論理のもとに行なわれた。

 しかし,そもそもマスキング実験を行なう目的は基底膜の各場所の周波数応答特性を推定するということにあるため,異なった手法のマスキング実験が次々と考案されていく。その過程でまず周波数応答特性が矩形であるという仮定自体についても批判的に検討がされていく。最初から周波数応答特性の形状を仮定することなく,実験結果に従って応答特性を求めるタイプの実験は,心理物理学的同調曲線を求める実験として知られている。典型的な実験では目標とする周波数(つまり聴覚フィルタの中心周波数)を一つ定め,その周波数の純音を閾上10㏈で呈示したものをマスキングするために要する純音マスカーのレベルを調べる。より少ないレベルでマスキングが生じるほどそのフィルタでのゲインが大きいと考えることができ,何点かのマスカー周波数で得たマスキングに必要なレベルを補完することによって,目標とした中心周波数のフィルタの周波数応答特性が推定できるという論理である。

 この手法には主に二つの問題点が存在している。一つは,純音を純音によってマスクするために同時に2種類の周波数をもつ純音を呈示することでうなりが聞こえてしまい,マスキング効果が純粋に測定できないというものである。うなりは時間的に入力に変動感を感じる感覚であり,聴取者は刺激音に時間変動感があるときにはマスキーが呈示されていると判断できてしまう。二つ目の問題点は,離調聴取とよばれる聴取方略の可能性である。実験を実施する側としては,目標音として設定した純音の周波数を中心周波数とするフィルタの特性を推定したい。しかし,聴取者側にすれば,自分の聴覚系のどのフィルタの出力を参照して解答するなどという意識的な制御ができるわけではなく,最もS/N比が高くなるフィルタの状態を参照するのが最適方略である。この時,目標周波数の周辺にはいくつかの周波数を中心周波数にもつフィルタが平行して多数存在しており,S/N比という観点では目標周波数とは若干ずれた周波数を中心周波数とするフィルタの方が良好なS/N比となる可能性がある。

 これら二つの問題点を解消するためにノッチ・ノイズ・マスキング手法が考案された。この手法では,心理物理学的同調曲線を求める場合と同様に,フィルタ形状を推定しようとする周波数の純音をマスキーとする。マスカーとしてはこの周波数を避けて,その位置にノッチが来るようなノイズを両側に呈示する(図5)。これによって最良のS/N比となるのはつねにこの目標周波数を中心とするフィルタであることが担保され,さらにマスカーがノイズであることによってうなりを手がかりとしたマスキーの検出はできなくなる。検出されたときのマスキーのパワーは注目したフィルタの山の裾野にかかるマスカー・パワーに比例すると考えられるので,その値から基底膜フィルタ形状の推定が可能となる。このようなモデルで推定されたフィルタの形状は図6に示すようなものとなり,生理学的な実験が示唆していたように矩形ということはなく,知覚現象のうえでも矩形フィルタを前提とするような不連続点を見いだすことは難しいため,現在では臨界帯域は一つのフィルタの実効的なバンド幅を指す概念として取り扱われている。

【聴覚情景分析auditory scene analysis】 聴覚という知覚様相の有利な点は,その有効範囲が視覚に次いで長いということにある。視覚の場合は,網膜上の1点は外界の1点に対応しており,2ヵ所から到来する光線が同一の感覚細胞を同時に刺激するということは透明視の事態を例外とする,まれな事例と考えてよい。対して,聴覚では疎密波をもたらす大気の圧力の変動には加算性が成り立ち,1ヵ所の観測点(たとえば鼓膜)には複数の音源から到来する音波の影響が足し込まれている。このような混入は味覚,嗅覚,触覚でも生じうるものの,それらについては有効距離が聴覚に比べて短いために,基本的にはつねに一つの刺激源を処理していると前提してかまわない。以上からわかることは,聴覚を通して周囲の状況を正しく推定するには,混信して与えられる圧力を適切にそれぞれの音源由来のものへと分析する必要があるということである。聴覚情景分析というキーワードを核とする一連の研究は,この問題に取り組んでいる。

 聴覚情景分析の中でも中心的な話題は音脈分凝auditory stream segregationの現象であり,知覚的体制化の問題の一つである。二つの周波数をもつ純音が交替して呈示される場合を考えると,これを旋律の最も原始的な状態であるというとらえ方がまず存在する。旋律の場合は二つの音の高さがどのような順であるかは大きな意味をもち,その二つの音の間には密接な関係を通常知覚する。つまり2音は同じ音源から到来したものとして一連の流れとしてつなげて聴かれる。ところがこの2音の高さの距離が大きくなると2音の間の知覚的なつながり感は希薄となり,それぞれ独立に断続する高い音と低い音の二つの流れが並行しているような印象に変化する。音脈auditory streamとは,この時に一つの流れに相当する知覚像に言及する概念である。音脈分凝には原始的分凝とスキーマ依存的分凝の2種類がある。原始的分凝とはボトム・アップな過程の結果として分凝が生じる場合で,たとえば聴取者が2音の交替をなるべく一連の音脈として聴こうとしているにもかかわらず,2音間の高さの違いが大きいことにより自然に二つの音脈に分凝するような場合を指す。反対にスキーマ的な分凝とは,なるべくどちらか一方を聴き出そうとして成功する場合を指す。原始的な分凝の場合は,2音間の高さの距離だけでなく,2音の交替速度も分凝の仕方に影響を与える重要な要因であることが報告されている。

 以上のような二つの純音を想定した単純な場合だけでなく,複数の成分音間の知覚的体制化がどのようなものになるかを規定する要因の主要なものはいくつかわかっている。調波性,同期性などがそれである。聴覚刺激についてその物理的な特性を記述するにあたり,フーリエ分析の概念に触れたときの素朴な当惑は,これまで知覚的には一つの音として取り扱っていたものが複数の周波数をもつ正弦波であることである。同じ複数の周波数成分が存在している場合でも,それらの間に調波構造が成立しなければ,一つの音にまとめて知覚する傾向は低くなる。たとえば調波構造から約4%の逸脱が生じると,その成分は他の正弦成分とは異なる音脈として「飛び出て」知覚されるようになる。一方,正弦波成分の同期が約30ミリ秒程度ずれることにより,それは異なる音源から到来するように知覚される。物理的な振動体を考えると,周期的な振動をする音源からは調波構造に従った複数の正弦波成分がほぼ同時に出現するという自然界の制約が存在しており,われわれの聴覚系はそれらの物理モデルを内在化するような方向で進化したと考えることができる。 →聴覚説 →聴覚領野 →聴空間
〔津﨑 実〕

出典 最新 心理学事典最新 心理学事典について 情報

世界大百科事典内の聴覚の言及

【中脳】より

…これらの働きは網膜に入った視覚の刺激が上丘や大脳皮質を経由して起こるものである。(3)視覚や聴覚の刺激による運動反射 これは目の前に飛んできた物体を反射的に避けたり,音の刺激の方向に反射的に頭を向けたりするときに役立っている。いずれも上丘に達した光や音のインパルスが,上丘から出る視蓋脊髄路により頸髄に伝えられることによって起こる。…

【耳】より

…脊椎動物の頭部にある有対の感覚器官で,平衡覚と聴覚をつかさどる。ふつう〈耳の形〉などというときには,哺乳類の頭の両側に突出した耳介を指すが,解剖学的にいえば耳には内耳,中耳,外耳の3部分が含まれる。…

※「聴覚」について言及している用語解説の一部を掲載しています。

出典|株式会社平凡社世界大百科事典 第2版について | 情報

今日のキーワード

アイントホーフェン

オランダの生理学者。旧オランダ領ジャワ島のスマランに、陸軍軍医の子として生まれた。陸軍の給費学生としてユトレヒト大学に学び、医師となった。1886年ライデン大学の生理学教授に任ぜられ、兵役を免除された...

続きを読む

コトバンク for iPhone

コトバンク for Android

聴覚の関連情報