弁別学習(読み)べんべつがくしゅう(英語表記)discrimination learning

ブリタニカ国際大百科事典 小項目事典の解説

弁別反応を形成する学習。2つの刺激を用いる場合の訓練手続としては,まず実験者が一方の刺激を正刺激,他方を負刺激と定め,それらを継時的あるいは同時的に被験体に反復提示する。正刺激に対する反応強化され,負刺激に対する反応は強化されない。このような訓練手続により,次第に正刺激に対する反応だけがその強さや生起確率を増すようになる。

出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報

最新 心理学事典の解説

弁別学習とは,二つ以上の刺激の弁別が要求されるような課題を学習することをいう。

【刺激の弁別】 赤信号を見て止まり,青信号を見て歩きだす人は,赤と青の区別ができているといえる。仮に,赤色と緑色という二つの弁別刺激に対して,赤色のもとでは反応を間欠的に強化,緑色のもとでは強化しない(消去extinction)という随伴関係を設定すると,赤色のもとでは反応し,緑色のもとでは反応しなくなる。このような操作のことを分化強化differential reinforcementとよぶが,その結果として得られた前述の事実を弁別の形成,すなわち被験体が刺激を区別したという。つまり,二つの刺激の区別とは,それらの刺激のもとで行動に違いが見られることである。このことをオペラント弁別operant discriminationという。

 図1は,三つの弁別刺激を継時的に呈示した場合のこれらの刺激に対する分化強化の効果(継時弁別学習)を示している。1番目の手続きでは,すべての刺激のもとで反応を強化する。2番目の手続きでは,赤色のもとでのみ強化する。3番目の手続きでは,すべての刺激のもとで消去する。最後の4番目の手続きでは,再び2番目の手続きと同様に,赤色のもとで反応を強化する。これらのうち,2番目と4番目の手続きでは学習曲線が,3番目の手続きでは消去曲線extinction curveが得られている。

【同時弁別と継時弁別】 前述した赤色と緑色の弁別刺激を同時に呈示する方法を同時弁別simultaneous discrimination手続き,一度に赤色または緑色のいずれかを呈示する方法を継時弁別successive discrimination手続きという。同時弁別手続きでは,被験体は,1試行ごとに呈示される二つの刺激のうち,正刺激に反応することが要求されるが,継時弁別手続きでは,正刺激が呈示される試行では反応し,負刺激が呈示される試行では反応しないことが要求されるという相違がある。したがって,継時弁別手続きを反応する-反応しない(go/no-go)型の手続きとよぶことがある。

 これらの手続きのもとでは,正刺激と負刺激間の相互作用が問題になる。たとえば,継時弁別の手続きでは,後で述べる行動対比とよばれる現象が起こることが知られているが,同時弁別ではこのような現象は生じない。このことは,同じ正刺激と負刺激を用いたとしても,二つの場面ではこれらの刺激間の相互作用が異なることを示唆している(Zentall,T.R., & Clement,T.S.,2001)。

【行動対比behavioral contrast】 レイノルズReynolds,G.S.(1961)は,継時弁別手続きを用いて,二つの刺激のもとでハトのキーつつき反応を間欠的に強化した後,一方の刺激のもとでは同じように間欠的に強化し,他方の刺激のもとでは強化しない(消去)という分化強化を行なったところ,強化されない刺激(負刺激)のもとでの反応は減少したが,以前と同じように強化された刺激(正刺激)のもとでの反応は,以前よりも増加することを見いだした(図1の手続き2)。この現象を行動対比という。

 行動対比が注目されたのは,この現象がスペンスSpence,K.の理論から説明できなかったからである。興奮性過程と抑制性過程の加算を仮定するスペンスの加算説では,反応の増加ではなく減少を予測してしまうのである。スペンスの加算説に代わる行動対比の説明は,いくつか提案されており,負刺激への反応は抑制されてそれが正刺激へ転移するという反応競合説,反応は二つの刺激における強化率に依存するという相対価値説,さらに反応はオペラント随伴性とパブロフ型刺激-反応関係の二つの要因に依存するという2要因説がある。

【正の特色価効果feature-positive effect】 継時弁別場面において,図2のような二つの刺激をそれぞれ正刺激と負刺激とした場合におけるハトの弁別行動の形成を比較すると,円の中心に黒点のある刺激を正刺激とする方(黒点のない円を負刺激とする)が容易に弁別行動が形成されるのに対し,黒点のない円を正刺激とすると弁別行動の形成が困難であることが見いだされている(Jenkins,H.M., & Sainsbury,R.S.,1970)。この現象は,黒点という他の刺激と区別する特徴(区別刺激)が正刺激にあることから,正の特色価効果とよばれている。

 ハーストHearst,E.とジェンキンスJenkins,H.M.は,この現象を,「被験体は強化と相関の高い部位に反応するように方向づけられる」ことを意味するサイン・トラッキングsign-trackingの観点から説明した。ハトを被験体とした実験では,通常ハトがつつくキー上に刺激が呈示されるので,ハトが先の例の黒点をつつくことにより,黒点が正刺激の場合には弁別行動の形成が促進され,黒点が負刺激の場合には逆に弁別行動の形成が遅れると考えるのである。このようにサイン・トラッキング説では,行動は一般に強化子と正の相関のある刺激(正刺激)に接近し,強化子と負の相関のある刺激(負刺激)から遠ざかるという傾向をもつことを前提にしている。このような行動傾向は,自動反応形成や自動反応維持の成立にも関係していると考えられている。しかし,反応キー(操作体)と刺激呈示が一致しない場合にも,正の特色価効果が認められているので,サイン・トラッキングは必ずしも正の特色価効果の必要条件とはいえない。

 正の特色価効果を,サイン・トラッキング説に代わり,複合刺激を構成する各刺激の働き(機能)から説明することができる。蜂屋真(1983)は,継時弁別訓練後に,消去手続きと強化手続きによる般化テストを行ない,各刺激が興奮性の働きをもつのか,あるいは抑制性の働きをもつのかを検討した。この結果,複合刺激が負刺激となった場合,共通刺激である光刺激のもつ興奮傾向が,区別刺激である音刺激の抑制傾向を弱める働きをしていることを示唆する結果が得られた。このことから,正の特色価効果は,区別刺激を正刺激あるいは負刺激にする弁別課題における各刺激の刺激性制御を獲得する速度の相違により説明することができる。

【無誤学習errorless learning】 弁別行動の形成とは,正刺激に対する反応の増加とともに,負刺激に対する反応が減少することである。つまり,弁別行動の形成過程では,一般に負刺激に対する反応(誤反応)がかなり生じる。しかし,テラスTerrace,H.S.(1963)は,弁別行動が誤反応なしに形成できることを示した。彼は,試行反応手続きによる継時弁別学習の手続きを用いて,ハトに赤色と緑色の区別を行なわせた後,縦線と横線の区別の訓練へ移行した。このとき,通常の手続きとは異なり,負刺激(S-)を最初は非常に短い時間あるいは非常に弱い刺激強度で呈示し,その後,徐々に呈示時間や刺激強度を増やすフェイディング法fading methodや,赤色と青色の上に縦線と横線を呈示する重ね合わせ法superimposition methodを用い,縦線と横線の弁別行動形成を比較した。すると重ね合わせ法だけの場合は,負刺激に対する反応(誤反応)がある程度生じたのに対し,この二つの方法を併用した場合,負刺激に対する反応はほとんど生じないことが明らかになった。このような方法による弁別行動の形成を無誤学習という。

 図3は,継時弁別の手続きに,フェイディング法と重ね合わせ法を適用しない場合と適用した場合の弁別完成までに要した誤反応数を示している。この方法は,短い訓練日数での学習を可能にすることから,学習促進のための方法として,ハトや発達障害児の自己制御の確立のために用いられている(Mazur,J.E., & Logue,A.W.,1978; Schweitzer,J.B., & Sulzer-Azaroff,B.,1988)。

【複合刺激弁別と注意】 複合された刺激の弁別の際には,何を手がかりに刺激を区別しているのであろうか。この問題は,刺激の側から見ると,刺激のどのような側面が行動を制御しているのかということである。これを行動の刺激性制御stimulus controlという。レイノルズ(1961)は,色と形から成る複合刺激,すなわち赤い三角を正刺激,緑の丸を負刺激としたハトの継時弁別学習を用いてこの問題を検討した。まず,ハトに二つの刺激を弁別させた後,テストとして,刺激を色次元(赤と緑)と形次元(三角と丸)に分割して呈示したところ,図4に示されているように,あるハトは赤(色次元)に,また別のハトは三角(形次元)に反応することが明らかになった。この事実は,個体により,弁別の手がかりとなる刺激の側面が異なることを示している。レイノルズは,これを注意attentionとよんでいる。

【条件性弁別conditional discrimination】 前述した赤色と緑色の弁別課題に,さらに条件を付け加えてみよう。たとえば,実験箱の天井灯が点灯しているときは,赤色のキーをつつくと餌を呈示し,天井灯が点灯していないときは,緑色のキーをつつくと餌を呈示するようにすると,やがてハトは,天井灯の点灯・消灯に従って,つつくキーの色を変えるようになる。このような手続きを条件性弁別という。この事実は,天井灯という刺激との関係により,ハトが刺激の赤色・緑色という絶対的関係ではなく,天井灯との相対的関係に基づいて弁別できることを示している。

 条件性弁別の一つに同一見本合わせidentity matching to sample課題がある(Cumming,W.W. & Berryman,R.,1961)。この課題では,たとえば三つのキーを用いた実験箱の中央のキーに見本刺激を呈示する(図5)。ハトがこの刺激をつつくと,左右のキーに比較刺激が2種類(一つは見本と同じ刺激,もう一方は異なる刺激)呈示される。もしハトが見本と同じ刺激をつつくと強化され,見本と異なる刺激をつつくと強化されない。

 この例では,比較刺激と見本刺激は同時に存在しているが,見本刺激をつつくと見本刺激が消え,比較刺激が呈示される手続きを遅延見本合わせdelayed matching to sampleという。見本刺激の消失から比較刺激呈示までの遅延時間をさまざまに操作することで,記憶の研究に用いることができる(室伏靖子,1983;中島定彦,1995)。

 前述とは逆に,見本と異なる比較刺激を選ぶと強化し,同じ刺激を選ぶと強化しない手続きを異種見本合わせheterogeneous matching to sampleという。見本刺激と比較刺激との関係は,たとえば赤色の見本刺激に対し三角形の比較刺激,緑色の見本刺激に対し円形の比較刺激というように,任意に設定できる。このような手続きは,象徴見本合わせsymbolic matching to sampleという。一般に,同種見本合わせよりも,異種見本合わせの方が学習は容易である(河嶋孝,1968)。また,ハトの場合には,見本刺激と比較刺激の刺激次元が異なる場合(色と形)よりも,同じ場合(色と色)の方が学習は容易である(Urcuioli,P.J., & Zentall,T.R.,1986)。

【系列学習と推移的推論】 詩の朗読や一定の作業順序などのように,反応を決められた順番で自発していくことを系列学習serial learningという。ここには,反応の連鎖や刺激間のつながり,そして各刺激項の系列位置関係の学習という側面が含まれている。系列学習の手続きでは,たとえばA→B→C→D という順番でキーをつつくことをハトに学習させた後,この系列の中の部分系列A→D,B→Dなどを呈示するテストを行ない,正しい順番で反応できるか否かを検討するのである。ハトは,こうした系列に従ってキーをつつくことができ,また部分系列テストでも正しい順番でキーをつつくことが認められた(Straub,R.U., & Terrace,H.S.,1981)。

 フサオマキザルでも,同様な系列学習を習得でき,なおかつ部分系列を用いたテストに対しても正しく反応することができた。さらに,別の実験では,5項目からなる系列の一部がまったく別の刺激(ワイルドカード)に変えられても,正しい順番で反応できることが示された(D'Amato,M.R., & Colombo,M.,1988)。しかし,ハトに同様なワイルドカードによる系列テストを行なわせると,3項目の系列ではフサオマキザルと同様に正しくキーをつつくことができたが,5項目になると成績は偶然の結果(チャンスレベル)と違いがない程度まで低下したのである。これらのことは,系列学習におけるハトとフサオマキザルの方略の違いを表わしているものと考えられる。

 系列学習と関連する問題の一つとして推移的推論transitive inference課題について検討が行なわれている。推移的推論とは,たとえば,A>B,B>Cという関係が与えられたとき,A>Cとなる関係を推定できることである。つまり直接経験した項目間の関係から,直接経験していない項目間の関係を推定することである。このような推移的推論問題は,好き嫌いのように選択の順位が1次元上に並べられる場合に,選択の一貫性が成立するか否かという視点からの研究(伊藤正人,1983)と,これとは別に刺激項目間の順序性に焦点を当てた研究がある。たとえば,A>B>C>D>Eという順序の系列がある場合,AとBならAを選び(A>B),BとCならばBを選ぶ(B>C),CとDならばCを選ぶ(C>D),DとEならばDを選ぶ(D>E)という訓練を行なった後,訓練では用いられなかった,たとえばBとDを呈示し,Bが選ばれる(B>D)か否かを調べるのである。フォン・ファーセンvon Fersen,L.ら(1991)は,ハトにこのような訓練を行なった後にテストしたところ,正しくBを選ぶことが示された。この事例では,刺激は隣り合うものであったが,刺激項目間の距離と正答率との間には,距離が長いほど正答率が高くなるという関係が知られており,これは象徴距離効果symbolic distance effectとよばれている。 →オペラント条件づけ →刺激等価性 →般化 →見本合わせ →レスポンデント条件づけ
〔伊藤 正人〕

出典 最新 心理学事典最新 心理学事典について 情報

世界大百科事典内の弁別学習の言及

【条件づけ】より

…レバーを押せば食餌が与えられる装置(スキナー箱S.kinner box)によって,レバー押しを学習する場合や,迷路学習maze learningのように,迷路のなかで正しい道を通ったときに餌が与えられるようなものもある。弁別学習discrimination learningは,二つまたはそれ以上の刺激を同時に呈示し,正しい刺激を選んで反応すれば報酬を与えるように刺激の弁別をさせるものである。また問題箱学習problem box learningはソーンダイクの考案になるもので,掛金をもつ扉のある箱に動物を入れ,外に出るためには掛金をはずさなければならないように仕掛けておく。…

※「弁別学習」について言及している用語解説の一部を掲載しています。

出典|株式会社平凡社世界大百科事典 第2版について | 情報

今日のキーワード

アルコール依存症

飲酒によって一時的に、不安や緊張感、気分の落ち込みなどが緩和されるが、次第に飲まずにはいられない精神状態になり、同じような酔いを得るための飲酒量が増大していく(耐性)。身に付いてしまった大量頻繁な飲酒...

続きを読む

コトバンク for iPhone

コトバンク for Android