強化(読み)キョウカ(その他表記)reinforcement

翻訳|reinforcement

デジタル大辞泉 「強化」の意味・読み・例文・類語

きょう‐か〔キヤウクワ〕【強化】

[名](スル)強くすること。さらに強くすること。「体力強化をはかる」「警備強化する」
[類語]強める増強補強強まる

出典 小学館デジタル大辞泉について 情報 | 凡例

精選版 日本国語大辞典 「強化」の意味・読み・例文・類語

きょう‐かキャウクヮ【強化】

  1. 〘 名詞 〙 強くすること。強めること。
    1. [初出の実例]「伝統的の民族観念に基づく絶対権の強化を計ったのであった」(出典:万葉集における自然主義(1933)〈長谷川如是閑〉三)

出典 精選版 日本国語大辞典精選版 日本国語大辞典について 情報 | 凡例

最新 心理学事典 「強化」の解説

きょうか
強化
reinforcement

強化とは,自発された反応に随伴して正の強化子(強化子reinforcerとは,反応に随伴して呈示される刺激を指す)を呈示するか,負の強化子を除去すること,あるいは,このような操作により反応が増加することである。レスポンデント条件づけでも強化(または強化工作)という用語を使う場合があるが,これは条件刺激と無条件刺激との対呈示のことを指している。オペラント条件づけでは,レスポンデント条件づけとは異なって,刺激の役割は,誘発的な働き(機能)ではなく,反応を自発する手がかり(弁別刺激)としての働きと,反応を強める(または弱める)働きにあるが,とりわけ反応を強めたり弱めたりする強化子としての働きが重要である。

 強化は,刺激の操作と反応の変化の二つの側面から定義することができる。刺激操作として刺激の呈示と除去,反応の変化として反応の増加と減少を組み合わせれば,表に示したように4通りになる。反応に随伴して,刺激を呈示することで,反応が増加することを正の強化positive reinforcement,反応に随伴して,刺激を除去または遅延させることで,反応が増加することを負の強化negative reinforcementとよぶ。また,反応に随伴して刺激を呈示することで,反応が減少することを正の罰positive punishment,刺激を呈示しないことで,反応が減少することを負の罰negative punishmentとよぶ。反応が減少することは,反応を弱めることになるので,これらを強化と反対の過程を表わすものとして弱化(罰punishmentともいう)という。負の罰の例としては,消去手続きにより強化子を呈示しないことや,反応する機会を除去すること(タイムアウト)という操作が挙げられる。

 呈示することで反応を減少させるか,除去することで反応を増加させる働きをもつ刺激を負の強化子negative reinforcer,呈示することで反応を増加させるか,除去することで反応を減少させる働きをもつものを正の強化子positive reinforcerという。刺激がどのような場合に強化子としての働きをもつかは,動機づけの問題であるが,強化子としての働きをもつのは食物や水などのモノだけではない。ヒトの場合には,「うなずき」という身振りや,「はい」や「そうですね」という言語反応(言語条件づけ),さらにことばによる賞賛も強化子になる。また,何かをするコトも反応を強める働きをもつ(後述するプレマックの強化原理)。

 食物や水を強化子として働かせるためには,空腹にすることや,喉が渇いた状態にする遮断化deprivationという操作を行なう必要がある。また,逆に強化子として働かなくなるようにするには,満腹にすることや,水を十分に与えるという飽和化satiationという操作が必要になる。これらは,オペラント条件づけにおける動因操作の一例である。

【罰と負の強化】 強化が行動を強めるものであるのに対し,罰は行動を弱めるものである。罰の効果は,長くは続かない一時的なものであるが,行動が抑制される程度は,電気ショックのような嫌悪刺激(負の強化子)が呈示される頻度や過去経験による。チャーチChurch,R.M.(1959)は,餌を得るためにレバー押しを行なっているネズミに,電気ショックを受けたネズミの悲鳴(嫌悪刺激)を聞かせたところ,レバー押し反応が一時的に抑制されること,またこの抑制効果(罰の効果)は,過去に電気ショックを受けた経験のあるネズミほど持続することを見いだした。この事実は,過去の自らの悲鳴が電気ショックと結びついたため(連合仮説)であると考えられている。罰は,罰そのものの効果以外に,副作用として,他個体やなんらかの外的対象に対する攻撃行動が起きることや,罰が攻撃行動をはじめとするさまざまな行動の手がかり(弁別刺激)になる場合がある。

 嫌悪刺激を取り除いたり,嫌悪刺激の呈示を遅らせたりする行動は,回避行動avoidance behaviorとよばれる。一方,呈示された嫌悪刺激から逃れる行動は,逃避行動escape behaviorとよばれる。回避行動を強める負の強化の効果は,嫌悪刺激を取り除ける程度や嫌悪刺激の呈示を遅らせる時間の長さに依存する。これらの行動は,いずれも負の強化により形成・維持されていると考えられる。この点で,正の強化と負の強化は,行動を強める働きが強化子の呈示と除去という対称的な関係にある。シドマンSidman,M.(1953)は,短い持続時間の電気ショック(1回数百ミリ秒)を一定間隔で呈示(たとえば,5秒の刺激-刺激間隔(;)S-S5秒)し,反応が生じると反応から次の電気ショックの呈示が延期される(たとえば,20秒の反応-刺激間隔(;)R-S20秒)手続きを用いて,電気ショックを回避するネズミのレバー押し反応が,電気ショックの呈示間隔が短いほど(呈示頻度が高いほど),高頻度で生じることを見いだしている。この手続きを,シドマン型回避行動Sidman avoidance behaviorの手続きという。

 食物を強化子とした正の強化の場合には,強化子の呈示頻度(単位時間当たりの強化数)により反応の生起頻度(単位時間当たりの反応数)が決まるように,電撃という負の強化子の呈示頻度の減少がレバー押し反応の増加をもたらしたと考えられる。

 このような回避行動を理解するには,生物が生まれつきもっている防御反応(たとえば,ネズミの場合には跳び上がったり,うずくまる反応,ハトの場合は飛び上がったり,羽をばたつかせる反応)との関係や,経験を通して獲得される情動との関係が重要である。前者は,種に特有な防御反応species-specific defense reaction(SSDR)とよばれている(Bolles,R.C.,1970)。

【無条件性強化子と条件性強化子】 強化子には,大別すると,食物や水など生得的に強化機能をもつ刺激と,個体の経験を通して強化機能を獲得する刺激がある。前者を1次性強化子あるいは無条件性強化子unconditioned reinforcer,後者を2次性強化子あるいは条件性強化子conditioned reinforcerとよぶ。反応に随伴して条件性強化子を呈示することを,条件性強化conditioned reinforcementという。条件性強化子の例として,実験箱に見られる,餌皿の呈示時に点灯される照明や餌皿の動作音などが挙げられる。餌皿の照明や動作音は,いつも無条件強化子である餌と対になって呈示されるという経験を通して,条件性強化子になると考えられる。つまり,条件性強化子の形成は,レスポンデント条件づけの過程に基づいている。同じように,条件性強化子と第3の新たな刺激を対にして呈示することにより,この第3の刺激にも強化子の働きを付与することができる。このような手続きは,理論上n次について成立すると考えられるので,これを高次条件づけhigher-order conditioningという。

 チンパンジーを用いた条件性強化の実験では,まず最初に,トークン(代用貨幣)を給餌装置に入れて,餌を食べるという訓練を行ない,続いてレバーを押して,トークンを手に入れるように訓練する。この訓練では,レバー押し反応はトークンで強化され,トークンを給餌装置へ入れる反応は餌で強化されている。このような訓練を経験したチンパンジーは,レバーを押してトークンを手に入れようとする。このとき,トークンは条件性強化子としての働きをもっているといえる。

 条件性強化子は,複雑な行動の維持に大きな役割を果たしている。前述の例でも,レバー押し反応とトークンを給餌装置に入れる反応が結びつけられている。この例で,トークンはレバー押し反応に対して強化子として働き,給餌装置に入れる反応に対しては,弁別刺激として働いているのである。つまり,トークンは,二重の働き(機能)をもっているといってよい。このような関係は,さらにいくつかの反応にも拡張することができる。これを行動の連鎖chainingという。この行動の連鎖は,最終的には,無条件性強化子により強化されていることに注意が必要である。われわれが行なっているさまざまな複雑な行為は,このような条件性強化機能と弁別刺激機能を介して,単純な行為をいくつも結びつけたものと考えられる。

【さまざまな強化子】 これまで強化子としてさまざまなものが見いだされてきた。たとえば,刺激変化そのものが強化子として働くことがある。ネズミがレバーを押すとなんらかの音が呈示されるような随伴性を設定しておくと,ある程度レバー押し反応が維持される。この場合,音の呈示という刺激変化が強化子として働いていると考えられる。これを感性強化sensory reinforcementという。感性強化は,刺激のさまざまな効果を測定するときの比較の基準(ベースライン)となる。

 社会的場面とは,他個体が存在する場面であるが,他個体の存在が強化子として働く場合がある。たとえば,ヒヨコが餌をついばむとき,他個体が存在している場合の摂食量は,単独でついばむときの摂食量よりも増加することが知られている。これを社会的促進social facilitationという。また,アカゲザルでは,窓を開けると他個体が見えない場合よりも,見える場合を好むことが認められている。このように,他個体の存在は強化子として働くと考えられる。これを社会強化social reinforcementという。

 ヒトの言語条件づけの実験では,被験者特定の言語反応に対して,「よし」,「ふむふむ」などという言語反応が随伴呈示される。この結果,特定の言語反応の生起頻度が増加することが示されている。この事実は,言語行動がオペラント条件づけにより変容すること,および随伴呈示される言語反応が言語的強化子として働くことを示している。

 1950年代にオールズOlds,J.とミルナーMilner,P.は,ネズミの脳のさまざまな場所に電極を植え,ネズミがレバーを押すと短い時間,微弱な電流が流れる方法を開発した。これを脳内自己刺激法intracranial self-stimulation methodという。このような随伴性を設定したところ,脳の特定部位(たとえば大脳辺縁系)では,頻繁なレバー押し反応が起きることを見いだした。この事実は,脳の電気的刺激が強化子として働くことを意味している。また,強化子としての働きの中枢が脳の特定部位にあることを示唆するものであるが,強化子としての脳内自己刺激は,食物や水などの1次性強化子とは異なる側面のあることもその後の研究で明らかになっている(Hursh,S.R., & Natelson,B.H.,1981)。

【強化効果の測定】 ある強化子がどの程度の効果(強化子としての効力)をもっているかという問題は,強化の問題を考えるうえで重要である。強化効果reinforcing effectがあるか否かは,その強化子を呈示することでどの程度反応を維持できるかを見ればよい。また,これとは別に,なんらかの新たな操作を行なったときの抵抗性という観点からも検討することができる。たとえば,その強化子が呈示されなくなったときに,どの程度まで反応が維持されるのかを見る方法は,消去手続きに対する抵抗性(消去抵抗)から見たものである。抵抗性が高い(反応が維持される)場合は,強化効果の強いことを,また抵抗性が低い(反応が維持されない)場合は,強化効果の弱いことを表わしている。一方,これとは逆に,すべての刺激に対して強化子を呈示することで,新たな強化子呈示という手続きに対する抵抗性(強化抵抗)から見ることもできる。また,ある強化スケジュールで維持されている行動に対し,たとえば,これとは別の反応に依存しない強化子を呈示すること(反応減少操作)で,どれだけ前の行動が維持されるかを見る方法もある。どの程度以前の行動が維持されるかは,前の行動を維持していた強化子の効力に依存すると考えられる。これを新しい変化に対する抵抗性(変化抵抗)とみなすことができる。

【プレマックの強化原理】 プレマックPremack,D.は,食物や水というモノだけではなく,なんらかの活動に従事するコトも強化の働きをもつことを明らかにしている。彼は,制約のないときに見られる行動の起こりやすさを従事時間という測度から見ると,行動の起こりやすさには,階層性があることを見いだした。たとえば,ネズミを回転カゴ,レバー,水飲み用のチューブが設置されたケージに入れると,起こりにくい反応から起こりやすい反応として,レバー押し→カゴ回し→水飲みという階層構造になることがわかる。プレマックの強化原理では,「起こりやすさという階層の高い活動(起こりやすい活動)は,低い階層の活動(起こりにくい活動)を強化できる」と考える。すなわち,水飲みという反応は,カゴ回し反応に対する強化子となり,カゴ回し反応を強め,そしてカゴ回し反応は,レバー押し反応に対する強化子になり,レバー押し反応を強めることができる。

 図は,プレマックの実験結果(1963)を示しているが,反応間に随伴性のないベースライン(基準)としてさまざまな飲水反応(16%,32%,64%のショ糖溶液),輪回し反応(重い,軽い),レバー押し反応の起こりやすさの確率(ベースライン確率)を調べると,起こりにくい順番に,レバー押し反応,重い輪回し反応(HW),飲水反応(64%ショ糖溶液),軽い輪回し反応(LW),飲水反応(32%ショ糖溶液),飲水反応(16%ショ糖溶液)となった。そこで,強化子としての働きを調べるために,これらの反応を最も起こりにくいレバー押し反応に随伴させたところ,ベースラインにおいて起こりやすいものほど強化力のあることが示された。また,活動の起こりやすさの階層構造は,固定的ではなく,制約条件が変われば,この階層構造も変わるので,反応を強める側と強められる側の関係も変化するといえる。これを,強化関係の可逆性という(Premack,1963,1971)。

 その後,プレマックの強化原理は,強化スケジュールによる制約という観点から再検討され,反応遮断化説response deprivation theoryへと発展した(Timberlake,W., & Allison,J.,1974)。この反応遮断化説では,強化スケジュールによる,より大きい制約の反応がより小さい制約の反応に対する強化子として働くと考えるのである。つまりプレマックの強化原理とは異なり,強化子としての働きは,ベースラインにおける反応の起こりやすさには依存しないのである。 →オペラント条件づけ →強化スケジュール
〔伊藤 正人〕

出典 最新 心理学事典最新 心理学事典について 情報

日本大百科全書(ニッポニカ) 「強化」の意味・わかりやすい解説

強化
きょうか
reinforcement

学習あるいは条件づけを通じて反応を維持し、強めることを強化という。反応の結果が反応を強める場合を積極的強化positive reinforcement、反応の結果の除去が反応を回復させる場合は消極的強化negative reinforcementという。たとえば、空腹のネズミは、走路の終点に餌(えさ)が置かれると、走路を走ってこれに到達することを学習する。餌に到達することは積極的強化である。電撃を受けたネズミは、ハードルを越えてこれを回避、またはこれから逃避することを学習する。電撃を除去すると逃避・回避は消去し、通常の反応を回復する。電撃を受けることは消極的強化である。

 強化は、生体の個体保存、種保存に直接関係する場合は一次的強化primary reinforcementといわれ、生得的なものを意味するが、これに対し、経験を通じて習得され、新たに一次的強化と同じ機能をもった場合は条件性強化conditioned reinforcement、二次的強化secondary reinforcementという。飼い犬が飼い主に向かって走って行けば、飼い主の口笛は条件性強化である。それによってビスケット(一次的強化)がもらえるからである。

 学習理論で反応‐強化の随伴性contingencyを原理とするアメリカのスキナーらの立場では、特定反応を生起させる強化の分化differential reinforcement、強化の機会を制御する強化スケジュールが研究されている。

[小川 隆]

出典 小学館 日本大百科全書(ニッポニカ)日本大百科全書(ニッポニカ)について 情報 | 凡例

ブリタニカ国際大百科事典 小項目事典 「強化」の意味・わかりやすい解説

強化
きょうか
reinforcement

(1) 条件づけの学習に際して,刺激と反応との結びつきを強める手段そのものをさす。ないしはその手段によって結びつきが強められる働きのこと。たとえば古典的条件づけでは,食物などの無条件刺激を提示する手続そのもの,ないしはこうした無条件刺激の提示によって条件刺激と唾液分泌との結合が強められること。また道具的条件づけでは,被験個体がてこを押したり,迷路の目標箱に到達したときに餌などの報酬を与える手続そのもの,ないしはこうした手続によって被験個体のおかれている刺激状況,てこを押したり目標箱に向って走るという特定の反応との結合が強められること。 (2) 餌などの報酬,電気ショックなどの罰そのもののこと。これは厳密には強化因子と呼ばれる。 (3) 言語学習,課題解決場面における反応の結果について正誤などの知識,情報を与えること。

出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報

栄養・生化学辞典 「強化」の解説

強化

 食品に欠けている成分や,増量したい栄養素を加えること.

出典 朝倉書店栄養・生化学辞典について 情報

世界大百科事典(旧版)内の強化の言及

【条件づけ】より

…この学習のモデルとして,I.P.パブロフの条件反射を原型とする古典的条件づけと,E.L.ソーンダイクの道具的条件づけがある。これらはともに二つの過程の連合が重要で,古典的条件づけでは2種の刺激の連合が,道具的条件づけでは動物の反応とそれを基準とした強化刺激の連合が重要となる。
[古典的条件づけclassical conditioning]
 レスポンデント(応答的)条件づけrespondent conditioningまたは第I型条件づけtype I conditioningともいわれる。…

【条件反射】より

…また条件刺激によってひき起こされる反応を条件反射conditioned reflex(略称CR),無条件刺激でひき起こされる反応を無条件反射unconditioned reflex(略称UR)という。条件刺激と無条件刺激を組み合わせて与える操作を強化reinforcementという。
[条件反射の特性]
 条件反射は次のような性質をもっている。…

※「強化」について言及している用語解説の一部を掲載しています。

出典|株式会社平凡社「世界大百科事典(旧版)」

今日のキーワード

仕事納

〘 名詞 〙 年の暮れに、その年の仕事を終えること。また、その日。《 季語・冬 》[初出の実例]「けふは大晦日(つごもり)一年中の仕事納(オサ)め」(出典:浄瑠璃・新版歌祭文(お染久松)(1780)油...

仕事納の用語解説を読む

コトバンク for iPhone

コトバンク for Android