…
[強化学習]
帰納学習や演繹学習では正解事例が直接入力された。それに対し一般の生物やロボットのような自律システムの学習ではそのような正解が直接与えられないことが多い。環境中でさまざまな行為を試み,報酬を得られる行為を強化していく学習を強化学習という。…
※「自律システム」について言及している用語解説の一部を掲載しています。
出典|株式会社平凡社「世界大百科事典(旧版)」
5/14 日本大百科全書(ニッポニカ)を更新
4/12 日本大百科全書(ニッポニカ)を更新
4/12 デジタル大辞泉を更新
4/12 デジタル大辞泉プラスを更新
3/11 日本大百科全書(ニッポニカ)を更新