DQN(読み)でぃーきゅーえぬ

日本大百科全書(ニッポニカ) 「DQN」の意味・わかりやすい解説

DQN
でぃーきゅーえぬ

ディープラーニング深層学習)によって強化学習を行う手法の一つ。deep Q-networkの略である。DeepMind(ディープマインド)社によって提案された。学習の結果、ブロック崩しなどのビデオゲームを、人間のプレーヤーよりうまくプレーすることができたことで、一躍注目を浴びた。強化学習の考え方は古くからあったが、少数パラメーター試行錯誤によって調整するものであった。しかし、この場合パラメーターが少ないために、倒立振子のような単純なシステムでしかうまく動かなかった。ここにディープラーニングを初めて取り入れたのがDQNである。これによって、画面全体の状態を画像として認識し、パドルを操作するというような、複雑な方策も学習できるようになった。この結果、たとえばブロック崩しゲームでは、ブロックの裏側にボールを投げ込むことで高い得点を得る技があるが、DQNは試行錯誤によってそのような戦略を発見した。深層強化学習はこのようにきわめて強力だが、ランダムな試行錯誤の結果として得られる報酬しか考慮しない。したがって、一見悪い方策のように思えるが、長い目でみると報酬が大きくなるような、長期間プランニングが必要な問題は苦手である。

丸山 宏 2019年4月16日]

出典 小学館 日本大百科全書(ニッポニカ)日本大百科全書(ニッポニカ)について 情報 | 凡例

今日のキーワード

世界の電気自動車市場

米テスラと低価格EVでシェアを広げる中国大手、比亜迪(BYD)が激しいトップ争いを繰り広げている。英調査会社グローバルデータによると、2023年の世界販売台数は約978万7千台。ガソリン車などを含む...

世界の電気自動車市場の用語解説を読む

コトバンク for iPhone

コトバンク for Android