…α,γが有界で滑らかなとき,初期値X(0)=xが与えられると,解X(t)が定まる。評価関数,を最大(あるいは最小)にするように許容されるコントロールを選ぶのが確率制御である。
(価関数という)となる
を最適制御と呼ぶ。…
…結果は各プレーヤーのとる戦略によって定まるから,利得は各プレーヤーのとる戦略の関数である。この関数を評価関数,利得関数などと呼ぶ。ゲームとして最も本質的なことは各プレーヤーの利得は自分のとる戦略の関数であるだけでなく,他のプレーヤーのとる戦略の関数であるということである。…
…時間と記憶容量の許す範囲内でなるべく深くまで先読みしたゲーム木を作り,先読みの末端の局面一つ一つの形勢判断を行う。形勢判断には,局面を入力として形勢判断の結果を数値として出力する評価関数evaluation functionを用いる。コンピューターゲームではこの評価関数の作成がもっとも難しい。…
※「評価関数」について言及している用語解説の一部を掲載しています。
出典|株式会社平凡社「世界大百科事典(旧版)」