独立同分布(読み)どくりつどうぶんぷ

日本大百科全書(ニッポニカ) 「独立同分布」の意味・わかりやすい解説

独立同分布
どくりつどうぶんぷ

統計において標本調査を行う際に置く仮定個別標本サンプル)が、他の標本の値に関係なく独立に得られること、またそれらの標本が同じ確率分布から得られること。統計における基本的な仮定であり、統計的機械学習における訓練データセットにも同じ仮定が要求される。

 ビッグデータが喧伝(けんでん)される昨今であるが、実際に企業が保有するデータには、独立同分布とはとてもいえないものも多い。ある工作機械から発せられるアラーム頻度がある日から突然低くなっていた。実際には、アラームが多すぎるので現場の工員が設定を変えていたのである。すなわち、過去のアラームのデータ(アラーム頻度)が、その後のデータに影響を与えていたわけで、これは独立な標本とはいえない。このようなことが起きると、独立同分布の仮定が崩れ、統計的機械学習にはそのままでは使えないデータとなる。この場合、独立同分布にするためには、「アラームの設定」という新たな説明変数を設ける必要がある。

丸山 宏 2019年4月16日]

出典 小学館 日本大百科全書(ニッポニカ)日本大百科全書(ニッポニカ)について 情報 | 凡例