日本大百科全書(ニッポニカ) 「MNIST」の意味・わかりやすい解説
MNIST
えむにすと
手書き文字認識の研究用データセット。Mixed National Institute of Standards and Technology databaseの略である。データは、0から9までの数字を手書きしたものを28×28ピクセル、256階調の白黒グレースケールの画像データとしたものである。正解ラベルとして、0から9の10種のラベルのいずれかが付与されている。このような画像が、訓練用6万枚、テスト用1万枚用意されている。同じデータセットを使うためアルゴリズムの優劣が比較しやすい。データセットもコンパクトで、訓練にかかる時間も少ない。そのため、画像認識の標準データセットとして定着した。新しい画像認識アルゴリズムはまずMNISTで精度を測定し、それでよい結果が出れば論文発表する、という傾向があるために、画像認識の研究分野全体が、MNISTというデータセットに過剰に適合しているのではないかという批判もある。
[丸山 宏 2019年4月16日]