日本大百科全書(ニッポニカ) の解説
フィーチャーエンジニアリング
ふぃーちゃーえんじにありんぐ
feature engineering
機械学習のシステムを構築する際に、その入力となる素性(そせい)を設計する作業、ないしはその技術。たとえば、ある店舗の売上げを予測するシステムをつくる際に、過去の売上げやその日の日付、来客数等を入力とし、売上げを出力するようなモデルをつくる。このとき、日付を7で割った余り(基準日から1日目、2日目と数えて、7日目には7で割った余りが0になる。つまり、0から6までを繰り返す数字が得られる)、すなわち曜日にすると、その予測精度があがることがある。また、祝日かどうかという素性を入れるとさらに精度があがるかもしれない。このように、入力となる素性をどう設計するかは、機械学習の精度をあげるうえでたいへん重要である。
素性を自動的に選択する素性選択や、素性を生成する素性生成の技術もあるが、一般には、こうしたフィーチャーエンジニアリングには、ドメインの知識(解析しようとする分野に関する知見・トレンド情報など)を用いて機械学習の開発者が考案するしかなく、経験とスキルが要求される。
[松尾 豊 2020年1月21日]