tf・idf(読み)てぃーえふあいでぃーえふ(その他表記)term frequency - inverse document frequency

図書館情報学用語辞典 第5版 「tf・idf」の解説

tf・idf

統計的な情報検索手法において,文献を特徴付ける語を特定するために,文献のタイトル抄録本文などを語単位に分割し,各語の重みを計算する方法.あるいは重み付けの統計尺度.tf(term frequency)はある1件の文献内におけるその語の出現頻度を意味し,idf(inverse document frequency)はその語が出現する文献数の逆数を指す.基本的にはこれらの二つの値を掛け合わせてその語の重みとする.tfは文献内におけるその語の重要度,idfはその語の索引語としての有用性を表している.ベクトル空間モデルを始めとして,統計的検索モデルにおいて幅広く利用されている.

出典 図書館情報学用語辞典 第4版図書館情報学用語辞典 第5版について 情報

今日のキーワード

イチロー

[1973~ ]プロ野球選手。愛知の生まれ。本名、鈴木一朗。平成3年(1991)オリックスに入団。平成6年(1994)、当時のプロ野球新記録となる1シーズン210安打を放ち首位打者となる。平成13年(...

イチローの用語解説を読む

コトバンク for iPhone

コトバンク for Android