tf・idf(読み)てぃーえふあいでぃーえふ(英語表記)term frequency - inverse document frequency

図書館情報学用語辞典 第5版 「tf・idf」の解説

tf・idf

統計的な情報検索手法において,文献を特徴付ける語を特定するために,文献のタイトル抄録本文などを語単位に分割し,各語の重みを計算する方法.あるいは重み付けの統計尺度.tf(term frequency)はある1件の文献内におけるその語の出現頻度を意味し,idf(inverse document frequency)はその語が出現する文献数の逆数を指す.基本的にはこれらの二つの値を掛け合わせてその語の重みとする.tfは文献内におけるその語の重要度,idfはその語の索引語としての有用性を表している.ベクトル空間モデルを始めとして,統計的検索モデルにおいて幅広く利用されている.

出典 図書館情報学用語辞典 第4版図書館情報学用語辞典 第5版について 情報

今日のキーワード

焦土作戦

敵対的買収に対する防衛策のひとつ。買収対象となった企業が、重要な資産や事業部門を手放し、買収者にとっての成果を事前に減じ、魅力を失わせる方法である。侵入してきた外敵に武器や食料を与えないように、事前に...

焦土作戦の用語解説を読む

コトバンク for iPhone

コトバンク for Android