tf・idf(読み)てぃーえふあいでぃーえふ(その他表記)term frequency - inverse document frequency

図書館情報学用語辞典 第5版 「tf・idf」の解説

tf・idf

統計的な情報検索手法において,文献を特徴付ける語を特定するために,文献のタイトル抄録本文などを語単位に分割し,各語の重みを計算する方法.あるいは重み付けの統計尺度.tf(term frequency)はある1件の文献内におけるその語の出現頻度を意味し,idf(inverse document frequency)はその語が出現する文献数の逆数を指す.基本的にはこれらの二つの値を掛け合わせてその語の重みとする.tfは文献内におけるその語の重要度,idfはその語の索引語としての有用性を表している.ベクトル空間モデルを始めとして,統計的検索モデルにおいて幅広く利用されている.

出典 図書館情報学用語辞典 第4版図書館情報学用語辞典 第5版について 情報

今日のキーワード

カイロス

宇宙事業会社スペースワンが開発した小型ロケット。固体燃料の3段式で、宇宙航空研究開発機構(JAXA)が開発を進めるイプシロンSよりもさらに小さい。スペースワンは契約から打ち上げまでの期間で世界最短を...

カイロスの用語解説を読む

コトバンク for iPhone

コトバンク for Android