コトバンクはYahoo!辞書と技術提携しています。

コーパス(corpus)

朝日新聞掲載「キーワード」の解説

コーパス(corpus)

原義は「身体、(文献などの)全集」。実際に書かれたり、話されたりした文章を言語活動の実態に沿ってバランス良く集め、分類した大量の資料。各国で、国の支援を受け構築が進んでいる。韓国では、国立国語院を中心に約1億語の「世宗コーパス」が07年に完成予定。中国語には10億語規模のものがあるが、出典が台湾と中国新聞記事に限られており、質も含めた世界一BNCと言われている。

(2006-03-01 朝日新聞 夕刊 1総合)

出典|朝日新聞掲載「キーワード」朝日新聞掲載「キーワード」について | 情報