コーパス(英語表記)corpus

翻訳|corpus

図書館情報学用語辞典 第5版の解説

言語データに限るならば,機械可読テキストの集成体.最も広義にはテキストの任意の集成体を,狭義にはある言語クラスを代表する有限の機械可読テキスト集成体を指す.より広い文脈では,画像や音声を含むさまざまな種類のデータの集成体もコーパス(画像コーパス・音声コーパスなど)といわれる.言語コーパスは言語学,文学,テキスト処理などの基本的な研究材料であり,Brown Corpus(アメリカ英語総語数約百万)やBritish National Corpus(イギリス英語総語数約1億)など,大規模なものが作られている.収録データに分野,出典,出版年,性別,年齢層,社会層などの情報が付加されることもある.

出典 図書館情報学用語辞典 第4版図書館情報学用語辞典 第5版について 情報

精選版 日本国語大辞典の解説

〘名〙 (corpus) 言語研究のために集積された一群の資料。個別言語や、ある作家のテキスト、母語話者の発話記録などを網羅的に集めたもの。言語資料体。

出典 精選版 日本国語大辞典精選版 日本国語大辞典について 情報

世界大百科事典内のコーパスの言及

【自然言語処理】より

…理解の反対方向の操作である文生成の場合は,意味から逆の道筋をたどって文を作る。
[言語情報資源]
 自然言語処理においては扱う対象となる言語情報資源には,(1)コーパスと呼ばれる整理された大量の文データ,(2)言語の構造を記述した文法,(3)言語に関する知識を集約整理した辞書がある。 コーパスは,自然言語処理および言語学さらに言語教育の実用の場において使用する言語情報資源である。…

※「コーパス」について言及している用語解説の一部を掲載しています。

出典|株式会社平凡社世界大百科事典 第2版について | 情報

今日のキーワード

医食同源

病気を治療するのも日常の食事をするのも、ともに生命を養い健康を保つために欠くことができないもので、源は同じだという考え。[補説]古くから中国にある、体によい食材を日常的に食べて健康を保てば、特に薬など...

続きを読む

コトバンク for iPhone

コトバンク for Android

コーパスの関連情報