コーパス(読み)こーぱす(その他表記)corpus

翻訳|corpus

デジタル大辞泉 「コーパス」の意味・読み・例文・類語

コーパス(corpus)

語彙索引など、言語研究のための資料。特に、コンピューターを利用してデータベース化された大規模な言語資料。

出典 小学館デジタル大辞泉について 情報 | 凡例

関連語 名詞

精選版 日本国語大辞典 「コーパス」の意味・読み・例文・類語

コーパス

  1. 〘 名詞 〙 ( [英語] corpus ) 言語研究のために集積された一群の資料。個別言語や、ある作家テキスト、母語話者の発話記録などを網羅的に集めたもの。言語資料体。

出典 精選版 日本国語大辞典精選版 日本国語大辞典について 情報 | 凡例

図書館情報学用語辞典 第5版 「コーパス」の解説

コーパス

言語データに限るならば,機械可読テキストの集成体.最も広義にはテキストの任意の集成体を,狭義にはある言語クラスを代表する有限の機械可読テキスト集成体を指す.より広い文脈では,画像や音声を含むさまざまな種類のデータの集成体もコーパス(画像コーパス・音声コーパスなど)といわれる.言語コーパスは言語学文学,テキスト処理などの基本的な研究材料であり,Brown Corpus(アメリカ英語総語数約百万)やBritish National Corpus(イギリス英語総語数約1億)など,大規模なものが作られている.収録データに分野,出典,出版年,性別,年齢層,社会層などの情報が付加されることもある.

出典 図書館情報学用語辞典 第4版図書館情報学用語辞典 第5版について 情報

世界大百科事典(旧版)内のコーパスの言及

【自然言語処理】より

…理解の反対方向の操作である文生成の場合は,意味から逆の道筋をたどって文を作る。
[言語情報資源]
 自然言語処理においては扱う対象となる言語情報資源には,(1)コーパスと呼ばれる整理された大量の文データ,(2)言語の構造を記述した文法,(3)言語に関する知識を集約整理した辞書がある。 コーパスは,自然言語処理および言語学さらに言語教育の実用の場において使用する言語情報資源である。…

※「コーパス」について言及している用語解説の一部を掲載しています。

出典|株式会社平凡社「世界大百科事典(旧版)」

今日のキーワード

南海トラフ臨時情報

東海沖から九州沖の海底に延びる溝状の地形(トラフ)沿いで、巨大地震発生の可能性が相対的に高まった場合に気象庁が発表する。2019年に運用が始まった。想定震源域でマグニチュード(M)6・8以上の地震が...

南海トラフ臨時情報の用語解説を読む

コトバンク for iPhone

コトバンク for Android