デジタル大辞泉
「OCR」の意味・読み・例文・類語
オー‐シー‐アール【OCR】[optical character reader]
出典 小学館デジタル大辞泉について 情報 | 凡例
出典 精選版 日本国語大辞典精選版 日本国語大辞典について 情報 | 凡例
知恵蔵
「OCR」の解説
OCR
光学文字認識のこと。画像データ上にある文字と思われる部分を解析し、コンピューター上で扱える文字(テキスト)データに変換すること。パソコンではスキャナーやデジタルカメラによって画像データ化された印刷物を「テキスト化」するのに利用されることが多い。パソコン用の市販ソフトウエアも数多く販売されており、WordファイルやPDFファイルを出力可能な製品もある。パソコン用のスキャナー(イメージスキャナー)の多くに、OCRソフトが付属する。
アルファベットや数字など、画数が少ないラテン系の活字に関してはかなり確実な認識を行うが、画数が多く偏(へん)と旁(つくり)など複数のパーツが1文字をなすことのある漢字等や、手書き文字の認識については改善の余地がある。
OCRは、郵便物の郵便番号をスキャンして自動振り分けを行ったり、確定申告や労災申請といった政府機関への申請用紙や、金融機関の振り込み用紙等の機械処理にも利用されている。
出典 (株)朝日新聞出版発行「知恵蔵」知恵蔵について 情報
オーシーアール【OCR】
光学式文字読み取り装置。手書きの文字や印刷された文字をイメージスキャナーなどで光学的に読み取り、あらかじめ登録された文字の形状を参照し、文字データへと自動的に変換するもの。書籍の電子化のほか、一部の電子辞書やPDAの手書き入力などに用いられる。◇「optical character recognition」または「optical character reader」の頭文字から。
出典 講談社IT用語がわかる辞典について 情報
OCR
オーシーアール
optical character reader
光学式文字読取り装置のこと。手書きの書類や,印刷,印字された文字を光の反射の強弱によって光電素子を使って光学的にページ単位で読取り,コンピュータに情報として入力する装置。原理的には,一つの文字を数十個の方眼に分割し,特定のます目の白黒の分布状態や文字全体の輪郭の特徴でコンピュータが文字を判定する仕組みである。パターン情報処理や人工知能の進歩で,漢字とかなの混在する日本語の文章を読取るものも実用化されている。新聞や文献を画像としてファイルする場合と比べ,データ量がはるかに小さくなる。文書データの入力作業も不要になり,過去の文献のデータベース化が容易になった。手書きの文書用の OCRも実用化の段階に入っている。
出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報
OCR
新聞などの印刷物をスキャナを使ってパソコンに取り込み、文字のデータに変換することです。日本語でいえば「光学式文字読み取り」です。スキャンした画像データの中から文字の輪郭を抽出して、どの文字なのかを判断しています。ただし、漢字の「二」とカタカナの「ニ」、数字の「1」と音引きの「ー」など、認識を失敗することもあるので、人によるチェックや修正が不要というわけにはいきません。
⇨スキャナ
出典 (株)朝日新聞出版発行「パソコンで困ったときに開く本」パソコンで困ったときに開く本について 情報
OCR
光学式文字読み取り装置。印刷物などの文字を、光を当てることで読み取り、テキストデータに変換する装置のこと。最近では、スキャナーで読み取った文字をテキストデータに変換する、OCRソフトが使われることが多い。
出典 ASCII.jpデジタル用語辞典ASCII.jpデジタル用語辞典について 情報
出典 株式会社平凡社「改訂新版 世界大百科事典」改訂新版 世界大百科事典について 情報
出典 株式会社平凡社百科事典マイペディアについて 情報
世界大百科事典(旧版)内のOCRの言及
【入出力装置】より
…
[知的入出力]
ディジタル入出力やアナログ入出力と違って,外部表現が内部表現と単純に対応しない場合には,入出力時に複雑な変換が必要になる。たとえば人間が読むかたち,つまり符号化されていない形で文字が表現されているときは,光学的文字読取器(OCR)などによって,これを画像として入力して文字コードに変換する必要がある。画像と文字コードとの対応は複雑なので,この変換は容易でなく,しばしば誤りが発生する。…
【文字読取装置】より
…光学的に文字を読み取るものと,磁気インキを利用したものがある。前者の光学的文字読取装置は,optical character readerを略してOCRともいい,印刷された文字あるいは手書きの文字を光学的に読み取り,文字パターンを認識して文字コードとして入力する装置である。初期の装置は印刷された文字で限られた字種,例えば数字とアルファベットを対象とし,文字の形も機械的な読取りに適した特殊な形のものが使用された。…
※「OCR」について言及している用語解説の一部を掲載しています。
出典|株式会社平凡社「世界大百科事典(旧版)」