パターン認識(読み)パターンニンシキ(英語表記)pattern recognition

デジタル大辞泉 「パターン認識」の意味・読み・例文・類語

パターン‐にんしき【パターン認識】

文字・図形・音声などの空間的および時間的なパターンを識別・認定すること。特に、実世界の雑多な情報を含むデータの中から、コンピューターを用いて意味のある情報を抽出する処理をさす。文字認識音声認識生体認証などが実用化されている。

出典 小学館デジタル大辞泉について 情報 | 凡例

精選版 日本国語大辞典 「パターン認識」の意味・読み・例文・類語

パターン‐にんしき【パターン認識】

  1. 〘 名詞 〙 文字、図形、音声などのように同じ種類に属するものから特徴を見いだして識別・分類すること。〔新しい医学への道(1964)〕

出典 精選版 日本国語大辞典精選版 日本国語大辞典について 情報 | 凡例

改訂新版 世界大百科事典 「パターン認識」の意味・わかりやすい解説

パターン認識 (パターンにんしき)
pattern recognition

音声,文字,図形,画像などのパターンが何を表しているかを知ること。パターンは,多くの観測値が集まってはじめて意味のある情報を表している。パターン認識の対象は次のように大別される。(1)一次元波形 音声,地震波心電図など。(2)二次元データ 普通の濃淡画像やカラー画像のほか,X線写真,赤外線写真のような不可視画も含む。さらに,多数の点の距離データも二次元データである。とくに人間が作った画像(図面,略図,天気図など)を図形という。(3)動画像 一定時間ごとに入力した多数の画像で,動きの解析に役立つ。なおパターン認識では,すべてを自動的に行うとはかぎらず,重要な部分を人間が行い,コンピューターは人間を助けるという対話形式で行うこともある。

 パターン認識の対象として,文章のような記号列を含める場合もある。しかし,パターンの本来の意味からも,記号列を除外することが多い。パターン認識の古くからの定義は,観測されたパターンが,既知のどのパターンと最もよく似ているかを決定することである。たとえば,あるアルファベットが既知の文字〈A〉と最もよく似ているとき,それをAと認識する過程をいい,既知のパターンをモデル,あるいはモデルパターンという。最近では,たとえば屋外写真から,道路,木,建物などがどのような関係にたっているかを知ることもよぶが,この場合,対象の風景写真と似た既知の写真がなく,写真を構成する要素が既知であるにすぎない。この広義のパターン認識は,パターン理解ともいわれる。以下では,古くからの狭義のパターン認識とパターン理解を説明する。

狭義のパターン認識の過程は,図1のように入力,前処理,特徴抽出,決定の4段階に分けられる。入力では,音や光がマイクロホンやテレビカメラなどの入力装置によって電気信号に変換され,さらに必要に応じてそれが数値に変換される。前処理は,以後の特徴抽出や決定に都合のよい処理を行う過程で,たとえば入力装置によってゆがんだパターンをもとに戻したり,入力文字の大きさをそろえたりすることである。この入力と前処理は,認識対象ごとに異なるので,従来のパターン認識の研究ではあまり取り上げられていない。特徴抽出は,決定を行うのに有効なパターンの性質を特徴として抽出する過程で,前処理と特徴抽出は不要なこともある。決定では,前段階の結果から,入力パターンが既知のどのモデルパターンに近いかを決める。パターン認識のむずかしさは,入力パターンがモデルと必ずしも一致せず,最も近いモデルを選択しなければならないことにある。

パターン認識の目的は,対象が音声でも文字や画像であっても,必ず入力パターンが何であるかを決定することである。最も簡単な方法は,入力パターンとモデルパターンをパターンマッチングによって重ね合わせて,その一致度を調べ,最もよく一致するモデルパターンを認識結果とすることである。パターンマッチングは印刷文字のように,モデルパターンと入力パターンの差が少ない場合に有効である。パターンマッチングだけで決定できない場合には,二つのパターンの近さを調べなければならない。入力パターンそのもの,あるいは入力パターンの特徴がx1x2,……,xnというn個の数で表されるとする。これは,n次元のベクトルx=(x1x2,……,xn)で表すことができる。いま,モデルパターンがm個あったとする。それぞれをn次元ベクトルで表しておく。つまり,モデルパターンはx1x2,……,xmというm個のベクトルに対応する。入力パターンとi番目の標準パターンの近さは,xxiの近さであるとみなし,xxiの距離によって決定する。たとえば,図2のようにxxin次元空間の原点から発するベクトルとみなし,ベクトルの先端の距離dとする。また,xxiのなす角θを距離の定義とすることもできる。距離の定義が与えられれば,決定は簡単で,入力もパターンから得られるベクトルxに最も近い標準パターンxiを求めればよい。以上のほか種々の距離の定義が研究されている。

 実際のパターン認識はこのように簡単でない場合が多い。たとえば,パターンが2種類で,実験によって得られたパターンが図3のように分布していたとする。それぞれのパターンの標準パターンをどのように定めても,前述の距離の定義だけではすべてを正しく認識できない。この問題を解決するためには,より適した特徴を抽出するか,より多くの標準パターンを用いるか,あるいはより複雑な決定理論を用いるかである。実用的には,前2者の方法を採ることが多い。それで対処できない場合には,二つのパターンの境界を曲線にするような複雑な決定法を導入しなければならない。

 パターン認識の決定法を,例題を与えるだけでも自動的に学習させようとする方式もある。とくに,決定を用いるパラメーター閾値や式の係数)を学習によって調整する方式が多く用いられている(学習機械)。

 もう一つの問題は,パターンの種類が多い場合に,決定のための計算量が多くなることである。その解決法の一つは,あらかじめモデルパターンを大ざっぱに分類しておき,入力パターンが最初にこの大分類のどれであるかを決定し,次にその中のどのモデルパターンかを決定する多段決定法である。また,特徴の値を順番に調べていき,その値によって枝分かれして,最後にモデルにたどりつくという探索の問題として決定を行う方法もある(探索理論)。

入力パターンは多くの観測値の集まりであるので,データー量が多い。特徴抽出の目的は,多くのデータからパターン認識に有効な情報だけを取り出すことである。どの特徴をどのようにして抽出したらよかを決める一般的理論はないが,いくつかの特徴の候補が与えられたとき,どの特徴が有効であるかを統計的に評価する方法はある。有効な特徴から順に選択していき,いくつかの入力パターンに対して認識実験を行って,適当な数の特徴を決めることができる。また,学習によって有効な特徴を自動的に選択する方式もある。

パターン理解は,音声理解や画像理解などの総称である。音声理解はアメリカで1971年から5年間研究された音声理解プロジェクトに由来する。そのプロジェクトでは,音声を単に信号とみなして各瞬間の音が何であるかを決めるのではなく,単語辞書,文法,話の内容などを考慮して,文章全体を理解することを目標にした。その後,視覚パターン認識に対しても,視覚パターンを詳しく解析して,それが表す内容を理解するアプローチが盛んになり,画像理解とよばれるようになった。いずれも,人間がパターンを理解する能力を人工的に実現することをめざし,人工知能の研究分野の一部を占めている。

 ここでは,画像理解を例として取り上げ,その処理過程を簡単に説明する。対象は,図4に示すような積木のシーンとする。このシーンをテレビカメラで撮影して濃淡画像を入力するまでは,狭義のパターン認識と同じである。その後の処理過程を図5に例示する。特徴抽出では,対象がどのようなものであるかを詳しく知るため,できるだけ多くの有用な情報を抽出する。この例では,画像の中で明るさが急変する点を求め,隣どうし近い点を連結して線を求める。このようにして図4に示すような線画が得られる。これは,画像に関する特徴である。線画の各線は,明るさがその線の両側で異なることを表しているにすぎない。対象が凸の多面体の積木であれば,各線は積木の稜に対応している。さらに,各稜に対して,両側の面が同じ物体かあるいは一方が他方の手前にあるかを決定する。この処理は,画像の特徴を解釈することであり,その結果としてシーンがどのようになものであるかという記述が得られる。この記述から,シーンには二つの物体があり,一方が他方の手前にあることがわかる。ここであらかじめ,四角柱三角柱のモデルたとえば,四角柱は〈各頂点で三つの四角形の面が凸に交わる〉と作っておき,このようなモデルとシーンの記述を照合すれば〈四角柱があり,その後方に三角柱がある〉という結果を得ることができる。以上は画像理解の典型的な例であり,対象シーンや用いる情報(カラーや距離)によって多少異なるが,その原理は同じである。

パターン理解は,限定されたモデルから一つを選ぶという狭義のパターン認識と異なり,対象に関する詳しい記述を作らなければならない。したがって,対象に関する知識を有効に利用して,考慮しなければならない範囲をなるべく限定し,処理時間を短縮するとともに,誤りの可能性を少なくすることが望ましい。たとえば,前述のように対象が凸の多面体を含むシーンであれば,そのことを利用して線画の各線が積木の境界か凸の稜であるか,またどの線が同じ物体に属するかなどを知ることができる。もし対象が人間の顔であれば,目や鼻の位置関係を利用して,それぞれを速く認識することができる。音声理解でも,単語辞書や文法を利用すれば,ありえない音素系列を除外できる。対象が複雑になるほど,利用できる知識も多くなり,知識利用の効果も大きくなる。多くの知識をいかにしてコンピューターに表現するかという知識表現や,知識を効率よくコンピューターに与える方法が重要になる。そのために,コンピューターに学習機能を与えようとする方式も開発されている。
執筆者:


出典 株式会社平凡社「改訂新版 世界大百科事典」改訂新版 世界大百科事典について 情報

百科事典マイペディア 「パターン認識」の意味・わかりやすい解説

パターン認識【パターンにんしき】

知覚の対象が特定のパターン(類似性によって抽出された観念)にあてはまるかどうかを認識すること。人間のもつ根本的な認識機能の一つであるが,コンピューターの進歩に伴って機械にもそれを行わせようという試みが行われ,心理学,生理学,哲学,工学などの諸分野に関連する一つの学問領域となっている。実用的にはコミュニケーションの手段として用いられる文字,図形,音声などの,人により時により千差万別な差異をもつ表現を機械により認識させることが利用されつつある。→音声タイプライター光学的文字読取パーセプトロン
→関連項目画像認識

出典 株式会社平凡社百科事典マイペディアについて 情報

知恵蔵 「パターン認識」の解説

パターン認識

人間の顔の表情や手書き文字の認識、視界の中の物体や人物を的確に判断するために、画像や音声などの膨大なデータのもつ意味を判断する(データが属するべきグループやカテゴリーを見つける)こと。知的なロボットの視覚や認識、柔軟なヒューマンインターフェースや安全監視のためのコンピューターシステムにおいて重要な技術となっている。

(星野力 筑波大学名誉教授 / 2007年)

出典 (株)朝日新聞出版発行「知恵蔵」知恵蔵について 情報

ASCII.jpデジタル用語辞典 「パターン認識」の解説

パターン認識

文字や音声などの入力情報をパターンとして蓄え、新しい入力情報と照らし合わせて、どのような情報かを認識すること。OCRなどでは、文字や数字のパターンと照合して入力情報を認識する。音声認識では、声紋のパターンを認識することによって、本人かどうかを確認する。

出典 ASCII.jpデジタル用語辞典ASCII.jpデジタル用語辞典について 情報

今日のキーワード

マイナ保険証

マイナンバーカードを健康保険証として利用できるようにしたもの。マイナポータルなどで利用登録が必要。令和3年(2021)10月から本格運用開始。マイナンバー保険証。マイナンバーカード健康保険証。...

マイナ保険証の用語解説を読む

コトバンク for iPhone

コトバンク for Android