パターン認識(読み)ぱたーんにんしき(英語表記)pattern recognition

日本大百科全書(ニッポニカ) 「パターン認識」の意味・わかりやすい解説

パターン認識
ぱたーんにんしき
pattern recognition

現実の世界からの視覚的・聴覚的な刺激信号である文字、図形、映像、音声などのパターン情報を見て、これを既知の文字、幾何学的図形、風景中の事物、音韻などと対応づけ、識別すること。たとえば、手書きや印刷された文字を受けてこれがなんという文字であるかを識別する文字認識や、話声を聞いてなんという単語が発声されたかを識別する音声認識などがある。より一般的には、受け付けたパターン情報を、与えられた判定基準に基づいて、それが本来属すべき(既知の)カテゴリーに対応づける操作のことをパターン認識という。

 生体のパターン認識機構については、生物学、生理学、心理学的実験などが行われている。視覚、聴覚、触覚、味覚、嗅覚の五感にかかわる神経細胞の機能や役割、その特性が解明されつつある。視覚、聴覚の仕組みを模したセンサーに加えて、味覚、嗅覚の仕組みに学んだセンサーも開発されるようになった。しかし現状ではいまだ解明されていない点も多く、認識機構全体にわたる指導的理論の確立はみられない。

 工学的には、コンピュータなどによる認識機能の実現方法の開発が主要な目標である。既存のコンピュータの機能、構成に適したアルゴリズムの開発や、パターン認識に適したコンピュータの構成法、さらにはパターン認識の仕組みを簡略化して組み込んだ専用機器なども研究されている。コンピュータは数値計算などには非常な威力を発揮するが、人間が五感を通して容易に実現するパターン認識をまねることはむずかしい。人間のパターン認識の能力はきわめて優れているが、コンピュータにとってはもっとも苦手な処理の一つである。

[加藤俊一・棟上昭男]

歴史

工学的なパターン認識の研究は、コンピュータが使われだした1950年代から始められ、文字読取り装置や音声タイプライターの基礎的な試みがなされた。日本での手書き数字の郵便番号自動読取りや、アメリカでの数字音声認識装置はもっとも早く実用化した技術の一つである。各種の文字読取り装置(OCR)は1970年代に入って実用化が進み、認識対象も印刷文字から手書き文字へ、数字、アルファベット片仮名から漢字へと広がった。

 1970年代に入り、より複雑な対象として写真などの一般の画像の処理と認識、連続音声の認識の問題が研究されるようになった。国土情報処理への応用では、ランドサット画像や航空写真でのリモートセンシングによる土地利用状況の解析、軍事面では標的の形状認識や自動追尾などの技術も実用化された。

 1980年代には三次元の世界の認識への応用も活発になり、視覚機能をもったロボットの実用化も進んできた。また、認識の内容もパターン情報の分類、識別にとどまらず、パターンの構造解析や人工知能的色彩の強いパターン理解の研究も盛んである。

 1990年代以降は、固定的、一義的な判定基準に基づくカテゴリー分類ではなく、利用者ひとりひとりの興味、関心、嗜好(しこう)や、そのときどきの意図などの文脈に基づいて判定基準を柔軟にする仕組みも研究されるようになった。このような観点からの研究は、感性情報処理ともよばれ、情報処理分野のみならず、商品企画、製品設計などの分野でも盛んになってきている。

[加藤俊一・棟上昭男]

基本原理と技術的課題

工学的なパターン認識の過程をやや詳しくみると、「対象パターンの観測(入力)→前処理→特徴抽出→判定」の四つのステップに分けられる。実際のパターン認識では、既知のパターンや基準(標本パターンとよぶ)とまったく同じものが観測されるとは考えにくい。たとえば、観測装置(カメラなどの画像入力装置、マイクロホンなどの音声入力装置)で入力する場合、観測時に雑音(機器ノイズ)が重畳する。また、文字を記入した用紙上の汚れや、マイクロホンの周囲の環境雑音など、観測すべきパターンにも雑音が重畳している。このような理由から、観測されたパターンから本質的な情報を抽出しやすくするために、雑音除去などの前処理が必要とされる。

 一般に、文字や音声などのパターンをコンピュータ内部で表現すると、そのデータ量は非常に大きくなる。この場合、パターンをそのまま扱うかわりに、そのパターン特有の性質を表現する比較的少数の数値や記号の組で代用して処理する。これを特徴パラメーターとよぶ。特徴パラメーターは、認識する対象や目的によって異なる。たとえば、Aさんが発声したある単語に対して、それがなんという単語であるかを識別する場合(別の単語と区別する単語認識)と、だれが発声したかを識別する場合(Bさんの声、Cさんの声などと区別する話者認識)では、抽出する特徴パラメーターは、前者は母音の周波数と強さ、後者は音声波形に注目して定義される。対象や目的に応じてどのように特徴パラメーターを定義するかは、パターン認識の重要な研究課題である。特徴パラメーターに基づいて入力パターンがどのカテゴリーに属するか、既知の基準と比較して判定する。パターン認識における判定では、前述の特徴パラメーターの選択がむずかしいうえに、判定基準の与え方や判定のアルゴリズムが複雑で、人間にすら判定基準が明確にいえない場合がある。たとえば、人間は、上手に書いた「あ」も下手に書いた「あ」もともに「あ」と判定できるが、これを明確な判定基準として示すことはむずかしい。単純な数値の比較だけではない高度な判定のメカニズムの実現も、パターン認識機能実現のための重要な課題である。

 このようなパターン認識を発展させた技術として、パターン理解pattern understandingがある。パターン理解の仕組みでは、対象群の種々の特徴を統計的に分析するなどして、対象群にあわせて判定する基準を自動的あるいは半自動的に学習する機能をもつ点が特徴である。

[加藤俊一・棟上昭男]

応用分野

パターンにはいろいろな種類があり、パターン認識の応用範囲も広い。現実の物理的な世界からの直接的な刺激に基づくわれわれの五感に結び付いたパターンとして、文字、図形、映像などの空間的なパターンや、音声、動画のような時間的なパターンなどがある。また、抽象的なパターンとして、各種の測定データから求められる交通状態のパターン、経済動向パターンなどが考えられる。

 工学分野では、(1)音声パターン、(2)文字、図形、写真などの二次元パターン、(3)三次元での物体の配置、(4)ランドサット画像のようなマルチバンドの画像パターン、(5)交通状態や温度分布などを対象とするパターン計測などの分野への応用がみられる。また、近年では、(6)個人認証(バイオメトリクスbiometrics)のための認識技術の研究も進んでいる。応用例のいくつかを次に紹介する。

[加藤俊一・棟上昭男]

音声認識

音声へのパターン認識の応用としては、音声認識と話者認識がある。音声認識は、音声信号のなかからことばの意味内容を自動的に抽出することである。単語単位にくぎって発音する場合の単語音声認識、自然な状態で話した場合の連続音声認識などが研究されている。単語音声認識は工場などでの機械の制御や、電話での質問応答システムに利用されている。また、最近では、連続音声中のストレス(アクセント)の置き方や発話の時間変化の特徴を分析して、話者の心理状態を推定する技術も開発されてきた。

[加藤俊一・棟上昭男]

文字認識

ワードプロセッサーやパーソナルコンピュータの普及により、始めからコンピュータ処理できる(機械可読)文字コード主体の文書が増えてきている。しかしながら、紙の上に印刷あるいはメモ書きされた文字を、コンピュータ処理したいという需要も依然多い。

 手書き数字の郵便番号自動読取りは、もっとも早く実用化された技術の一つであるが、これは、定められた枠内に10種の数字だけを許すことで成功したといえる。その後、文字読取り装置の研究、実用化が進み、印刷された漢字や手書き文字なども、実用的な精度で認識ができるようになってきている。

[加藤俊一・棟上昭男]

リモート・センシングとパターン計測

リモート・センシングにおける画像解析では、たとえば既知の性質の土地の画像領域を探索すべき典型的な実例として与え、これと同様の性質(赤外線反射率などの特徴パラメーター)をもつ領域を自動的に捜し出すなどの処理形態が多い。顕微鏡画像での形状認識による血球の計数や、溶鉱炉などの装置の温度分布パターンによる温度管理などにも、認識技術が利用されている。

[加藤俊一・棟上昭男]

画像理解

コンピュータの処理能力の飛躍的な向上により、出現する記号の形状やサイズの多様な電気回路図、機械製図、プラント図、地図などがパターン認識可能な対象となってきた。たとえば、手書きの電気回路図をパターン認識すると、素子、部品の接続関係や何個使用されているかをコンピュータで管理できる。また、認識結果を、設計された回路が妥当かを検査する理論シミュレーターの入力としたり、手書きの図面を清書して出力することも可能となる。

 二次元の画像だけでなく、三次元空間での機械部品や工具の形状、配置を識別する研究も盛んである。テレビカメラなどから入力された風景のなかから、既知の物体の一部を発見し、それらの遮蔽(しゃへい)関係から物体相互の位置関係を理解する。このような技術は、ロボットがその周囲の状況を自動的に認識し制御するための基礎となり、産業用ロボットをより高度化するために不可欠である。

[加藤俊一・棟上昭男]

バイオメトリクス

近年、個人認証の新しい方法として、他人が盗むことの難しい、本人の生体的な特徴を用いる手法(バイオメトリクス)が実用化されてきている。たとえば、話者認識は、音声信号に含まれる本人特有の情報を利用して個人識別を行うものである。筆跡認識は、署名などの手書き文字に現れる書き癖の特徴を検出して個人識別を行うものである。このほか、指紋、掌紋(しょうもん)、手のひらの静脈、虹彩などの身体そのものを利用する場合もある。

人工知能技術との関係

基本原理で述べたように、パターン認識の過程は、入力されたパターンを、事前に用意したいくつかのカテゴリーのいずれかに分類することである。ここでの分類の基準や特徴抽出の機構は固定的で、パターンの信号や、信号に近いレベルでの特徴パラメーターのみをおもに対象としていた。したがって、実際に認識できるパターンはきわめて限定されることが多く、パターンの変動が大きい場合や判定基準が複雑な場合には対処できない。このような理由から、パターン認識での「対象パターンの観測→前処理→特徴抽出→判定」の固定的な処理の流れに対して、学習やその結果に基づく適応化機能により、処理の進みぐあいに応じて対象パターンの記述の枠組み(モデル)を修正、構築できるパターン理解の概念が提唱された。パターンの入力信号だけでなく、それから得られる対象パターンの構造や意味的な情報も、利用可能にしようとするものである。

 狭義の人工知能(AI)研究は、おもにパターンの意味表現や知識表現を対象としている。したがって、パターン理解は、実際の信号レベルの入力、処理と、人工知能における知識や意味表現と利用の間を埋めるものと位置づけられる。

[加藤俊一・棟上昭男]

『坂井利之著『情報基礎学――通信と処理の基礎工学』(1982・コロナ社)』


出典 小学館 日本大百科全書(ニッポニカ)日本大百科全書(ニッポニカ)について 情報 | 凡例

ブリタニカ国際大百科事典 小項目事典 「パターン認識」の意味・わかりやすい解説

パターン認識
パターンにんしき
pattern recognition

画像や音声データを構成する要素間にひそむ,ある一定の原理に従ったまとまり(パターン)を見つけ出すための情報技術。画像に写っているものを自動的に識別する画像認識(→画像理解システム)や,画像中の文字を読み取る文字認識,音声データから発声内容を自動的に識別する音声認識などがある。識別に用いるパターンは多様性が高く,先験的な知識に基づく理論によって規定できないことが多い。そのため,まず正解を明示したデータを収集した訓練用データセットを構築する。次に,訓練用データセットを分析してパターンを認識するために使用する特徴と特徴抽出のためのアルゴリズムを選択し,最後に,機械学習を用いて,特徴からパターンを識別するためのアルゴリズムで使用するパラメータ(→媒介変数)を自動推定させる。通常,パターンはある確率モデルによって規定されると仮定し,データから確率モデルのパラメータを統計的手法を用いて推定する。かつて認識対象のどのような特徴を用いるかはシステムの品質を左右する重要な設計課題であったが,ディープラーニングの発展により,システムに基本的な特徴を与えておけば,学習アルゴリズムが認識に必要な特徴の最適の組み合わせを自動的に見つけるようになった。(→計算機科学コンピュータビジョン

出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報

今日のキーワード

マイナ保険証

マイナンバーカードを健康保険証として利用できるようにしたもの。マイナポータルなどで利用登録が必要。令和3年(2021)10月から本格運用開始。マイナンバー保険証。マイナンバーカード健康保険証。...

マイナ保険証の用語解説を読む

コトバンク for iPhone

コトバンク for Android