パターン照合ともいう。入力パターンの中から,指定されたパターンと同じものを探すこと。実用的には記号系列のパターンマッチングと,画像や音声のパターンマッチングに大別される。前者は,文章のような長い記号列から,指定された記号列(通常は短い)を探すことである。たとえば,〈There are apples and oranges.They are sold……〉という文章が入力されているとき,〈th〉を指定すれば,二つの文の最初の〈Th〉を見つける。パターンの指定は具体的な記号列だけでなく,抽象的に指定することもできる。たとえば〈**〉によって,なんでもいいから同じ文字が二つ続く部分(ここではapplesのpp)を探させることもできる。さらに,〈s|〉によって,sの後にブランクなどアルファベット以外が続く部分を指定でき,applesやorangesのような語尾のsだけを見つけることができる。記号列のパターンマッチングは,ワードプロセッサーによる編集のために用いられている。さらに,文書の中から必要な情報を検索したり,機械翻訳のような自然言語処理にも不可欠な機能である。
画像のパターンマッチングは,与えられた画像と,指定された画像パターン(モデル)を重ね合わせて,どれくらい一致するかを調べる。マッチングを行う画像とモデルが同じ大きさの場合と,異なる場合がある。いずれも,両画像とも,白黒画像(二値画像)であることが多い。両画像の大きさが同じ場合の代表例は,印刷文字認識である。対象文字のモデルパターンを用意しておき,入力された文字パターンを重ね合わせてみるのである。いずれの画像も背景が0,文字部分が1の二値画像である。画像のパターンマッチングでは,二つのパターンが完全に一致することはまれである。印刷条件や画像の入力条件などによって,入力文字はモデルパターンと一致しない部分が生じる。文字認識では,原則的には最もよく一致するモデルパターンを認識結果とする。しかし,一致しない部分が大きければ,認識不能とする。
入力画像モデルパターンの大きさが異なる代表的な例は,既知物体の位置決めである。既知物体のモデルパターンと,入力画像の一部をマッチングするのである。つまり,モデルパターンの位置や方向を変えて入力画像と重ね合わせ,最も一致する部分を探すのである。これは,ICの電極のはんだ付け(ボンディング)のための電極の位置決めなどに実用化されている。画像のパターンマッチングは,二つの画像の各点が同じかどうかを調べなければならないので計算量が多い。そこで,この処理を高速に行う専用装置を用いることが多い。
音声認識には,一次元のパターンマッチングが使われている。この場合には,モデルパターンと入力音声の間には,時間的な伸縮のずれがあるので,少しのゆがみを許すような方法(ダイナミックプログラミング)が用いられている。
→画像処理 →パターン認識
執筆者:白井 良明
出典 株式会社平凡社「改訂新版 世界大百科事典」改訂新版 世界大百科事典について 情報
記号処理において使われる用語で、データや文字列を検索する際に特定のパターンを検出する手法のこと。プログラミング言語では構造をもったデータどうしのマッチングにも使われる。
文字列のパターンを記述するための正規表現が決められている。以下に一部を示しておく。
. (ピリオド)任意の1文字
*(アスタリスク)直前の文字の任意個の繰り返し(.*と書くと任意の長さの文字列にマッチする)
[xyz] [ ]内のどれかの文字(この例ではxかyかz)
[a-z] 文字範囲の指定(この例では任意のアルファベットの小文字)
たとえば
[a-c].*x
はa,b,cのどれかで始まり、xで終わる文字列(abx, b123x, cdxなど)とマッチする。
Prolog(プロログ)は文字列ではないが、項とよばれる構造のパターンマッチングで呼び出される言語である。大文字で変数を表し、小文字が定数なので
p(X,z,X)
という項は
p(a,z,a),p(b,Y,b), p(q(a),z,q(a))
などとマッチする。
[中島秀之 2019年9月17日]
年齢を問わず、多様なキャリア形成で活躍する働き方。企業には専門人材の育成支援やリスキリング(学び直し)の機会提供、女性活躍推進や従業員と役員の接点拡大などが求められる。人材の確保につながり、従業員を...
10/29 小学館の図鑑NEO[新版]動物を追加
10/22 デジタル大辞泉を更新
10/22 デジタル大辞泉プラスを更新
10/1 共同通信ニュース用語解説を追加
9/20 日本大百科全書(ニッポニカ)を更新