改訂新版 世界大百科事典 「翻訳機械」の意味・わかりやすい解説
翻訳機械 (ほんやくきかい)
人間が普通に使用する言語(コンピューター用のプログラム言語など人工言語との対比で自然言語という)を別の自然言語に翻訳する機械をいい,このような機械による翻訳のことを機械翻訳machine translation,自動翻訳と呼んでいる。
研究の歴史
翻訳がコンピューターでできる可能性があると初めて指摘したのはアメリカのウィーバーWarren Weaverであった(1946)。1955年にアメリカのジョージタウン大学,IBMの研究所その他でロシア語から英語への実験的な翻訳システムが作られ,以後アメリカではロシア語の科学技術文献翻訳の必要から政府の手で研究投資が進められ,ソ連,日本,ヨーロッパでも研究が進められた。しかし研究投資のわりに翻訳の成果がいっこうに上がらなかったことや,バー・ヒレルYehoshua Bar-Hillelの翻訳機械不可能論もあって,実用的な翻訳機械については疑問がいだかれるようになった。大統領科学顧問委員会は64年に報告書(ALPACレポート)を提出,近い将来翻訳機械が人間による翻訳と比べてコスト的に対応できるところまではいかないと報告した。これによって翻訳機械の研究は一挙に衰退した。
この壁をやぶったのは直接には翻訳を目的としない人工知能研究の分野での言語理解システムの研究であった。言語の理解はどのようにして行われるかについての簡単なモデルが作られた。従来の研究では,与えられた文を辞書と文法を頼りに翻訳してきた。その際の文法とは語の品詞とそれらの配列規則といった統語情報に基づく統語構造を解明することであった。人工知能的な方法では,それらとは異なり,格文法といわれるような単語の意味関係,文脈情報,文が対象としている外界の知識などをとりあげ,より拡張された意味情報の領域において推論などを援用しながら文の解釈を行うことが研究されはじめた。
近年,こうした言語理論とその利用法の発展,コンピューターの性能向上などにより,ある程度の訳文品質を持った翻訳機械が実現可能となった。一方,翻訳すべき文章量の増大,コスト的に人手による翻訳が高価になってきたことなどにより,翻訳機械に対する要求は高まってきた。これを受け,機械翻訳システムの研究開発が再び活発化し,80年代中ごろには一部のメーカーより機械翻訳システムが市販された。
機械翻訳の方法
機械翻訳には種々のレベルがある。これを図に示す。最も簡単なものはアルファベットを書きかえるもので,たとえば,漢字や仮名文字をローマ字に直す場合がこれにあたる。次のレベルは単語を翻訳するもので,これは辞書引きを行うことにあたる。〈Good morning〉を〈おはよう〉と訳す場合などもこれに入れてよい。次のレベルは文の構造の変換を中心とするもので,とくに日本語と英語の場合には必要欠くべからざるものである。たとえば英語の構文のS+V+O1+O2に対しては,日本語の文構造として〈SはO1にO2をV〉を用いる。したがって与えられた文の各単語の品詞と文中での役割を明らかにしなくてはならない。これを構文解析といっている。
構文解析は種々の困難な点を含んでいる。たとえば,〈I bought a car with four wheels.〉〈I bought a car with four dollars.〉の二つの文で,最初の文におけるwithという前置詞はcarを修飾するのに対して,第2の文では前置詞はboughtを修飾する。これは,buy,car,wheels,dollarsという単語のもつ意味関係を明確にすれば解決できる。また,〈黒い帽子をかぶった女の子〉という文が与えられたとしよう。この時〈黒い〉はどの単語を修飾していると考えることができるだろうか。〈黒い〉は〈帽子〉を修飾しているとも,〈女の子〉を修飾しているとも考えられる。あるいは,〈黒い女〉であるかもしれない。〈女の子〉は1語とも,また〈……という女の生んだ子ども〉とも解釈される。このように多くの解釈が成り立つが,そのうちどれが正しいかは単語のもつ意味関係を調べても解決できず,この文が発話された環境,あるいは文脈の情報が利用できねば決定できない。話のなかで指しているのが,色の黒い娘さんであるのか,帽子が黒いのかの情報を,なんらかの方法(見ているか,知っているか)であらかじめもっている必要がある。このように,文の解釈,あるいは理解にとって,言語情報だけでなく,文外の一般的な知識が必要となる。
このように文をできるだけ詳しく解析して,英語とか日本語といった個別言語になるべく関係のない共通の形をした内部表現に直す。これを中間言語表現といっている。そこから出発して,解析とは逆に言語の合成を行う。この合成も意味レベルの合成からはじまって,構文合成,形態素合成まで順次ステップをたどって訳文を出す。翻訳における言語間対比,あるいは入力言語から出力言語への橋渡しは図のできるだけ深いところで行うのがよいとされているが,すべての言語に共通した中間言語表現を求めることは難しく,意味による翻訳のレベルで翻訳すべき〈言語対〉の特質を利用することにより翻訳の質をあげる努力がなされる。
機械翻訳をまったく自動的に行うことは非常に難しいので,コンピューターがわからないところについては人間が助けざるをえない。人間が援助する方法としては,原文の難しいところを書き直したり,修正したりする前処理,単語の訳のわからないとき,構文解析がうまくできないときや,多重の解析が生じる場合の指示や選択,さらには翻訳された文を修正する後処理などがある。
現状と将来
機械翻訳の使用される分野としては,技術資料の翻訳や商用手紙文の素訳などがある。また外国のデータ・ベースや情報検索システムの活用を機械翻訳を間に入れて行うこともこれからの大きな分野となるであろう。海外から入ってくる各種のニュースや情報を迅速に翻訳し,関係方面に配布する仕事にも機械翻訳が必要とされる。機械翻訳の用いられる市場は今後非常に大きく広がっていくと考えられている。
執筆者:長尾 真
出典 株式会社平凡社「改訂新版 世界大百科事典」改訂新版 世界大百科事典について 情報