日経サイエンス  2006年7月号

ここまできた機械翻訳

G. スティックス(SCIENTIFIC AMERICAN編集部)

 コンピューターを使って翻訳する「機械翻訳」は人工知能の領域の中でも,開発がかなり遅れている分野だ。固有名詞や技巧を凝らした文句がいくつか出てくるだけで,たちまち正しい文意をくみ取れなくなる。しかし,ここ数年,新しい研究アプローチによって機械翻訳の研究に再び活気が戻ってきた。

 

 異なる2つの言語で記された文章について,それぞれどの語句と,どの語句が意味的に対応する可能性が高いのか,その確率を求め,最も高いものを選んで翻訳文とする手法だ。膨大な文章をコンピューターに読み込んでデータに統計的処理をして結果を出す,いわば“力業”の手法だが,これによって「機械翻訳が人の能力にとうとう追いついてきた」と専門家はみている。

 

 最近,マイクロソフトはこうした統計的手法を主に使ってロシア語やアラビア語,中国語など12カ国語版のユーザー支援用ウェブサイトを作った。それらの訳文には後で手を加えていない。「かなり粗削りな部分もあるが,全体としては良いできだ。統計的手法を取り入れたシステムは,私たちが従来使ってきた規則ベースのシステムと同じか,それ以上の水準まで来ている」と自然言語処理部門の主任研究員,リチャードソン(Steve Richardson)は話す。

 
 
再録:別冊日経サイエンス216「AI 人工知能の軌跡と未来」

原題名

The Elusive Goal of Machine Translation(SCIENTIFIC AMERICAN March 2006)

サイト内の関連記事を読む

キーワードをGoogleで検索する

機械翻訳シストランキャンディードベイズ理論ランゲージ・ウィーバー