|
|
機械翻訳とは、ある自然言語を別の自然言語へ機械的に変換する技術をいう。 例として、英語の文章を入力するとそれを翻訳した日本語の文章を出力する英日翻訳ソフトウエアなどがある。
| Table of contents |
|
2 機械翻訳の欠点 3 代表的な翻訳ソフトウェア、翻訳サイト 4 関連項目 5 外部リンク |
現在広く使われている機械翻訳の原理は次のとおりである。
言語 X で書かれている文を言語 Y に翻訳する場合:
機械翻訳の原理
"I have a pen."この文を解析して得られる構文木は次のようになる:

ここで、以下のような辞書を使って英語の単語を日本語の単語に起きかえる:
| 英語 | 日本語 |
|---|---|
| I | 私 |
| have | 持っている |
| a | - (空白) |
| pen | ペン |
構文木は次のようになる:
(S (NP (pron 私)) (VP (verb 持っている) (NP (det -) (noun ペン))))しかしまだ語順が正しくないし、助詞もない。 ここで構文木に対して以下のような規則を適用して変換をおこなう:
(S (NP (pron 私)) は (VP (NP (det -) (noun ペン)) を (verb 持っている)))ここから、以下のような翻訳文を生成できる:
"私はペンを持っている。"これは非常に単純な例である。 実際には英語の have は複数の語義をもつので、語義の曖昧性解消をしなければ単純に「have → 持っている」という変換をすることはできない。 また、モダリティの考慮や、照応の解決、敬語の扱い、自然な言いまわしの文の生成など実用的な翻訳ソフトウエアをつくるためには多くのことを考慮に入れる必要がある。
現在のところ、機械翻訳はほとんど、非常に表面的な文字列の操作のみによって実現されている。そのため文意を正しく解釈した変換が行なわれないことも多い。また、翻訳の対象となる文章はマニュアルや新聞記事などの平易な文体で書かれているものが主であり、小説や会話などはまだ正しく翻訳できないものがほとんどである。
機械翻訳の欠点
代表的な翻訳ソフトウェア、翻訳サイト
関連項目
外部リンク