第67回 「機械翻訳に少し手を入れただけのような仕上がりが多く…」①
こんにちは。今回は、機械翻訳について考えてみたいと思います。AI(人工知能)をどんどん取り入れる方向に進んでいる翻訳業界ですが、現時点で言えば、やはりまだ限界があり、金融翻訳はその限界が強く感じられる分野の一つである…と思います。
しかし大変な勢いで進化を続けるAIは、我々人間の翻訳者のすぐ後ろに迫っており、彼らと同じようなレベルの翻訳をあげていたら、切られるのは当然ながらワード単価の高い(とほほ・・)人間の方でしょう。
つい先日のこと、ある翻訳会社から受けた案件の話です。担当者さんいわく、某クライアント(金融関連の企業)から、ある“前置き”つきで依頼が来たとのこと。
「最近は機械翻訳の能力が格段に向上したためか、機械翻訳に少し手を入れただけのような訳文が増えており…」
という前置きです。言うまでもなくこれは、「だから、人間らしく読みやすい翻訳をきっちり仕上げてくれ」ということ。
人間であるわたしがやるんだから、普段通りでいいんじゃないの、と思いながらも、妙にハードルが上がった感がありましたが、「ザ・人間翻訳」と言える仕上がりを目指してがんばりました。
しかし正直、最近ではわたしも機械翻訳を利用することが多くなっており、特に調査でネット上の記事を読む時などは、一気に翻訳させて、日本語の方をざっと読む、という使い方をしています。日本語ネイティブにとっては、一つ一つに意味のないアルファベットの羅列よりも、一覧性の高い漢字の方が内容を把握しやすいのは当たり前の話で、多少(どころか壊滅的に)変てこな翻訳であっても、重要な部分を見分けるきっかけくらいにはなるわけですね(そこで改めて英語をきっちり読む、という)。
わたし自身は新しいモノ好きで、スタートレックに出てくるような「万能翻訳機」が早くできないかなぁと望みつつ、一方では、翻訳の仕事を続ける限り、テキトーにオバカさんのままでいてほしい、なんて矛盾したことを考えています。できれば使いたい、でも100%使い物になってくれては困る、という気持ちで日々機械翻訳とつき合うなかで、今の機械翻訳のどこが優れ、どこがオバカさんなのか、何となく分かるようになってきました。
機械翻訳はまさに日進月歩ですから、今の認識が来年も通用しない可能性はありますが、とりあえず2022年6月時点の機械翻訳の特徴を知って、機械諸氏に追いつかれないようにするヒントを考えてみたいと思います。(わたし自身、機械翻訳の仕組みはあまり分かっていませんので、あくまでも言語を専門とする者としてのぼんやりとした「印象」です)
※現時点で最も評価の高いDeepL氏を主なライバルとします。DeepL氏は、具体的な事実を羅列しただけのニュース記事程度ならかなりのレベルで訳してきますので、以下は主に、複雑な分析プロセスを説明した文章や、修辞的技巧が方々に使われているような文章での話、と受け取ってください(特に金融翻訳ではありがちです)。
1)ときどき、恐ろしいほどすっ飛ばす
あれ、なんなんでしょうね。DeepLを使ったことのある方ならお気付きと思いますが、複雑な文章でなくとも、全部で10文あったとして、うち3文をすっ飛ばすとか、平気でやってくるんですよね。「ごく稀に」ではなく「時々」そういうことが起こるので、ソース言語がまったく理解できない人が、趣味や遊びでなく公式文書等で使ったらどうなるのか、考えただけで恐ろしいです。
機械だからこそ、抜けはゼロにしてほしいものですが、現時点ではなぜか無理なようです。しかし人間は、気をつけさえすれば抜けをなくすことができます。気をつけないとダメですが。なので、気をつけるようにするしかありません(笑)。
※Google氏は、DeepL氏と比べると圧倒的に抜けが少ない、またはない気がします。
2)ときどき、否定を肯定で訳したりする
これも怖いです。もちろん単純な否定文はきっちり訳してきますが、少し複雑になったり、明らかな否定語が入っていない場合に、稀にポカをやらかします。思うに、機械翻訳諸氏は、後で述べるように「文脈を考慮」できないので、話の流れ上、明らかにおかしい場合でも、気にならないのでしょう。
3)バランスがよくない
DeepL氏は、時に素晴らしい表現をしてくることがあり、正直、これは参考にしたいところです。「うおー、そうくるか!」と叫んだことが、これまでに何度か。何千、何億もの文章をがつがつ読み込んで学習した成果が、こういうところに出てくるのでしょう。
ただそれも短い語句レベルの話で、その「うまい言い回し」が、周りの表現と合っていないことがあります。まるで高校生がたまたま高尚な表現を覚えて、それを使いたいがために無理やり小論文にねじこんでしまった…かのような。
ひどいときは、「ですます」と「である」が混ざっていたり。それくらい早く直せないものかと思いますけれど。
非常に堅い文章の中に、いきなり詩的な表現が混ざれば、誰でも違和感を覚えるものです。人が読んだ時にどう感じるかを考えながら、そのあたりの「バランス」をとることができるのも、人間ならではの能力でしょう。
4)文脈を考慮できない
2)や3)とも通じるところがありますが、「話の流れを勘案できない」、これが機械翻訳の最大の弱点である、と思います。
この話、長くなりそうですので、今回はここまでとさせてくださいね。次回をお楽しみに。
※皆、同じことを考えてしまうのか、つい最近、ハイキャリア編集部さんが「AI翻訳(機械翻訳)のメリット・デメリット」について書かれていましたね。こちらも参考にされると良いと思います。