今さら聞けない自動翻訳AI、自然に訳せるDeepL翻訳とは?
普段、外国語を翻訳する時にどのツールを使っていますか。Google翻訳しか使ったことが無いという方も多いかもしれません。
選択肢の一つとしてぜひ覚えてほしいのがDeepl翻訳です。Deepl翻訳は完璧ではないものの、自然な翻訳を行います。Deeplを上手に活用する方法を紹介します。
この記事の目次
Deepl翻訳とは
DeepLとは、ドイツの企業DeepLが開発した翻訳する人口知能です。29言語に対応しており、下記公式サイトから使えます。
Deeplの特徴
Deeplは深層学習(※1)を用いて開発されています。深層学習とは、人間の脳細胞を模したニューラルネットワークに大量のデータを与えて 、機械に学習させる手法のことを指します。翻訳以外の分野では画像認識や音声認識に用いられています。Googleの画像検索サービスやAppleのSiriもこの技術を用いて作られています。
ニューラルネットワークを用いた翻訳のことをニューラル機械翻訳と言います。ニューラル機械翻訳は入力された文章全体をひとまとまりに認識し、前後の文脈から訳文を生成します。そのため前後の文脈に沿う自然な翻訳が可能になります。
Deeplが自然な訳文を作れるのは、AIに与える学習データにあります。Deeplは翻訳事業を起す前に、Web上のデータを収集する事業をメインに行っていました。データ収集事業で培った経験がDeeplのAIの根幹となる訓練データの収集に生きたため、高い精度で自然な翻訳を行えるAIが作れたのです。
Google翻訳との比較
Google翻訳も、ニューラル機械翻訳が用いられています。しかしGoogle翻訳は生成される文章の自然さという点でDeepLに劣ると言われています。
ことわざを例に見てみましょう。「藪から棒(思いもよらぬことが唐突に起こること)」をGoogle翻訳とDeeplに入力してみます。
Google翻訳(画像)
DeepL(画像)
Google翻訳では藪から棒がそのまま藪から棒「stick from bushes」と直訳されているのに対して、DeepLでは「out of the blue(突然)」という英語のイディオムを用いて翻訳されています。豊富な語彙を持つことがDeepLの特徴です。
DeepL価格表
DeepL | 無料版 | Starter | Advanoed | Ultimate |
---|---|---|---|---|
セキュリティ | × | 〇 | 〇 | 〇 |
テキスト翻訳 | 5000字いない | 制限なし | 制限なし | 制限なし |
文書ファイル翻訳 | 5000字以内の文字数制限+編集不可 | 5ファイル/月 | 10ファイル/月 | 100ファイル/月 |
語調の切り替え | × | 〇 | 〇 | 〇 |
用語集(※1) | 用語集1登録可能ペア10 | 用語集1登録ペア5000 | 用語集2000登録ペア5000 | 用語集2000登録ペア5000 |
チーム管理(※2) | × | 〇 | 〇 | 〇 |
シングルサインオン(※3) | × | × | 〇(35人以上) | 〇(35人以上) |
翻訳支援ツールへの組み込み | × | × | 〇 | 〇 |
一カ月当たりの価格(月払い/年払い) | 1200円/750円 | 3800円/2500円 | 7500円/5000円 |
(※1)特定の語句と翻訳のペア設定
(※2)企業でDeepLを使う際の一元管理システム
(※3)団体内での一括ログインシステム
※は主に法人向けサービス
DeepLを使う上での注意点
どのような文章でも正確に翻訳できるAIはまだ存在しません。さらに日本語はヨーロッパ系の言語と文の構造が違うため、機械にとっても翻訳することは難しいです。
また、ニューラル機械翻訳によって生成された文章は、人間が読みやすい自然な文章であることが多いため、誤訳に気が付きにくいです。また文章としての体裁を整えるため表現を一部省略することもあります。
正確な翻訳をするためには必ず人間の手直しが必要です。
誤った学習をしている可能性
DeepLは絶えず学習し、日々進歩しています。偏った訓練データを学習してしまうことにより、誤った訳が出力されることがあります。2022年5月にDeepLが「I’m sorry」を「アイム・ソーリー・ヒゲソーリー」と訳すバグが起こり話題になりました。
参考:ねとらぼ AI翻訳「I’m sorry」を「アイム・ソーリー・ヒゲソーリー」と誤翻訳 DeepLの豪快な誤訳が話題に
現在もDeepLの辞書内にその形跡が残っています 。ここまであからさまではないものの間違った表現を学習してしまっている単語が数多くある可能性が高いです。
一例として「それはいのなかのかわず」という文章を翻訳にかけたものを紹介します。
「it is no use crying over split milk(覆水盆に返らず)」と出力されてしまいました。故事成語やことわざのような回りくどい表現は、必要がない限り簡単な日本語で入力することが大切です。
情報漏洩の危険性
DeepL翻訳を利用する際に気を付けなればならないのが、セキュリティです。無料版でDeepLに入力された文章やPDFの情報は、訓練データとして再利用されます。
有料版では翻訳完了時に消去され、訓練データへの再利用は行われません。
DeepLを上手に使うためのテクニック
逆翻訳~言語知識が無くても訳が正確かどうか確かめられる方法~
出力された訳文が正しいのかどうかを判断するためには言語知識が必要です。しかし言語の知識が無くてもある程度訳が正確かどうか確かめる方法があります。
それは逆翻訳です。逆翻訳とは一度翻訳した文をもう一度翻訳をかけることです。
逆翻訳した結果、元の日本語と意味として通じていれば、正確な文章である可能性が高いです。言語の知識が無い場合に役に立ちます。
実際のニュース記事を用いて行ってみます。
参考:産経ニュース「台風17号、小笠原に最接近 本州からは離れる見込み(9月27日)」
逆翻訳前
逆翻訳後
逆翻訳前後の日本語の差を見てください。台風の中心気圧が992ヘクトパスカルであることが2回繰り返されている点がおかしいです。そのため、完璧な翻訳を目指すのならこの部分を消去する必要があります。ただし、全体の文章の意味としては翻訳前後で変わっていません。
このように翻訳前後で意味が変化していなかった場合は翻訳が成功したとみなせます。
英→日翻訳での注意点~文調の混合に注意~
実際のニュース記事をDeepLで翻訳してみます。
BBCNEWS「iPhone in India: Apple makes new handset in India in shift from China」
生成された翻訳に、「ですます調」と「である調」が混ざっています。長文を翻訳する必要があるときは文調を整える作業が必要です。
また「’zero-covid’polices」をゼロコロナ政策ではなくゼロコビット政策と翻訳しています。意味は通じますが、日本での呼び名と海外での呼び名が若干違うものには注意が必要です。
日→英翻訳での注意点~主語を明確に示す~
日→英の翻訳をする際に気を付けなければならないのは、入力時に主語と述語をはっきりとさせることです。英語と比べ日本語は主語の省略が多いです。会話文は主語を省略させることが多いため、翻訳時に違う主語になることがあります。
チャットのような会話文でDeepLを用いる際は主語と述語をはっきりさせることが大切です。誰が何をするのかを明確に書いてください。
簡単な例を挙げます。「How do you get to the station?(あなたは駅までどうやって来ますか?)」という問いに対して、DeepLを用いて「家から駅まで歩く必要があります(入力)」と返事をしたとします。この入力では主語がはっきりとしていなかったため、訳文の主語がyouで出力されてしまっています。
これは「私は家から駅まで歩いていく必要があります」と修正することで解決します。英語の教科書の訳文のような日本語を意識すると良いでしょう。
長すぎる主語や述語が複雑になる場合は、それらに当たる部分をAやBに置き替えてみてください。後から主語だけを翻訳すると意味の通った文章が生成できます。
例として「男は笑いながら走っている大きな犬を追いかけた」という文があります。笑っているのが男なのか犬なのかはっきりしていません。主語と述語をAとBと置き替えて翻訳してみます。
この程度の量の文章の場合は、句読点を用いて区切ることにより同様の訳文が得られます。しかし複雑な出来事を説明したい場合はこの主述の置き換えが生きるので、ぜひ覚えてください。
また、DeepLでマイナー言語は英語を起点に翻訳されています。日本語をハンガリー語に翻訳する際には、内部的に「日本語」→「英語」→「ハンガリー語」というような処理をしています。そのため、最初の入力である日本語がより肝心になります。
まとめ
今回はDeepL翻訳とそれをうまく活用する方法についてまとめました。
DeepLを使う上で注意点
- 機密情報を無料版で翻訳しない
- 誤った学習をしているかもしれないことを念頭に置く
上手く活用するための方法
- 逆翻訳
- 英→日で文章を作成する際には文体を整える必要がある
- 日→他言語の際は主語と述語を明確にする
- 主述の置き換え
日本語→他言語で重要なのは、出力の日本語を簡潔にすることです。分かりづらい日本語は、外国語に訳したときに分かりづらい外国語として出力されてしまいます。
DeepLを過信せずに入力する文章をより分かりやすくすることが大切です。そして、使用者に言語能力があれば、翻訳の精度はより高まります。DeepLを上手に活用し、情報発信や情報収集に活かしてみてください。