日本窓口よりメムソースお役立ち情報ブログ

DeepLをMemsourceで活用し翻訳作業を効率化

Use DeepL on Memsource

欧州言語間の機械翻訳サービスとして以前から翻訳性能が良いとSNSで評判になっていたDeepLが3月19日に日本語と中国語に対応しましたが、6月16日には日本のユーザーも有料版のDeepL Proのサービスが利用できるようになりました。DeepL ProでAdvancedプランを契約すると月額換算料金2,500円で翻訳支援ツールから無制限にDeepLの翻訳が利用できます。

この記事では、MemsourceからDeepLをAPI連携で呼び出して翻訳するための設定手順と翻訳上のコツを紹介します。

1. DeepL Proを契約する

MemsourceからDeepLを利用するには、はじめにDeepL Proの利用を申し込む必要があります。DeepLでは30日間の無料体験が用意されています。たとえば個人ユーザーの場合、下記のURLからAdvancedプランの「30日間の無料体験」ボタンをクリックして申し込みます。なお、無料体験の場合でもはじめにクレジットカードの番号を入力する必要があります。

https://www.deepl.com/pro#single

正常のユーザー登録が完了すると「ご利用中のDeepL Proアカウント」画面においてMemsourceで利用する認証キーを取得できます。


画像の下部の赤枠で囲んだ部分が認証キーです。あとでMemsourceの設定画面でこの認証キーを使います。この認証キーを他人に知られるとアカウントを利用されてしまいますので、他人に知られないように注意してください。

2. Memsource 側で機械翻訳エンジンとしてDeepL Proを登録する

続いて Memsource 側で機械翻訳エンジンとして DeepL を API 経由で呼び出せるように設定します。Memsourceの環境設定画面で「インテグレーション」の項目として表示される「機械翻訳エンジン」を選択します。

https://cloud.memsource.com/web/setup/index

画面の下の方に表示される「機械翻訳エンジン」のカラムで「作成」をクリックします。

https://cloud.memsource.com/web/machineTranslateSettings/list

「機械翻訳エンジンを作成」ダイアログが表示されますので、「MTエンジンのタイプ」リストを開いて表示される選択肢の中から「DeepL」を選択します。

「DeepL」が選択されていることを確認できたら「作成」をクリックします。

「作成」をクリックすると画面がDeepLの設定ダイアログに変わります。

https://cloud.memsource.com/web/machineTranslateSettings/createDeepL

設定ダイアログに必要事項を記入します。「名称」はMemsourceのプロジェクト内でこの機械翻訳エンジンを示す名前として表示されますので、DeepLであることがわかりやすいような名称をつけると良いでしょう。

「APIキー」のテキストボックスには、この記事のはじめに説明したDeepL Proのアカウント画面に表示される「認証キー」をコピーして挿入します。

「通常に設定」チェックボックスをオンに設定すると、以後このMemsourceアカウントで生成するプロジェクトでデフォルトの機械翻訳エンジンとしてDeepLが設定されるようになります。

「保存」ボタンをクリックすると機械翻訳エンジンとして DeepL が登録され、API 呼び出しが正常に処理されることが確認できるとステータスが青色になります。

以上の設定により、このMemsourceアカウントでDeepL APIを呼び出せるようになりました。

3. MemsourceのプロジェクトでDeepLの機械翻訳出力を利用する

MemsourceのプロジェクトでDeepLの機械翻訳出力を利用したいときは、プロジェクトで使用する機械翻訳エンジンとしてDeepLを選択する必要があります。機械翻訳エンジンの選択はプロジェクトの新規作成画面の下記の赤枠で囲んだコラムで行います。

プロジェクトの機械翻訳エンジンとしてDeepLが表示されていればOKです。

実際に DeepL を使って翻訳してみます。ジョブを開いて各セグメントにカーソルをあわせると、DeepLの機械翻訳出力が画面右側のペインに表示され、利用できることがわかります。

4. DeepL の翻訳は文脈を参照するため分節の単位に注意する

ここから先はMemsourceからDeepL APIを呼んで翻訳する場合の注意点を述べます。

DeepLは文書ファイルの翻訳を行うときに、翻訳対象のセンテンスだけでなくその前後のセンテンスまで参照したうえでコンテキストに応じて訳文を変化させているようです。コンテキストを参照することで翻訳品質を向上させているわけですが、Memsource Editorで通常のようにセンテンス単位で分節されたファイルをDeepL翻訳すると、DeepLは前後のセンテンスを参照しなくなる(できない)ため、一般的に翻訳品質が劣化してしまいます。

一例として、MT 関連論文の紀要の英文和訳をセンテンス単位で行った場合とパラグラフ単位で行った場合の差分を以下に示します。線で消されている方がセンテンス単位での訳、下線付きの方がパラグラフ単位での訳になります。

この変更履歴ではセンテンス単位の訳文を基準としてパラグラフ単位の訳文がどのように異なるかの差分情報を示していますが、ひと目見ただけでもわかるようにセンテンス単位での訳文よりもパラグラフ単位での訳文の翻訳品質のほうが優れています。

この問題に対するひとつの対処方法は、Memsource Editor内でセグメントをJOINコマンドで結合してパラグラフにまでまとめたうえでDeepLの翻訳を行うことです。JOINで結合して生成したDeepLの訳文が結合しないセンテンス単位の訳文とどのように異なるかを示す差分ファイルは下記になります。JOINした結果、翻訳がパラグラフ単位で行われ、品質が改善されます。

例文の出典:

Guillaume Lample, Alexis Conneau Cross-lingual Language Model Pretraining

https://arxiv.org/abs/1901.07291

Memsource Japanのフェイスブックページ

いいね!を押す
Hiroki Kawano(河野弘毅)
Hiroki Kawano(河野弘毅)

機械翻訳コンサルタント。「JTFジャーナル」編集長(2011-2020)。Memsource Certified User。2012年からMemsourceを利用し、Memsourceの翻訳現場への導入と運用について豊富な経験を積んでいる。最近は各社が提供する機械翻訳エンジンをMemsourceに組み込んで運用するうえでのベストプラクティスの追求に関心を持っている。