ブログ

初心者のための機械翻訳ガイド

機械翻訳 - 機械翻訳とは?

品質に妥協することなく、翻訳にかかるコストと時間を削減する方法をお探しですか?でしたら、ぜひ機械翻訳をご活用ください。自信をもって機械翻訳をスタートして頂くため、弊社では、この急成長を遂げる翻訳テクノロジーを紹介するガイドブックを作成しました。

機械翻訳とは何か?

機械翻訳(MT)は、コンピューターソフトウェアによる自動翻訳です。MTによって、人間の介入なしで、または人間の翻訳者と一緒に(つまりポストエディットを加えることで)、テキスト全体を翻訳できます。MTの開発は50年代初頭にスタートし、それ以来長い時間をかけて進められてきました。現在、 MT市場の価値は1億3000万ドルから4億ドルと推定されています。テクノロジーが向上するにつれて、より多くの企業が、人間による翻訳をサポートしてローカライゼーションのプロセスの最適化を図るために、MTを導入するようになりました。

過去と現在:機械翻訳はどのように進化したか?

MTにはいくつかの種類があります。技術が進歩するにつれて、古いシステムは新しい技術に置き換えられています。

ルールベース機械翻訳(RBMT)はMTの祖先ともいえる存在です。現在はやや時代遅れになっています。RBMTは、言語の文法的および構文的な規則と表現法に基づいた機械翻訳です。RBMTは、原文の構造を訳文に結びつけ、原文言語と訳文言語のルールの分析に基づいて翻訳を生成します。専門家がルールを開発し、ユーザーが用語を追加してMTをオーバーライドすることで、品質を向上させることができます。

統計的機械翻訳 (SMT)はビッグデータの時代に始まりました。大量の翻訳済みテキストと統計モデルおよびアルゴリズムを使用して翻訳を生成する方法です。このシステムは、利用可能な多言語コーパスに大きく依存しています。特定のドメイン用にエンジンをトレーニングするには、平均200万ワードが必要です。つまり、大量の時間とリソースが必要になります。SMTは新しいテクノロジーによって急速に影が薄くなりつつあります。ですがドメイン固有のデータを使用する場合、特に技術、医療、および金融の分野では、SMTは現在でも高品質の翻訳を生成できます。

ニューラル機械翻訳 (NMT)は、ディープニューラルネットワークを使って構築された新しい手法です。NMTで使用されるネットワークアーキテクチャにはさまざまなものがありますが、通常、ネットワークは2つの要素に分割できます。入力文を読み取って翻訳に適した表現を生成するエンコーダと、実際の翻訳を生成するデコーダです。NMTにおいては、単語や文全体でさえ実数値ベクトルとして表されます。前世代のMTと比較して、NMTの翻訳は、より流暢で文法的に正確である傾向があります。総合的に見て、NMTによって、MTの品質は大きく前進しました。ですが珍しい単語や用語を翻訳する際には、過去の方法と比べ、NMTがやや劣っている場合もあります。

カスタム翻訳 vs 一般的な機械翻訳

機械翻訳エンジンは、さまざまな種類のデータでトレーニングされます。Google翻訳やMicrosoftTranslatorなどの汎用MTエンジンは、一般的な目的のために開発されており、特定のドメインまたはトピックのデータでトレーニングされていません。一方カスタムMTエンジンは、特定のデータでトレーニングされるため微調整ができ、より正確なMT出力が得られます。ですが、その分、価格も高くなります。カスタムエンジンか汎用エンジンかにかかわらず、翻訳結果を改善するためには、時々エンジンを再トレーニングする必要があります。

開発が進められていく中で、この再トレーニングのプロセスにも、改善がみられています。アダプティブMTでは、コンテンツに加えられた編集結果に基づき、機械翻訳システムがリアルタイムで更新されます。機械翻訳システムは学習し、そして改善され続けていきます。

機械翻訳の長所と短所

これでMTに関する概要を理解できました。ですが、果たして実際の翻訳ワークフローを進める上で、これらがどんな意味をもつのか?MTのメリットを下記にまとめました。

  • MTは信じられないほど高速で翻訳できる
  • 一度に複数の言語に翻訳できるため、人手を大幅に削減できる
  • MTをローカライゼーションプロセスに取り入れると、翻訳者の負担が減らせる。翻訳者は貴重な時間が増えるので、より難解な作業に集中できる。
  • MTテクノロジーは急速に発展している。より高品質の翻訳を作成し、ポストエディットの必要性を減らすために進歩し続けている。

MTを使用することには多くの利点がありますが、ただ、欠点を無視することはできません。MTは常に完璧な翻訳を生み出すとは限りません。人間の翻訳者と違ってコンピューターは文脈や文化を理解できないため、MTですべてを翻訳することはできません。

どんな時に機械翻訳を使うべきか?

MTだけを使ったほうが良い場合もあれば、MTと人間によって翻訳を行うのが最適な場合もあります。MTがまったく適していない場合もあります。MTは、すべてのニーズを満たす翻訳ソリューションではありません。

大量のコンテンツの場合、特に納期が短い場合、MTは非常に効果的です。正確さが重要でない場合、生のMT(人間によるポストエディットなし)を用いれば、わずかなコストで適切な翻訳を生成できます。カスタマーレビュー、ニュースモニタリング、内部ドキュメント、および製品の説明などは、このケースに当てはまります。

クリエイティブであったり文学的なコンテンツを翻訳する場合、MTは適切な選択ではありません。これは、文化的に特定の文脈をもつテキストを翻訳する場合にも当てはまります。経験則として言えることは、コンテンツが複雑になるほどMTは適さない、ということです。

ただ、MTとポストエディットを組み合わせて使用することで、様々なコンテンツを適切に翻訳できるようになります。

機械翻訳のポストエディットに興味がありますか?e-bookをダウンロードして、学びましょう。

どのMTエンジンを使用すべきか?

特定の種類のコンテンツのための特定のMTエンジンはありません。汎用MTエンジンは、ほとんどのタイプのコンテンツを翻訳できるように設計されています。一方カスタムMTエンジンを使用すると、特定のドメインまたはコンテンツに合わせて、トレーニングデータを調整できます。

結局のところ、MTエンジンの選択は長いプロセスになる可能性があります。翻訳するコンテンツの種類を選択し、セキュリティとプライバシーポリシーを確認し、テキストサンプルでテストを実行し、ポストエディターを選択し、さらに、色々な事項を検討する必要があります。重要なのは、決定を下す前に調査を行うことです。翻訳管理システム(TMS)を使用している場合は、TMSが選択したMTエンジンをサポートできるかチェックしておきましょう。

面倒なMT選択プロセスに代わって、MTエンジンの選択を簡単にするための新しいツールも開発されています。たとえば、 Memsource Translateを使えば、言語ペア、ドメイン、コンテンツタイプに基づいて、最適なMTエンジンが自動的に選択されます。

機械翻訳と翻訳管理システムの使用

MTは単独で使用できます。ですが最大限にメリットを得るには、MTを翻訳管理システム(TMS)と統合することをおすすめします。テクノロジーを組み合わせることで、翻訳メモリ、用語ベース、プロジェクト管理機能などの追加ツールを活用でき、ローカライゼーションの手順を合理化・最適化できます。翻訳をしっかりコントロールしつつ、MTエンジンの有効性も分析できます。MemsourceなどのTMSには、コンテンツに最適なMTエンジンを選択するMemsource Translateや、MTワークフロー全体を合理化する機械翻訳品質評価(MTQE)など、MTに特化した管理機能も備わっています。

機械翻訳(MT)のご活用をお考えですか?ポストエディットの戦略から始めていきましょう。

詳しく知る
執筆:Lara-Ashleigh Pieterse
執筆:Lara-Ashleigh Pieterse

Memsourceコンテンツマネージャ