機械翻訳

Google翻訳の精度は向上している? DeepLなど他エンジンとの比較、最大限に活用する方法

おそらく世界で最も有名な機械翻訳エンジン「Google翻訳」について、仕組みや特徴、最大限に活用するためのポイントを解説します。
Machine translation category visual | Phrase

機械翻訳と聞いて、多くの人がまず思い浮かべるのが「Google翻訳」でしょう。Google翻訳は、実用的な翻訳システムを世に広めた立役者であることは間違いありません。そのGoogle翻訳をビジネスで効果的に使うには、仕組みや特徴についての知識や、最適な活用方法を押さえておく必要があります。今回はGoogle翻訳について詳しく見ていきます。

Google翻訳とは?

Google翻訳とは、Google社が2006年に提供を開始した機械翻訳エンジンです。

今や誰もが知る大手IT企業Googleが提供するGoogle翻訳は、世界で最も利用されている無料機械翻訳サービスと言っていいでしょう。機械翻訳が個人的な利用から、ビジネスで活用できる生産性向上ツールへと成長していく上で、Google翻訳は大きな役割を果たしてきました。

2006年の提供開始当初は、統計的機械翻訳(SMT)のアプローチに基づいたシステムを採用。国連や欧州議会の翻訳済み資料から構築された対訳データベースをもとに統計モデルを作成し、翻訳を行っていました。対応言語も今よりはるかに少ないものでした。

2016年、Googleはニューラル機械翻訳(NMT)の手法を導入し、翻訳精度が飛躍的に向上。現在、Google翻訳は約5億人のユーザーに利用され、毎日約1000億語が翻訳されています。対応言語も増え、2022年5月現在で133言語をサポートする世界最大級の機械翻訳エンジンとなっています。

Google翻訳の機能とは?

機械翻訳の開発をリードしてきたGoogle翻訳は、品質、機能とも業界のスタンダードに位置付けられる存在です。特徴としては以下のような点が挙げられます。

多様な入出力に対応

テキストや文書ファイルだけでなく、音声、手書き文字、カメラ、画像、URLなど、考えうるほぼすべての入力に対応。特にスマートフォンのカメラで撮影した映像からリアルタイムに文字を抽出し、翻訳文を表示する機能は、その便利さでユーザーを驚かせました。旅先でのレストランのメニュー、駅や空港での案内表示を瞬時に翻訳できます。音声入力との組み合わせでは、スマートフォンを通訳代わりに使うことも可能。さまざまなプロダクトを開発している大手IT企業ならではの総合力を活かした特徴だといえます。

豊富な対応言語数

欧米を中心とした主要言語に絞って開発を行う機械翻訳エンジンもある中、Google翻訳は、アジア、アフリカ、ラテンアメリカなどを含む世界各地の100以上の言語をサポート。先住民族の言葉や主要言語の方言など、希少言語にも対応しています。デジタル化された対訳データが十分にない言語でも、他言語のデータを活かした「半教師あり」学習により、機械翻訳を可能にしています。7000を超えると言われる世界の全言語に対応する機械翻訳の実現に向けて、日々研究が進められています。

最先端のサービスを無料で提供

マップなど他のGoogleのサービスと同様に、最先端のテクノロジーによる翻訳サービスを一般向けに無料で提供。世界中の多くのユーザーが利用し、そこから得られたフィードバックが新たな技術革新につながるという循環を生んでいます。今では業界のスタンダードとなった無料でのサービス提供により、インターネット時代の開発を牽引し、他の機械翻訳エンジンプロバイダーを刺激し続ける存在となっています。

プロフェッショナル向けサービスも用意

無料サービスだけでなく、より専門的な利用が可能な有料のツールも用意されています。AutoML Translationでは、ユーザーが自身のデータを使って翻訳モデルをトレーニングでき、目的に合った機械翻訳エンジンへとカスタマイズできます。Translation APIでは、Google翻訳の機能を他のシステムに組み込めます。音声翻訳やストリーミングに適した、メディア向けのMedia Translation APIも提供されています。

Google翻訳の精度は?

2016年のニューラル機械翻訳の導入により、Google翻訳の精度は飛躍的に向上しました。とはいえ、正確性の面でもまだ完璧なものではありません。内容把握には概ね問題なく使えるものの、ノーチェックで世に出せる品質には至っていないのが現状だといえます。

また、ユーザーが何を期待するかによっても、品質の評価は変わってきます。

例えば、ビジネスメールと小説では求められるものが違うように、対象となる分野やジャンルによって求められる精度は異なります。また、人間が使う言葉は日々変化していきます。さらに、著者の意図やメッセージ、使用目的によっても、「正しい」翻訳は違ってきます。正解がひとつではなく動的であることも、定まった評価が難しい理由のひとつです。

品質に関する課題としては以下のような点があります。

翻訳に過不足が生じる可能性がある:ニューラル機械翻訳の導入により品質が向上した一方で、すべての要素が訳文に反映されているかどうかが保証できなくなりました。単語やフレーズごとに訳すのではなく、文章全体をネットワークに入れて処理するためです。一見自然な文に見えるため、間違いに気づきにくいというリスクもあります。

言語ペアによって品質に差がある:文章構造が近い言語や、主要言語間では比較的良い結果が得られていても、すべての言語ペアでそうなるとは限りません。

辞書としては使えない:多くの場合、1つの単語には複数の意味があるため、単語の意味を知るための辞書としてGoogle翻訳を使用すると、適切な結果が得られないケースがあります。

口語的な表現が苦手:ターゲット言語に直接対応するものがない口語的な言い回しなどは、うまく訳せない場合があります。

言外の意味は汲み取れない:ジョークや皮肉などの意味合いは、背景や文脈に依存するため、適切に表現されない場合があります。

Google翻訳の精度が上がったのはなぜ?

Googleが最初の機械翻訳を発表して以降、しばらくは大きな品質向上は起こりませんでした。しかし、統計的機械翻訳アプローチの欠点を洗い出し、機械翻訳システム専門の開発チームを組織して、革新的な企業の買収や強力なコミュニティの形成といった土台作りに取り組んだ結果、約10年の月日を経て、ニューラル機械翻訳による画期的なブレイクスルーがもたらされました。

ブラウザや検索エンジンも開発している巨大IT企業として、データを大量に集められる立場にあること、世界中の多くのユーザーからのフィードバックが得られることも、精度向上に有利に働いていると考えられます。

Google翻訳の仕組みとは?

2006年の発表当初、Google翻訳は統計的機械翻訳(SMT)の仕組みを採用していました。既存の対訳データ(コーパス)を使って作成した統計モデルによって、文中の単語を翻訳していく手法です。

従来より精度が向上しましたが、コーパスを作成する手間がかかることや、特定の言語ペアで翻訳品質が低いという欠点がありました。これを克服するために、Googleは2016年にニューラル機械翻訳(NMT)の仕組みを取り入れた「Google Neural Machine Translation(GNMT)を発表しました。

人間の脳の働きを模したニューラルネットワークを使ったこの手法では、あらかじめルールを定義するのではなく、与えられたソース言語、ターゲット言語の文例データからネットワークが自ら学習し、予測的に翻訳結果を導きます。これにより翻訳精度が飛躍的に高まり、コスト効率や拡張性も向上しました。

なお、Googleは、ビジネス向けの「Cloud Translation」サービスにおいては、翻訳用に送信されたコンテンツデータを翻訳サービスの提供以外の目的で使用しないことを公式に表明しています。ただ、無料版のGoogle翻訳に送信されたデータを同社がどのように使用しているか、そのデータが何らかの形でビジネスの意思決定に影響を与えているかどうかは、明らかにされていません。

Google翻訳より優れた機械翻訳システムはある?

現在、Google翻訳の他にもさまざまな機械翻訳ツールが市場に出ており、それぞれが独自のアプローチでサービスを提供しています。Google翻訳と競合する主な機械翻訳エンジンは以下の通りです。

Amazon Translate

Amazon Web Serviceの一部として、個人と企業の両方に向けてオンデマンドのクラウドコンピューティングプラットフォームとAPIを提供。Google翻訳と同様、ニューラル機械翻訳の技術をベースに開発されています。2022年5月現在、75言語間の翻訳をサポートしています。

Microsoft Translator

Microsoftが提供するクラウド型の多言語機械翻訳サービス。Microsoft Cognitive Servicesの一部として、複数のコンシューマー/デベロッパー/エンタープライズ製品とともに提供されています。100以上の言語に対応しています。

Tencent

Tencent Machine Translationは、中国のテクノロジー大手Tencentが提供する機械翻訳サービスです。ニューラル機械翻訳と統計的機械翻訳の両モデルを組み合わせたソリューションを提供。160以上の言語ペアをサポートしています。

DeepL

2017年にサービスの提供を開始した、ドイツ発のオンライン機械翻訳サービス。ニューラル機械翻訳技術をベースとした独自のアルゴリズムを採用。DOCX、PPTX、PDFファイルなどに対応し、脚注や書式、埋め込み画像などのフォーマットを保持したまま翻訳が可能。2022年5月現在、26言語をサポートし、650の言語ペアで利用できます。

Google翻訳とDeepLどちらを使うべき?

DeepLは出力される訳文の流暢さで高く評価されていますが、対応言語は欧州言語を中心とした主要言語に限られます。一方、Google翻訳はアジアやアフリカ、ラテンアメリカなどを含む100以上の言語に対応しています。そのため、どの言語を対象とするのかが、まず選択のポイントとなるでしょう。

また、Googleはインターネット界の巨大企業として、ブラウザからスマートフォンOSまで、あらゆるプロダクトを総合的に開発し、高いシェアを持っています。そのためカメラや音声を使った入力や、他アプリとの連携などで一日の長があるといえます。また、豊富な学習データを確保できる立場にあり、機械翻訳以外にもさまざまなAI開発を行っているため、相乗効果による発展も期待できます。

一方、機械翻訳に特化したベンチャー企業であるDeepLには、専業ならではの詳細なモデルのチューニングや良質なデータの確保などにより、品質を研ぎ澄ましていける可能性があります。さらに、他のエンジンも日々進化を続けています。各社がしのぎを削る中、今後どのように品質や対応言語、使い勝手が変化していくか、最新の動向に注目していく必要があるでしょう。

各社が独自に開発を進める中、エンジンによって得意・不得意とする分野や言語ペアが見られるようになっています。そのため、実際の業務で機械翻訳を使用する際には、対象となるコンテンツや目的に応じて、エンジンを使い分けることが、ベストな結果を得るポイントになります。

Phraseのデータを使った調査では、英語-日本語ペアにおいて、ビジネス・教育の分野ではDeepL、コンシューマーエレクトロニクス分野ではMicrosoft、旅行・ホスピタリティ分野ではAmazon、医薬分野ではGoogleが、それぞれ最高の品質スコアを記録しています。

また、現在の翻訳・ローカライズ業務では、翻訳管理システム、CATツール、CMSやストレージといったさまざまなツールを連携させて自動化し、効率化を図るケースが増えています。自社のワークフローにスムーズに組み込めるかどうかも、エンジンを選択する際の判断材料となるでしょう。

Google翻訳が完璧になることはある?

Google翻訳を始めとする機械翻訳が急速に進化しているとはいえ、その精度はまだ完璧とはいえません。また、翻訳とは、単にある言語から別の言語へ、言葉を変換するだけの作業ではありません。文脈や意図の理解、その他の配慮も重要です。以下のように人間の翻訳者の方が優れている点はまだ多くあります。

  • 原文の疑問点を質問する
  • 文脈を把握する
  • 皮肉やジョークを理解する
  • 創造的に翻訳する
  • 礼儀や偏見などに配慮する
  • 背景や他社の動向をリサーチする
  • 表現の一貫性を保つ
  • 文章の有効性を保証する
  • 情報を取捨選択する
  • 補足や注釈を加える

Google翻訳を最大限に活用するには?

Google翻訳は、手間や時間を節約する、強力な生産性向上ツールへと成長してきました。しかし、精度にはまだ課題があり、人間の翻訳者にしかできない判断や工夫、配慮も多くあります。そのため、Google翻訳だけに頼ってしまうと、重要な情報が欠落したり、誤ったメッセージを伝えたり、読み手の印象を損なったりしてしまう危険性があります。

このような事態を避けるために不可欠なのが、機械翻訳の出力を人間が見直し、手を加えるポストエディット(後編集)の工程です。機械翻訳ポストエディット(MTPE)とも呼ばれるこの手法は、現在の翻訳・ローカライズ業務で主流のアプローチとなりつつあります。機械翻訳による効率アップのメリットを享受しながら、元のメッセージの意図が確実に伝わるよう品質を確保する方法です。

翻訳管理システムを使ったポストエディット

上述のように、実際のビジネスで機械翻訳を利用する際には、人手によるポストエディットを加えるのがベストプラクティスです。その工程を効果的、効率的に業務に組み入れるのに便利なツールが、翻訳管理システム(TMS)です。

Google翻訳との連携機能が提供されている翻訳管理システムなら、クリックするだけでGoogle翻訳からの出力をすぐに取り込めます。コンテンツの分野を自動判別して、複数の機械翻訳エンジンから最適なものを自動選択してくれる機能を備えた翻訳管理システムもあります。

翻訳業務に特化した翻訳管理システムは、外部の作業者へのタスク割り当てや共同作業、プロジェクト管理、ワークフロー管理にも力を発揮します。また、機械翻訳の品質を自動評価してくれる機能を持つシステムは、ポストエディットにかかる労力の見極めに役立ちます。

機械翻訳は人間の翻訳者にとって代わるものではなく、翻訳作業を支援するツールだと捉えられるようになってきました。機械翻訳には大量の文章を短時間で処理できる特徴があり、人間には背景や文脈、目的を考慮した「人間らしい」仕事ができる強みがあります。翻訳管理システムの活用などにより、多くの企業が機械翻訳をパートナーとして効果的に業務に取り入れ、未来のコミュニケーションに向けて新しい地平が開かれていくことを期待します。