arrow-downbooth calendarclockclose ShapeCreated with Sketch. fb glassinfo menunextok placeplay-iconplayprevslick-nextslick-prevsuccesswebinar-calendar

ブログ

目次

機械翻訳:包括的なガイド

機械翻訳ガイド

機械翻訳は、ほとんどのローカリゼーション技術に不可欠な要素です。大規模の翻訳を支援し、翻訳コストを削減します。機械翻訳の開発には多くのリソースが投入されており、そのためエンジンは常に改良され、翻訳の質も向上しています。でも、どのように使うの?機械翻訳をグローバル戦略にどう導入したらよい?品質は良いの?そのような機械翻訳に関する疑問にお答えします。

1.機械翻訳とは

機械翻訳(MT)は、コンピューターソフトウェアによる自動翻訳です。ユーザーは、「ソース言語」にテキストを入力し、「ターゲット言語」を選択します。するとMTエンジンが翻訳を生成します。機械翻訳は、従来の翻訳方法では不可能に近い大量のテキストを迅速に翻訳することができます。人間の手を借りずにテキスト全体を翻訳すること(生の機械翻訳)も、人間の翻訳者と一緒に翻訳すること(機械翻訳ポストエディット)も可能です。

2.機械翻訳の仕組み

機械翻訳の歴史は非常に長く、世界初の翻訳エンジンは1950年代に遡ります。当時実証された翻訳エンジンは、コンピュータというよりも機械そのものに近く、多くの場合、物理的なパンチカードの入力に頼っていました。今日、翻訳技術は絶えず進歩し、改良を続けています。

MTには、ルールベース、統計ベース、例文ベースなど複数のアプローチがあります。技術の進歩に伴い、古いシステムは、より効果的な新しい技術に取って代わりました。この10年における最も重大な進歩といえるのが、ニューラル機械翻訳と人工知能の登場です。

ニューラル機械翻訳

ニューラル機械翻訳(NMT)は、深層ニューラルネットワークを用いたアプローチです。NMTで使用されるネットワークアーキテクチャにはさまざまなものがありますが、通常、ネットワークは2つの要素に分割できます。入力文を読み取って翻訳に適した表現を生成するエンコーダと、実際の翻訳を生成するデコーダです。NMTにおいては、単語や文全体でさえ実数値ベクトルとして表されます。前世代のMTと比較して、NMTの翻訳は、より流暢で文法的に正確である傾向があります。SMTでは、文の流暢性を数単語ずつ評価するのに対し、NMTでは文全体で評価します。

機械翻訳データ

機械翻訳はトレーニングデータに基づいて行われます。データはお客様のニーズに合わせて、汎用的なものからカスタム的なものまであります。Google翻訳、Microsoft翻訳、Amazon翻訳などの汎用的なMTエンジンは、より広い用途を想定しており、MTエンジンのトレーニングに特定の分野やテーマに関するデータは用いられません。データは継続的に収集され、それを基に出力結果が改善されます。一方、カスタムMTエンジンは、特定のデータでトレーニングされた、より精緻なシステムです。汎用的なMTエンジンよりも正確なMT出力結果(およびデータ保護)を期待できますが、その分、価格も高くなります。

3.機械翻訳のメリット

機械翻訳は、従来の翻訳に比べていくつかの大きなメリットがあり、企業にとっては非常に魅力的な手段です。

  • スピード:現在のMTエンジンは、大量のコンテンツを、ほぼ瞬時に翻訳することができます。
  • 拡張性:MTエンジンなら、ドキュメント1件から1000件まで、簡単に処理することができます。
  • コストパフォーマンス:MTにかかるコストは、従来の約1000分の1とも言われています。

しかし、機械翻訳は、どんなプロジェクトやコンテンツにも適しているわけではありません。このことは常に念頭に置く必要があります。完璧な品質が求められる翻訳には、やはり人為翻訳やポストエディットが欠かせません。

MTの各種コンテンツ対応MTレポートシリーズをご覧ください。最新号をダウンロードする

4.機械翻訳が適するケース

機械翻訳を使うべきかどうかは、いくつかの要素によって決まります。

コンテンツの種類

機械翻訳は、ユーザーが選ぶ戦略に応じて、さまざまな種類のコンテンツに対応することができます。しかし、マーケティング資料のようなクリエイティブな内容は、機械翻訳は理想的ではないかもしれません。機械翻訳の出力結果は草案として扱い、それに創造性に富んだ人間の翻訳者が修正を加えるのか良いでしょう。

オーディエンス

誰が読むのか機械翻訳を利用するケースが何であれ、機械翻訳の出力結果が読者の期待に応えるものであることを確認しなければなりません。翻訳するのは、収益の向上を狙うWebページでしょうか。それとも従業員向けの社内文書でしょうか。企業や製品を紹介するコンテンツの場合、必ず人の目で確認する必要があります。社内向けのコンテンツであればMTが適しています。

分量

部分的な翻訳にはどうでしょう。そのような翻訳にもMTはもちろん利用できますが、MTの真価は大量のテキストを翻訳できることにあります。

納期

納期が迫っているのに、翻訳作業を完成させるためのマンパワーがない。そのような場合は、機械翻訳がお勧めです。

コンテンツの優先度

優先度が低い社内文書のようなコンテンツや短納期の場合には、機械翻訳が向いています。

5.MTを利用しない理由

最終的に問題となるのは、当然ながら出力結果の品質でしょう。MTの改良によって出力結果の品質は大幅に向上しましたが、人間の翻訳者と同等の品質を常に実現するには至っていません。

Memsourceでは、各種エンジンのパフォーマンスについて、多様な言語ペアや分野にわたり、四半期ごとに追跡調査しています。その結果は、機械翻訳を利用するかしないかを判断する材料になります。最新のMTレポートで詳細をご覧いただけます。

6.MTを始めるには

MTを効果的に使うには、MTエンジンを選ぶだけでは不十分です。企業がMTを効果的に導入するには、それぞれに有効な戦略を用意する必要があります。

適切な機械翻訳戦略の選定

ユーザーの翻訳ニーズに合わせた機械翻訳の戦略をいくつかご紹介します。

生の機械翻訳

生のMTとは、人間の翻訳者によるレビューを受けていない、機械翻訳の出力結果です。Google翻訳を使ってWebページを翻訳すれば、それが生のMTです。出力結果は完璧ではないものの、ほとんどの訳文は合格点に達します。顧客向けの文書に生のMTをそのまま使用することはお勧めできませんが、ユーザー作成資料や社内文書の翻訳、あるいは正確性よりスピードが重視される場合に、生のMTはシンプルなソリューションになります。

機械翻訳のポストエディット

機械翻訳のポストエディットは、機械翻訳と人為翻訳を組み合わせたものです。大量のテキストを迅速に処理できる機械翻訳エンジンのスピードと能力、それに訓練された言語スペシャリストのスキルと感性を兼ね備えています。ポストエディット(PE)は比較的新しい分野で、_機械翻訳の出力結果に対するポストエディット_を対象としたISO規格は2017年に成文化されたばかりです。PEとは、生のMT出力結果をレビューし、修正を加え、翻訳を完成させる作業のことです。

お客様の翻訳ニーズに応じて、最適なレベルのMTPEを選択することができます。

  • 軽度のポストエディット

LPE では、絶対に必要な場合のみ機械翻訳の結果を変更します。翻訳結果が読みやすく、原文の意味が正確に伝わるよう編集します。

  • 完全なポストエディット

FPEでは、生のMTによる出力結果を徹底的に見直し、修正を加えます。スタイル、トーン、文化的な機微に至るまで細かなチェックを行い、エラーのない完全な状態にします。

機械翻訳のポストエディットについて、さらにヒントが必要でしょうか。そんな方にうってつけのものご用意しました。 機械翻訳ポストエディットウェビナー__のご案内をご覧ください。

人為翻訳

もちろん、MTがコンテンツに適していない場合もあります。ブランディングや文化的背景が重要な意味を持つ場合、MT出力結果へのポストエディターによる「修正」は、はじめから人間が翻訳した訳文を直す以上に時間がかかるかもしれません。

7.機械翻訳を導入するには

戦略が決まったら、次は導入検討を開始します。ローカライゼーションのワークフローに機械翻訳を加えることは、決して難しいことではありません。機械翻訳の導入を成功させるためには、いくつかのステップがあります。

  • 機械翻訳に適したコンテンツを選ぶこと。
  • MTプロバイダーのプライバシーポリシーを確認すること。あなたのデータに何が起こり、どのように保存されるかを知っておく必要があります。
  • 可能であれば自らのデータを使ってエンジンを鍛え、出力品質を高めること。
  • 機械翻訳ポストエディットを導入する場合は、ポストエディットのトレーニングを受けている、あるいは実績のあるチームを選ぶか、またはチームがポストエディットを受け入れる態勢があることを確認すること。
  • MTを導入する前に、大体の品質を把握したり、改善できる部分を特定できるよう、事前にサンプルを実行すること。
  • 必ず関係者全員の意見を踏まえて価格モデルを決定すること。
  • MTの導入!すぐには期待通りの結果が得られないかもしれませんが、時間の経過とともに翻訳の品質は向上してきます。

ウェビナーでは__Memsourceに機械翻訳を導入するヒントをご紹介します。

8.翻訳者にとってのMT

機械翻訳について広く誤解されている点としては、機械翻訳によって翻訳者が不要になるというものがあります。幸いにも、機械翻訳と人為翻訳は対立する関係にありません。MTのエヴァンジェリストの中には、いずれ機械翻訳が人間の翻訳者と同等になると予測している人もいますが、すぐに実現することはないでしょう。一貫した品質を担保するにはMT出力結果に調整を加える必要があります。そのため人間のリンギストは今後もポストエディターとして、MT主導の翻訳ワークフローにおいて重要な役割を担い続けるでしょう。

9.機械翻訳の品質:MTで十分かを判断するには

MTは大きな進歩を遂げていますが、翻訳の質にはまだ疑問が残るため、MTへの投資を続けることに二の足を踏むユーザーもいます。多くのユーザーは、生成された翻訳の品質が十分ではないため、高価なポストエディットが必要になるとの懸念を持っています。また、MTが生成する訳文の分量に合うように評価基準を調整する方法を知らないユーザーもいます。

幸いMTはいくつかのステップを踏むことで常に最良の結果を得られ、出力された訳文を効果的に評価することが可能です。重要なステップの1つは「機械翻訳エンジンの品質を管理する方法」の記事でご紹介した通り、カスタマイズされたエンジン、MT管理ソリューション、AIによる品質推定など、既存のテクノロジーを効果的に活用することです。

10.機械翻訳の未来

機械翻訳は、最新のハードウェアとソフトウェアの開発を駆使して、目覚ましいスピードで進歩し続けています。MTエンジンは性能が向上しているだけでなく、その数もこれまで以上に増加しています(Memsourceだけでも30種類以上の独自のMTエンジンをサポートしています)。急速な発展と激しい競争とがあいまって、長期的には機械翻訳にとって有益な結果を生むことになるでしょう。とはいえ、選択肢は常に変化しており、またその数は増加の一途にあるため、機械翻訳の初心者にとってはなかなか取っ掛かりがつかめない、また既存ユーザーについては最大限に活用しきれていないのが現状です。

Memsourceの開発においては、ほとんどの場合、ユーザーが常に最高の機械翻訳を利用できるようにすることを目的としてきました。ユーザーが最適なエンジンを探し出すことができるよう、MTエンジンの選定を自動化・最適化する、ダイナミックなエンジン管理ソリューションMemsource Translateを立ち上げました。 洗練されたAIアルゴリズムがエンジンの性能をリアルタイムに監視し、常にコンテンツに最適なエンジンを推奨します。Memsource社のCTOであるDalibor Frivaldsky氏は、最近のインタビューで次のように述べています。​「MTテクノロジーを簡単に利用できれば、複雑なプロセスを経てMTプロバイダーを選ぶ必要がなくなると考えました」

Memsource Translateの詳細、Memsource Translateを使用してMTをさらに活用する方法については、ウェビナー「Memsource Translate:機械翻訳を最大限に活用する」をご覧ください。

facebookfb-colorinlinkedintwtwitteryoutube

当社のウェブサイトでは、より良いユーザー体験を提供するためクッキーを使用しています。引き続きウェブサイトをご利用いただく場合、同意いただいているものとみなします。クッキーポリシーをご確認ください。