日本窓口よりメムソースお役立ち情報ブログ

機械翻訳による特許翻訳の変化

特許翻訳はかつて専門性が高く安定しているとされた分野ですが、機械翻訳技術の進化により大きな変化が生じています。

今回は特許翻訳に焦点を当て、変化の背景と今後の可能性について探っていきます。

変動の時期に次の一手をどう打つかを考える際に、参考にして頂ける内容です。

翻訳支援ツールと特許翻訳

まずは翻訳支援ツールが広がった時期から見ていきましょう。

翻訳支援ツールが登場したのは今から40年近くも前のこと。

最初は類似表現が頻出するマニュアル翻訳で使われていましたが、その効果が認められるにつれ広範囲に使用されるようになりました。

分野によっては翻訳支援ツールを利用して効率化できた分だけ価格が下がるといったことも起こりましたが、特許では極端な変動は見られませんでした。

特許翻訳にはマニュアル翻訳などと比べ、ツールをフル活用できなかったためです。

翻訳支援ツールを利用する一番の目的は、過去の翻訳をデータベース化して翻訳メモリとして活用すること。

ですが特許は新規発明を説明する文書なので、過去の翻訳を再利用できません。

そのため翻訳支援ツールの用途も限定されていたのです。

そんな特許翻訳業界に大きな変動が起こったのは、ここ最近のこと。

機械翻訳(MT)エンジンの精度が一気に向上したためです。

機械翻訳と特許翻訳

機械翻訳の性能が一気にアップしたのは、ニューラルネットワークという技術が取り入れられたからです。

これにより、ヒトが記憶する時と同じようにエンジンを学習させていくことが可能になりました。

ただ学習には「教材」が必要。

具体的にはこれまでの翻訳の成果物が教材になります。

これを「コーパス」と呼んだり「翻訳メモリ」「対訳データ」とも言ったりしますが、要は原文と訳文が対になったデータベース。

機械翻訳の精度は、このデータベースの品質や量に大きく左右されます。

特許翻訳分野で機械翻訳が使われるようになった理由が、実はここにあります!

実務翻訳で使われる文書の多くは企業の機密情報であり、公開されることはありません。

ですが特許の場合は翻訳した文書は特許公報として公開されるため対訳データを収集しやすく、エンジンの精度を鍛えやすいのです。

また人の目には複雑に思える特許文書独特の言い回しは、機械にとってはむしろ構文を解析するのに好都合といった事情もあります。

こうした状況の中で特許用の良質な機械翻訳エンジンの開発が急ピッチで進められ、実用化レベルに達していきました。

中でも国立研究開発法人NICT*(情報通信研究機構)のエンジンは、その高い品質が評価されユーザー数は増加の一途をたどっています。

技術革新の中で特許翻訳業界は大きな変化を迫られているのです。

変革期の中での対応

こういった変革期はどのように舵を取っていくかが非常にむずかしい時期です。

新しい技術にはリスクが付き物。

闇雲に取り入れると、手痛い火傷を負うことにも。

たとえばニューラルネットワークを利用した機械翻訳(NMT)はこれまでの機械翻訳と比べて品質は高いのですが、訳抜けなどのデメリットも指摘されています。

人が翻訳したような自然な訳が出てくるだけに、訳抜けが見つけにくいという難点も。

また原稿によっては、機械翻訳での作業が向かないものもあります。

ムリに機械翻訳をかけると、かえって労力が増えてしまうというケースもあるでしょう。

とはいえリスクのために新しい技術を避けていくと、競争相手に追い抜かされてしまうことになりかねません。

リスクを最小限に押さえつつ、少しずつ新しい技術を取り入れていきたいですよね。

Memsourceは、ユーザーの皆様がより安全に機械翻訳を導入できる機能の開発に取り組んでいます。

最新のMTQE(機械翻訳品質評価)機能は、実際のポストエディットの前にその労力を見積もることが可能。

こちらはMTQE機能を活用した解析結果例です。

翻訳メモリを使った解析と同様、原文と機械翻訳のデータを照会していき、機械翻訳が活用できる割合を数値で算出します。

他にも複数のMTエンジンを比較し、どのエンジンを使うと効率的に翻訳を進められるかを予測できる機能もございます。

新たなテクノロジーをお試しになる際に、ぜひこういったリスク回避のための機能をご活用ください。

【関連記事】

記事中でご紹介したMTQE機能については、こちらの記事も併せてご覧ください。

機械翻訳の品質評価:AIを活用したMemsourceの最新機能

バイエル美和
バイエル美和

Memsourceを使った業務効率化のコンサルタント。前職は英語講師・翻訳者であった。その経験をフルに活かした説明は「分かりやすい」とお客様からの定評あり。