Blog

Qualitätsbewertung für die maschinelle Übersetzung: Das neueste KI-basierte Feature von Memsource

Wie brauchbar wird eine maschinelle Übersetzung voraussichtlich sein? Mit unserer neuesten Funktion auf Grundlage künstlicher Intelligenz hat das Rätselraten ein Ende.

Wir freuen uns, die zweite Funktion auf Grundlage künstlicher Intelligenz vorstellen zu können: Qualitätsbewertung für die maschinelle Übersetzung („Machine Translation Quality Estimation“ – MTQE). MTQE stellt Ihnen Qualitätskennzahlen für maschinell erstellte Übersetzungen zur Verfügung, noch bevor die Nachbearbeitung begonnen hat. Das erleichtert den effizienten Einsatz dieser Technologie und erhöht die Effizienz der Nachbearbeitung.

Diese Funktion kann für über 70 Sprachpaare verwendet werden. Sie steht in allen Memsource Editionen für die mehr als 25 MT-Engines zur Verfügung, die in Memsource unterstützt werden. Um diese Funktion nutzen zu können, müssen Sie Zeichenkontingente erwerben.

Erste Tests zeigen, dass MTQE für die unterstützten Sprachpaare Qualitätskennzahlen zwischen 85% und 100% für bis zu 14% der maschinell übersetzten Segmente liefern kann. In der Praxis sind damit Einsparungen von bis zu 7% beim Post-Editing möglich.

„Angesichts des Erfolgs unserer ersten KI-basierten Funktion wollten wir mit der Einführung einer weiteren KI-Funktion noch in diesem Jahr die Schlagzahl erhöhen“, so David Canek, CEO von Memsource. „MTQE basiert auf der KI-gestützten Identifikation nicht zu übersetzender Elemente. Dieses Feature soll die Nachbearbeitung maschinell übersetzter Texte für alle Anwender einfacher und effizienter machen. Kunden, die beide Funktionen nutzen, können mit erheblichen Kostensenkungen und deutlicher Produktivitätssteigerung rechnen.“

Nachbearbeitung maschinell übersetzter Texte: Das Problem

Die Qualität maschinell übersetzter Texte steigt noch immer. Viele Übersetzer sind heute damit beschäftigt, maschinell übersetzte Texte nachzubearbeiten („Machine Translation Post-Editing“). Die Qualität der maschinellen Übersetzung variiert jedoch noch erheblich. Hierbei spielen verschiedenen Faktoren – beispielsweise Textgattung und Sprachpaar – eine Rolle. Oft müssen Übersetzer dann zahlreiche maschinelle Übersetzungen minderer Qualität sichten, während andere Segmente nur geringfügig korrigiert werden oder gar unverändert übernommen werden können. Dieses Vorgehen kostet viel Zeit.

Wir wissen, dass die Qualitätsbewertung von Treffern aus Translation Memorys im Übersetzungsprozess viel Zeit sparen kann. Insofern lag der Wunsch nahe, eine vergleichbare Funktion für die maschinelle Übersetzung bereitzustellen. An dieser Stelle kamen Künstliche Intelligenz und unser KI-Team ins Spiel.

Wie MTQE entwickelt wurde

Unser KI-Team beschäftigte sich mit abgeschlossenen Übersetzungsprojekten, bei denen maschinelle Übersetzungen nachbearbeitet worden waren. Die maschinelle Übersetzung erhielt dann auf der Grundlage des erforderlichen Aufwands für die Nachbearbeitung eine Qualitätskennzahl. Unser neuronales Netzwerk für Deep Learning wurde dann auf der Grundlage dieser historischen Daten trainiert und lernte so, einem Übersetzungsvorschlag einer Machine-Translation-Engine für einen beliebigen Quelltext eine präzise Qualitätskennzahl zuzuordnen.

Vorteile von MTQE

Qualitätsprüfung maschineller Übersetzungen in Memsource: Die sofort verfügbaren Qualitätskennzahlen erlauben es Übersetzern, die Qualität der maschinellen Übersetzung beim Nachbearbeitungsprozess zu berücksichtigen und maschinelle Übersetzungen minderer Qualität besser zu verwalten. Dementsprechend wird das Post-Editing effizienter.

Schnellere Fertigstellung von Übersetzungen: Eine qualitativ hochwertige maschinelle Übersetzung (mit einer 100%-Bewertung) muss möglicherweise überhaupt nicht mehr nachbearbeitet werden.

Realistische Einschätzung des Zeitaufwands für das Post-Editing: MTQE ermöglicht eine vorausschauende Analyse der Qualität maschineller Übersetzungen bestimmter Inhalte. Mit den resultierenden Daten kann ein Sprachdienstleister den Zeitaufwand für die Nachbearbeitung besser einschätzen und auf dieser Grundlage gegebenenfalls überzeugendere Angebote vorlegen als der Wettbewerb.

Beurteilung der Qualität von MT-Engines: Mit MTQE kann die Eignung von Machine-Translation-Engines für bestimmte Inhalte geprüft werden. Entscheiden sie sich für die Engine mit den höchsten Qualitätskennzahlen.

MTQE in Memsource

Qualitätskennzahlen

Die MTQE-Qualitätskennzahlen können im Memsource Web Editor und im Desktop Editor angezeigt werden. MTQE Version 1 stellt vier Bewertungskategorien bereit:

100%: Maschinelle Übersetzung in hervorragender Qualität – es ist wahrscheinlich keine Nachbearbeitung erforderlich

95%: Maschinelle Übersetzung in sehr guter Qualität – möglicherweise sind geringfügige Korrekturen erforderlich

85%: Grundsätzlich passend, aber wahrscheinlich ist eine Nachbearbeitung erforderlich

Keine Bewertung: Wenn keine Bewertung vorliegt, bedeutet dies, dass MTQE die Qualität der maschinellen Übersetzung nicht ermitteln kann. Dementsprechend sollten diese Segmente von einem Übersetzer geprüft werden.

Analyse

Wenn eine Datei mit aktiviertem MTQE analysiert wird, ermittelt diese Funktion die Anzahl der Machine-Translation-Matches mit Qualitätskennzahlen (85%, 95% oder 100%) in dieser Datei. Dies ist vergleichbar mit der Ermittlung der Matches aus einem Translation Memory. Der Anwender kann sich dann die Abschnitte für 100%, 99-95% und 94-85% der Analysetabelle ausführlich darstellen lassen. Dort wird dann angezeigt, welche Matches in Translation Memorys gefunden wurden („TM“), welche Segmente als nicht übersetzbar identifiziert wurden („NT“) und welche auf maschineller Übersetzung basieren – diese sind rot umrandet.

Vorübersetzung

Die maschinelle Übersetzung wird zusammen mit der Qualitätskennzahl auf zwei Arten bereitgestellt.

Zum einen werden diese Daten bei der Arbeit im Memsource Web Editor und im Desktop Editor für jedes Segment in Echtzeit bereitgestellt (siehe oben).

Zum anderen sind sie bei der Vorübersetzung nutzbar, die mit einer Reihe konfigurierbarer Optionen die Vorübersetzung mehrerer Segmente ermöglicht. In den Einstellungen für die Vorübersetzung gibt es jetzt die Möglichkeit, 100%-Matches aus maschineller Übersetzung sofort bestätigen zu lassen (siehe unten).

sales@memsource.com