Блог

Machine Translation Quality Estimation (оценка качества машинного перевода): новейшая функция Memsource, использующая ресурсы искусственного интеллекта

Наша новейшая функция, использующая ресурсы искусственного интеллекта, позволяет исключить из машинного перевода элементы гадания.

С гордостью сообщаем о запуске второй функции на базе искусственного интеллекта — Machine Translation Quality Estimation (MTQE, оценка качества машинного перевода). Благодаря MTQE вы можете оценить качество машинного перевода до постредактирования, что позволяет исключить из машинного перевода элементы гадания и повысить эффективность постредактирования.

Данная функция поддерживается более чем 70 языковыми парами и доступна во всех 25+ механизмах машинного перевода Memsource и во всех версиях Memsource. Чтобы использовать данную функцию, вам необходимо будет приобрести символы.

Согласно результатам первичного тестирования, при использовании MTQE с поддерживаемыми языковыми парами до 14% сегментов, обработанных при помощи машинного перевода, демонстрируют уровень качества от 85% до 100%. На практике это означает экономию на постредактировании в размере до 7%.

«Учитывая успех нашей первой функции с элементами искусственного интеллекта, мы решили не сбавлять обороты и запустить еще одну ИИ-функцию до конца этого года», — комментирует Давид Чанек, генеральный директор Memsource. «MTQE использует нашу функцию распознавания непереводимых элементов на базе искусственного интеллекта с целью повысить удобство и эффективность постредактирования для всех сторон. Сочетание этих функций способно значительно сократить себестоимость и повысить производительность наших клиентов».

Постредактирование машинного перевода: насущная проблема

Качество машинного перевода продолжает расти, и все чаще перед лингвистами ставится задача выполнить редактирование или постредактирование машинного перевода. Однако при этом качество машинного перевода продолжает в значительной степени варьироваться в зависимости от целого ряда факторов, включая тематику и языковую пару. Лингвистам приходится иметь дело с большим количеством низкокачественного машинного перевода; редко встречаются такие переведенные сегменты, качество которых настолько высоко, что они либо нуждаются в небольшой правке, либо вообще в ней не нуждаются. Из-за этого много времени тратится впустую.

Мы знаем, что показатели уровня совпадений из памяти переводов позволяют лингвистам сэкономить время; исходя из этого, мы решили применить тот же принцип к машинному переводу. И здесь в игру включился ИИ и наша ИИ-команда.

Как была разработана оценка качества машинного перевода

Наша ИИ-команда изучила имеющиеся переводы, в которых использовалось постредактирование машинного перевода, и на основании количества усилий, затраченных на правку, присвоила машинному переводу тот или иной уровень качества. После этого мы применили исторические данные для обучения нашей глубокой нейронной сети и научили ее правильно оценивать уровень качества текста, переведенного с любого исходника с использованием машинного перевода.

Преимущества MTQE

Проверка качества машинного перевода в Memsource: Уровень качества, мгновенно присваиваемый машинному переводу, позволяет лингвистам учесть качество машинного перевода в процессе постредактирования и улучшить обработку низкокачественного машинного перевода, благодаря чему увеличивается эффективность процессов постредактирования.

Повышение скорости переводов: Высококачественные сегменты, переведенные с помощью машинного перевода и получившие оценку 100%, могут вообще не нуждаться в постредактировании.

Оценка усилий и времени, необходимых для постредактирования: MTQE поддерживает прогнозный анализ эффективности машинного перевода по соответствующей тематике. Полученные в результате данные помогают оценить усилия, необходимые для выполнения постредактирования, и в результате предлагать более конкурентоспособные расценки по переводам.

Оценка качества механизмов машинного перевода: При помощи MTQE можно оценить качество механизма машинного перевода той или иной тематики и выбрать тот механизм, который демонстрирует самые высокие показатели.

MTQE в Memsource

Уровень качества

Оценки уровня качества MTQE доступны в веб-редакторе Memsource Web Editor и настольном редакторе Memsource Desktop Editor. MTQE версия 1 предлагает четыре категории оценок:

100%: Отличное качество машинного перевода, необходимость в постредактировании, скорее всего, отсутствует

95%: Очень высокое качество машинного перевода, возможно, потребуется незначительное постредактирование

85%: Качество перевода хорошее, но без постредактирования, скорее всего, не обойтись

Нет оценки: Если уровень качества не присвоен, это означает, что MTQE не удалось определить качество перевода, и его должен проверить лингвист.

Анализ

Анализ с применением MTQE подсчитает количество совпадений с машинным переводом (процесс, аналогичный поиску совпадений с памятью переводов) и присвоит уровень качества 85%, 95% или 100% соответствующим сегментам файла. Развернув разделы аналитической таблицы, показывающие 100%, 99-95% и 94-85%, пользователи могут узнать, какие совпадения взяты из памяти переводов (TM), какие включают непереводимые элементы (NT), и какие совпадают с машинным переводом (выделены красным).

Автоподстановка перевода

Машинный перевод, как и оценка уровня качества, может выполняться двумя способами.

Во-первых, его можно последовательно применить к сегментам в режиме реального времени в веб-редакторе Memsource Web Editor и настольном редакторе Memsource Desktop Editor (как показано выше).

Во-вторых, он применяется в рамках автоподстановки с возможностью выбора из нескольких опций в процессе автоподстановки. В настройках автоподстановки теперь доступна опция мгновенного подтверждения 100% совпадений с машинным переводом (как показано ниже).

sales@memsource.com