Оценка мощности перевода на основе ИИ и сравнение Google Translate и Deepl.

Недавно я написал книгу и мучился с неблагодарной задачей обновить ее как на английском, так и на испанском языке. Это привело меня к относительно интенсивному использованию двух сервисов машинного перевода в Интернете: Google Translate и Deepl. Делюсь результатами перевода Глоссария (69 терминов в 2490 слов) с английского на испанский (мой родной язык). Глоссарий был сложным с техническими терминами, причем некоторые из английских терминов были непереводимыми (например, названия компаний или термины, которые обычно упоминаются на английском языке даже в испанском контексте).

Результаты эксперимента шокируют:

  1. Технология очень хороша: две трети терминов не требуют корректировки (идеальный перевод, по крайней мере, из одного из сервисов) или лишь незначительного редактирования стиля. Из оставшейся трети ~25% требовалось два редактирования и менее 5% требовалось более трех правок (максимум 5 правок). Двумя самыми сложными терминами были Убийственное приложение (без прямого перевода на испанский) и Сдвиг парадигмы (оба получили физика Эйнштейна и Ньютона). Это гораздо лучше, чем то, что я обычно получал от консультантов-аналитиков при переводе текстов.
  2. Контекст, значение и даже нюансы включаются автоматически. Мой личный фаворит — это DeepL, включающая «(por sus siglas en inglés)» (из-за его инициалов на английском языке) при сохранении акронимов на английском языке.
  3. Перевод настолько хорош, что если вы обнаружите существенную ошибку, вероятно, была ошибка в исходном тексте (произошла в трех терминах)
  4. Время перевода значительно сокращается, так как результаты с веб-сайта появляются почти мгновенно (‹1 сек), а редактирование происходит намного быстрее, чем написание с нуля. Я бы оценил сокращение от 90 до 95%.
  5. Наконец, сравнивая эти два сервиса, вы можете превзойти Google в машинном обучении. Я сделал 104 исправления в переводах Google и только 95 в переводах DeepL (примерно на 10% меньше). По срокам они сравняли 54% условий, DeepL выиграл 29%, а Google — 17% условий. Что-то вроде матча Роджера Федерера и Рафы Надаля, когда обе службы не хотят уступать ни одного очка. Единственным термином с двумя исправлениями различий был Кибербезопасность, который поставил Google в тупик (2 исправления), и DeepL стал идеальным.

Последствия повышения качества таких машинных переводов имеют несколько уровней.

Во-первых, если вы переводчик, начните обновление до редактора. Машина может переводить, а вы можете потратить время на то, чтобы текст был оптимально читабельным в соответствии с языком и культурой. Нет смысла тратить человеческое время на рутинную и скучную работу по первому переводу.

Во-вторых, если вам нужен быстрый достаточно хороший перевод чего-либо, вы можете просто доверить его машине. Этого будет достаточно. Это также может быть применено ко многим приложениям, которые обмениваются информацией. Вот почему вы начинаете получать переводы мнений Trip Advisor, они более чем достаточно хороши для этой цели. Европейский Союз, вероятно, мог бы сэкономить целое состояние, сделав это для всех этих болезненно переведенных текстов, которые никто не читает ни на одном из языков, на которые они переведены.

В-третьих, в среднесрочной перспективе это повлияет на речь. Вскоре мы сможем получить прямой перевод того, что слышим, на наши родные языки, возможно, с сохранением голоса оригинального говорящего. Успехов дубляжной индустрии. Со временем это может также повлиять на ценность изучения иностранных языков. Всегда будет надбавка за беглость речи на родном языке, но машинная беглость может быть лучше средней беглости человека.

Конечно, это перевод с английского на испанский, вероятно, одна из самых распространенных языковых пар с многовековой параллельной эволюцией в Европе. Перевод с мандаринского на английский все еще оказывается сложнее, но, учитывая темпы прогресса, это может занять менее десяти лет.