По словам руководителя исследований Google, в погоне за совершенством, нейронная сеть, влияющая на работу переводчиков, могла подсесть на YouTube

Сомнительные переводы уже давно стали источником развлечений: от скетча Монти Пайтона «Моё судно на воздушной подушке полно угрей» до бесконечных неправильно написанных китайских иероглифов.

Современный машинный перевод не застрахован от насмешек. В прошлом месяце на Шоу с Джимми Фэллоном певица Майли Сайрус перепела популярные песни, которые были переведены с английского на хорватский и обратно на английский.

Песня Эда Ширана «Shape of You», которую прогнали через машинный перевод, звучала так: “But my organ drops right out, I like that cadaver” (Но мой орган падает прямо, мне нравится это мертвое тело), в том время как в исходном тексте песни: “Although my heart is falling too, I’m in love with your body” (И хоть мое сердце уже не выдерживает, я влюблен в твое тело).

Тексты песен, зачастую изначально бессмысленные и не имеющие контекста, представляют особую сложность для машинного перевода, который в последние годы значительно улучшился.

В результате последних разработанных методов нейронного машинного перевода, показатели точности приблизились к показателям, достигнутым переводчиками-людьми. Google, лидер в этой сфере, утверждает, что только в прошлом году компания вдвое сократила количество ошибок, которые делает система.

Но даже если машинный перевод сможет превзойти человека по качеству, необходимо еще много работать, прежде чем система сможет на выходе выдавать идеальный продукт.

По словам Питера Норвига, директора по исследованиям Google, для достижения этой цели системе машинного перевода необходимо не только обширное знание языка, но также «понимание мира».

За пределами Вавилона

Система машинного перевода была широко доступна еще с 1997 года в поисковой системе AltaVista на сайте Babelfish (или Вавилонская рыбка, названном в честь существа из произведений Дугласа Адамса «Автостопом по Галактике», которое помещали в ухо для мгновенного понимания чего-либо, сказанного в любой языковой форме).

Такие крупные провайдеры, как Babelfish, Google Translate и Microsoft Translation, долгое время пользовались методом статистического машинного перевода (SMT). В системе Google данный метод называется «машинный перевод по фразам».

По данному методу машина обрабатывает огромное количество контента, уже переведенного человеком. Затем используется статистический анализ для обнаружения шаблонных фраз, и таким образом «изучается» язык.

Машинный перевод по фразам, как следует из названия, работает с группами словосочетаний, слишком коротких, чтобы считаться предложениями.

В последние годы в системе машинного перевода начали использоваться искусственные нейронные сети, что привело к созданию нейронного машинного перевода (NMT), который, в свою очередь, целиком рассматривает входное предложение как единицу перевода.

«К сожалению, системы NMT, с точки зрения вычислений, дорогостоящие как в обучении, так и в переводе», пишут в своей исследовательской работе 2016 года ученые Google (Юнхуэй и др.). «Данные проблемы препятствуют использованию NMT на практике и в сервисах, где важны как точность, так и скорость».

На сегодняшний день провайдеры уже начинают решать практические проблемы данного метода, главным образом связанные с огромными вычислительными ресурсами и временем, необходимым для этого.

В сентябре прошлого года корпорация запустила систему нейронного машинного перевода Google (GNMT), которая, согласно анонсу компании, использует «современные технологии обучения для достижения крупнейших на сегодня успехов в области качества машинного перевода».

Используя двухуровневое и параллельное сравнения переводов выборочных предложений из Википедии и новостных сайтов, выполненных SMT и GNMT, системе GNMT удалось сократить ошибки перевода на 55-85% в нескольких основных языках.

В ноябре Microsoft так же начал применять NMT вместо SMT, обеспечивая «значительные успехи в качестве перевода», как утверждается компанией.

Также ожидается, что Amazon Web Services в ноябре этого года предоставит услуги машинного перевода, основанные, согласно отчету CNBC, на технологии AI push и, вероятно, с использованием NMT. В мае Марк Цукерберг из Facebook рассказал, что в своей компании, они используют машинный перевод со сверточными нейронными сетями, которые работают несколько иначе. «Благодаря новой нейронной сети наша исследовательская группа ИИ смогла более точно переводить с одного языка на другой, и делать это в девять раз быстрее, чем с помощью других существующих методов», – написал он на своей странице в Facebook.

Однако все еще есть значительные ограничения. Microsoft заявил, что использование нейронных сетей было «лишь первым шагом на пути к будущим улучшениям». Google согласился с этим: «И все же, проблемы машинного перевода никоим образом не решены». Тем не менее, если их постоянно дорабатывать, машинный перевод «приближается к уровню перевода человеком», – сказал Норвиг в прошлом месяце на мероприятии ИИ в Университете Нового Южного Уэльса в Сиднее.

Однако даже если машинный перевод сможет превзойти людей-переводчиков, результат все еще будет далек от совершенства.

«Мы поняли, что перевод, выполненный человеком, не всегда адекватен. Люди-переводчики тоже совершают ошибки: у них строгие ограничения по времени, они торопятся, они не всегда понимают исходный материал, и потому они могут переводить неправильно. Возможно, нам нужно не достигать уровня людей-переводчиков, а научиться исправлять все ошибки, которые они, как и все мы, могут допустить», – заявил Норвиг.

По его мнению, совершенства можно достичь, если встроить в машинный перевод новую функцию: так называемую житейскую мудрость. «В мире есть некоторые вопросы, на которые можно ответить, только если понимать, как устроен мир»,  – говорит Норвиг.

Препятствия и шар для боулинга

Норвиг доказывает свою точку зрения на следующем примере:

«Если я скажу: «Я уронил на стол стакан, он треснул», то вы понимаете, что треснул стакан. А если я скажу: «Я уронил на стол шар для боулинга, он треснул», то вы поймете, что скорее всего треснул стол. И это не связано с лингвистикой, это относится к физике и пониманию мира. Чтобы передавать смысл правильно, нам придется научить систему машинного перевода понимать мир».

Обучение машинных систем тому, как устроен мир, – чрезвычайно сложная идея. Конкретный подход еще не выработан, но в качестве подсказок могут быть использованы видео из YouTube, намекнул Норвиг.

«Если мы хотим, чтобы все было правильно, нам придется сказать, мол, понимаете, вот вам все видео в мире на YouTube, вот вам объяснение, как стаканы падают на столы, и вот сейчас вам требуется не только понимать строение предложения, но и устройство мира. И никто еще не пытался так сделать. Однако это необходимо для достижения идеального перевода».

Последствия появления технологий мгновенного и точного перевода колоссальны и коснутся не только компаний, использующих такой перевод, но и, возможно, всего человечества.

Как сказал Цукерберг: «Понимая язык другого человека, становишься ближе к нему, и я с нетерпением жду, когда смогу сделать универсальный перевод реальностью».

Норвиг согласен с этим: «Мы добились гораздо больших результатов, чем я ожидал. Когда-нибудь мы сможем найти комплексное решение для машинного перевода. Нам станет проще наладить общение между двумя людьми, которые иначе бы не смогли говорить друг с другом, – я очень хочу дать миру такую возможность».

Подпишитесь на нашу рассылку! Раз в месяц мы будем присылать вам дайджест лучших материалов с нашего сайта и специальные предложения.

Джордж Нотт [George Nott], ComputerWorld