Переводчик Google сумел перевести предложения между парами языков, которым его не учили

24.11.2016, 10:12

Переводчик Google сумел перевести предложения между парами языков, которым его не учили

24.11.2016, 10:12

Нейросетевой переводчик Google удивил разработчиков своей способностью переводить предложения между парами языков, которым его не обучали. Об этом сообщает телеграм-канал «Технологии, медиа и общество».

Создатели нового алгоритма перевода на основе нейросети Google Neural Machine Translation обучали его на примерах трёх языков — английского, японского и корейского. Нейросети продемонстрировали примеры перевода между английским и японским и между английским и корейским. Разработчики решили проверить, сможет ли нейросеть переводить с корейского на японский и обратно, если её этому не учили. Предположение учёных оказалось верным: алгоритму удалось сгенерировать осмысленный перевод между новыми для него парами языков. Это явление учёные назвали «zero-shot translation».

«Насколько нам известно, это первый раз, когда такой тип обучения сработал для машинного перевода», — сообщают в блоге компании Google. Разработчики предполагают, что алгоритм не использовал для промежуточного перевода английский, а создал в процессе обучения свой собственный язык-посредник.

В сентябре специалисты по искусственному интеллекту Google сообщили о создании системы машинного перевода Neural Machine Translation (NMT), основанной на технологии глубокого обучения нейросети. Новый алгоритм учитывает значение не только отдельных слов, но и предложений в целом. Благодаря этому перевод становится ближе к человеческой речи. В компании пообещали что новая разработка уменьшит количество ошибок службы перевода Google Translate минимум на 60%. Сейчас система работает для восьми языков.

Всего Google Translate поддерживает 103 языка и переводит более 140 миллиардов слов каждый день. Как пишут в блоге компании, переход на GNMT позволил значительно улучшить качество перевода для языков, на которых его испытывали. Но введение этой системы для всех 103 поддерживаемых языков может представлять большие трудности.