Google создал точный переводчик на основе нейросетей
Специалисты по искусственному интеллекту из Google представили новую систему машинного перевода, которая основана на принципах глубинного обучения. Описание системы выложено в виде препринта в базе arXive.org.
Точный машинный перевод с одного языка на другой является одной из классических задач в области искусственного интеллекта.
Популярные системы машинного перевода можно грубо разделить на традиционные, основанные на переводе отдельных фраз, и на более новые, основанные на нейронных сетях, учитывающих не только типичное значение фразы, но и ее контекст. Нейронные сети, которые используются в этом последнем случае, чаще всего относятся к классу рекуррентных, их основным отличием является то, что их ответ зависит не только от поступающих на вход данных, но и от предыдущего состояния сети. Это позволяет системам «помнить» о том, что они "видели" раньше, и учитывать это при выборе того или иного ответа.
Новая система пока натренирована всего на нескольких языковых парах: английском и китайском, английском и французском, английском и испанском. Наилучшие результаты по сравнению с предыдущими системами самого Google показал последняя пара.
Авторы в своей работе не пытались добиться максимально точного результата, а скорее стремились к балансу между правильностью перевода и вычислительной сложностью. Для этого использовалось множество эвристик, которые упрощают и ускоряют работу системы, но могут вести к ошибкам. Поэтому увеличение времени обучения и доступность вычислительных ресурсов могут еще больше увеличить точность перевода даже без существенной переработки архитектуры новой системы.