Организация «Yandex» сообщила о внедрении смешанной системы передвижения: предполагается, что свежий подход позволит увеличить качество выдаваемых итогов.
Сервис «Yandex.Транслятор» первоначально применял статистическую модель. При передвижении она делит предложения на кусочки (некоторые слова и фразы) и для любого из них выбирает все вероятные переводы с указанием их вероятности. Потом система составляет из переведённых отрывков различные виды нового предложения. Выбирается тот вариант, который имеет переводы с большими возможностями и в котором отрывки прекрасно совмещаются вместе.
Преимуществом способа считается то, что система прекрасно запоминает и переводит необычные и трудные слова и фразы. Дефицит — «машинность» передвижения: документ насколько бы сконцентрирован из автономных кусочков.
Сейчас к статистическому переводу дополняется перевод на базе нейронной сети. Как и статистический транслятор, нейронная сеть подвергает анализу массив синхронных текстов и обучается считать в них закономерности. При этом разумность несколько другая: нейросеть действует с целыми услугами, другими словами не происходит деление на слова и фразы. Такой подход, как принимается, дает возможность учесть смысловые связи внутри предложения, другими словами осознать контекст. В итоге, перевод выходит не менее натуральным.
Однако у нейросетевого передвижения также есть собственные минусы: если по некоторым основаниям системе не чунаётся перевести то либо другое предложение, она начинает просто-напросто гадать верный ответ.
Потому «Yandex» ввел смешанную технологию. Сейчас перевод осуществляют обе модификации, а потом метод на базе способа механического изучения CatBoost приравнивает итоги и предлагает самый лучший.
В настоящее время смешанная система применяется в веб-версии «Yandex.Переводчика» для переводов с английского языка на русский. В обозримые месяцы она заработает и для иных назначений.