Кастомизация машинного перевода

Качество нейросетевого  машинного перевода действительно высокое ?
Применение нейронных сетей совершило революцию в области машинного перевода, и современные технологии действительно позволяют получить перевод высокого качества. Стартовое качество нейросетевого машинного перевода (NMT) намного выше, чем перевод, получаемый с помощью других технологий. Обучение нейронной сети проводитсяна корпусах параллельных текстов, где переводы выполнены человеком, и в процессе обучения нейросеть оперирует не отдельными фразами, а целыми предложениями. Благодаря умной технологии и высокому качеству данных результат получается гладким, без «машинного акцента», а все слова в предложении согласованы между собой и стоят в правильном порядке.

Почему нужно обучать  систему машинного перевода?
Во многих случаях  при переводе текстов общей тематики с помощью NMT результат почти не уступает переводу, выполненному человеком. Однако при переводе узкоспециализированных текстов система машинного перевода может ошибаться в терминологии и в переводе некоторых синтаксических конструкций.

Универсальные модели NMT не подходят для перевода узкоспециализированных текстов, так как они порождают преимущественно общеупотребимые переводы слов и не сильны в предметной терминологии. Поэтому для узких переводческих задач их нужно обучать дополнительно.

На каких данных можно обучать нейросетевой машинный перевод?
NMT переводчики PROMT можно обучать на параллельных текстах, которые создаются в  CAT-системах (translation memories), или на глоссариях со специализированной терминологией.  Для обучения системы нужно не менее 100 000 предложений на оригинальном языке и их переводов. Можно делать обучение и на меньших объемах,  но тогда прирост в качестве перевода может быть не таким заметным. Глоссарий можно использовать в дополнение к translation memories или как самостоятельный инструмент. С помощью глоссария можно контролировать перевод отдельный узкоспециализированных терминов.  Больше о возможностях обучения и кастомизации  переводчиков PROMT можно узнать в нашем блоге.

Если Вас заинтересовала эта информация, то напишите нам на  corporate@promt.ru, и мы предоставим Вам бесплатный доступ к нашему решению.