Качество нейросетевого машинного перевода действительно высокое ?
Применение нейронных сетей совершило революцию в области машинного перевода, и современные технологии действительно позволяют получить перевод высокого качества. Стартовое качество нейросетевого машинного перевода (NMT) намного выше, чем перевод, получаемый с помощью других технологий. Обучение нейронной сети проводитсяна корпусах параллельных текстов, где переводы выполнены человеком, и в процессе обучения нейросеть оперирует не отдельными фразами, а целыми предложениями. Благодаря умной технологии и высокому качеству данных результат получается гладким, без «машинного акцента», а все слова в предложении согласованы между собой и стоят в правильном порядке.
Почему нужно обучать систему машинного перевода?
Во многих случаях при переводе текстов общей тематики с помощью NMT результат почти не уступает переводу, выполненному человеком. Однако при переводе узкоспециализированных текстов система машинного перевода может ошибаться в терминологии и в переводе некоторых синтаксических конструкций.
Универсальные модели NMT не подходят для перевода узкоспециализированных текстов, так как они порождают преимущественно общеупотребимые переводы слов и не сильны в предметной терминологии. Поэтому для узких переводческих задач их нужно обучать дополнительно.
На каких данных можно обучать нейросетевой машинный перевод?
NMT переводчики PROMT можно обучать на параллельных текстах, которые создаются в CAT-системах (translation memories), или на глоссариях со специализированной терминологией. Для обучения системы нужно не менее 100 000 предложений на оригинальном языке и их переводов. Можно делать обучение и на меньших объемах, но тогда прирост в качестве перевода может быть не таким заметным. Глоссарий можно использовать в дополнение к translation memories или как самостоятельный инструмент. С помощью глоссария можно контролировать перевод отдельный узкоспециализированных терминов. Больше о возможностях обучения и кастомизации переводчиков PROMT можно узнать в нашем блоге.
Если Вас заинтересовала эта информация, то напишите нам на corporate@promt.ru, и мы предоставим Вам бесплатный доступ к нашему решению.
Подписаться на новости
Веб-форма не найдена.