Top.Mail.Ru
Повышение качества машинного перевода с помощью глоссариев | PROMT

НАСТРОЙКА НЕЙРОННОГО МАШИННОГО ПЕРЕВОДА НА ГЛОССАРИЯХ

Использование глоссариев - один из самых простых и эффективных способов настройки машинного перевода

Что такое глоссарии машинного перевода?

Глоссарии машинного перевода представляют собой список слов и словосочетаний с переводами. Глоссарии МП похожи на терминологические базы (term bases), но предназначены для использования не лингвистами, а системой машинного перевода. Именно поэтому глоссарии для МП создаются по определенным правилам (допустимые части речи, учет регистра, для каждого термина только один перевод и др.).

При подключении к системе МП глоссарии помогают улучшить качество МП, обеспечивая нужный перевод системой МП заранее определенных слов и словосочетаний.

Важно! Глоссарий МП не переобучает модель нейронного перевода. Глоссарий только обеспечивает нужный перевод указанных в нем терминов.

Почему глоссарии машинного перевода важны для настройки?

Обучение нейронной модели на параллельных данных, предоставленных заказчиком – самый быстрый и эффективный способ настройки. Однако для обучения требуется 10 000 + предложений на языке оригинала и их переводов. Такими данными обладает незначительное число компаний. Кроме того, для обучения модели требуется специальное ПО и компетенции сотрудников по тренировке движков нейронного машинного перевода.

В то же время в распоряжении значительного числа компаний есть либо терминологические глоссарии, либо компетенция сотрудников, позволяющая определить правильный перевод того или иного термина.

Поскольку глоссарии адаптированы к конкретной терминологии предметной области или компании, они помогают машинному переводу быть намного более точным, чем перевод только на основе нейронной модели, натренированной на общих данных.

Что такое глоссарии машинного перевода?

Глоссарии машинного перевода представляют собой список слов и словосочетаний с переводами. Глоссарии МП похожи на терминологические базы (term bases), но предназначены для использования не лингвистами, а системой машинного перевода. Именно поэтому глоссарии для МП создаются по определенным правилам (допустимые части речи, учет регистра, для каждого термина только один перевод и др.).

При подключении к системе МП глоссарии помогают улучшить качество МП, обеспечивая нужный перевод системой МП заранее определенных слов и словосочетаний.

Важно! Глоссарий МП не переобучает модель нейронного перевода. Глоссарий только обеспечивает нужный перевод указанных в нем терминов

Почему глоссарии машинного перевода важны для настройки?

Обучение нейронной модели на параллельных данных, предоставленных заказчиком – самый быстрый и эффективный способ настройки. Однако для обучения требуется 10 000 + предложений на языке оригинала и их переводов. Такими данными обладает незначительное число компаний. Кроме того, для обучения модели требуется специальное ПО и компетенции сотрудников по тренировке движков нейронного машинного перевода.

В то же время в распоряжении значительного числа компаний есть либо терминологические глоссарии, либо компетенция сотрудников, позволяющая определить правильный перевод того или иного термина.

Поскольку глоссарии адаптированы к конкретной терминологии предметной области или компании, они помогают машинному переводу быть намного более точным, чем перевод только на основе нейронной модели, натренированной на общих данных

Как работает глоссарий в машинном переводе PROMT?

PROMT Neural Dictionary – специальная технология нейронного словаря на основе глоссариев, доступная для Windows- и Linux- систем PROMT. Простой пользовательский интерфейс позволяет использовать эту технологию любому пользователю без специальных знаний и навыков программирования.

Требования для добавления материала в PROMT Neural Dictionary также очень просты: одно слово + один перевод.

Поддерживается ручной и автоматический режим добавления данных: можно добавить одно слово или загрузить целый глоссарий без ограничений по количеству записей.

SmartND

Простой пользовательский интерфейс

Учитывает контекст

Термины в нужном роде, числе, падеже

 
Поддержка языков: английский < > русский, английский < > французский, английский < > немецкий

SimpleND

Простой пользовательский интерфейс

Без учета контекстаи

Термины остаются в той же форме, что и в глоссарии

10+ языков, 45+ языковых пар

Шаг 1
Подготовить глоссарий в соответствии с требованиями.
Шаг 2
Добавить глоссарий в систему перевода PROMT в ручном или автоматическом режиме.
Шаг 3
Выполнить перевод текста или документа.

Советы при выборе терминов для глоссария МП

НЕ РЕКОМЕНДУЕТСЯ ДОБАВЛЯТЬ
В ГЛОССАРИЙ

  • Частотные слова с общелексическими переводами
    accident – авария

  • Частотные слова с узкоспециальным переводом
    vessel – сосуд (ср. судно)

РЕКОМЕНДУЕТСЯ ДОБАВЛЯТЬ
В ГЛОССАРИЙ

Имена собственные

Аббревиатуры

Словосочетания

Исходный текст

The cable ladder is preferred to ensure cooling cables.

Перевод без глоссария

Кабельная лестница предпочтительна для обеспечения охлаждающих кабелей.

Перевод с глоссарием

Предпочтение отдается лестничному лотку для обеспечения охлаждающих кабелей.

Примеры внедрения

Функция настройки на глоссариях поддерживается во всех корпоративных переводчиках PROMT: PROMT Neural Translation Server для Linux и Windows, PROMT Professional NMT.

Как подключить словарь PROMT на основе глоссария в систему перевода



Остались вопросы?
Свяжитесь с нами для получения консультации по корпоративным решениям PROMT.

Отправить