13.08.2019

Нейросети на WMT: машинный перевод соперничал с человеком

1 - 2 августа во Флоренции состоялась Четвертая конференция по машинному переводу (WMT-2019), организованная Ассоциацией компьютерной лингвистики (ACL). В мероприятии приняли участие крупные международные разработчики, в том числе - компания PROMT.

Каждый год, в рамках Ассоциации компьютерной лингвистики, специалисты в области машинного перевода, представители коммерческих организаций и научно-исследовательских групп со всего мира соревнуются друг с другом. В течение определенного времени они тренируют свои системы на материалах, предоставленных в рамках соревнования. Как правило, это тексты ООН и новости. После тренировки участники делают тестовые переводы с помощью своих систем и предоставляют их для экспертной и автоматической оценки.

В последние несколько лет участники конференции активно представляют системы перевода на основе нейронных сетей. В рамках конференции много говорили о том, что нейросетевые технологии демонстрируют беспрецедентный рост качества машинного перевода. В связи с этим организаторы и участники конференции задумались над обновлением метрик для оценки качества перевода и сравнения систем. Например, было предложено уйти от сравнения качества перевода на отдельных предложениях к сравнению качества перевода документов целиком.

Компанию PROMT на WMT-2019 с новой технологией PROMT Neural представлял Александр Молчанов, руководитель отдела статистического и нейросетевого перевода. Он принял участие в постерной сессии, пообщался с коллегами и организаторами мероприятия, познакомил присутствующих с разработками и исследованиями PROMT в области нейронных сетей.

"Сегодня качество перевода неспециализированных текстов с помощью нейронных сетей очень высокое", - отметил он, - "Основной вызов сейчас - это возможность обучать нейронную сеть на разных типах данных от заказчика: на специализированных корпусах параллельных текстов разного объема или глоссариях. Кроме того, важно уметь подбирать тематически релевантный материал, если у заказчика нет данных для обучения нейронных сетей".


Возврат к списку