Top.Mail.Ru
PROMT рассказал на AINL о будущем перевода
04.06.2013

PROMT рассказал на AINL о будущем перевода

На прошедшей в Санкт-Петербурге конференции «AINL: Искусственный интеллект и естественный язык» руководитель группы статистических исследований PROMT Александр Молчанов рассказал о том, какие проблемы возникают при разработке статистических и гибридных систем машинного перевода и как они решаются.

PROMT разрабатывает статистический и гибридный перевод последние несколько лет, и первые решения уже сданы заказчикам и успешно работают. Поэтому теперь, оглядываясь на накопленный опыт, можно выделить несколько типичных проблем, встающих перед разработчиками.

Так, на этапе разработки системы для нового заказчика часто обнаруживается нехватка качественных исходных данных (для тренировки статистической системы нужно 1,5-2 млн. словоупотреблений, для гибридной – около 500 тыс.). Кроме того, разработчикам приходится решать задачи восстановления регистра при переводе и снятия нестабильности при использовании статистических компонентов. В чем проявляются и как решаются эти проблемы, подробно изложено в докладе «Статистические методы в машинном переводе: проблемы роста».

Конференция AINL прошла уже во второй раз. Ее основными темами стали распознавание и синтез речи, искусственный интеллект и диалоговые системы, инженерия знаний и онтологии, извлечение данных и data mining. Мероприятие посетили более 250 ведущих российских и зарубежных специалистов в сфере искусственного интеллекта и автоматической обработки естественного языка.

Среди докладчиков были представители крупных российских и зарубежных IT-компаний и научных организаций, в том числе фонда «Сколково», технопарка «Ингрия», СПбГУ, Fujitsu, Mail.Ru, i-Free Innovations, «Яндекса», НП РУССОФТ.


Возврат к списку