Top.Mail.Ru
ЭЛЕКТРОННОЕ ХРАНИЛИЩЕ ПЕРЕВОДОВ ТЕПЕРЬ ДОСТУПНО РАЗРАБОТЧИКАМ СТАНДАРТОВ И ИМПОРТЕРАМ
19.05.2000

ЭЛЕКТРОННОЕ ХРАНИЛИЩЕ ПЕРЕВОДОВ ТЕПЕРЬ ДОСТУПНО РАЗРАБОТЧИКАМ СТАНДАРТОВ И ИМПОРТЕРАМ

Москва, 19 мая 2000 г. — Госстандарт России, американская компания Global Management and Consulting Services (GMCS), Inc, российские компании ПРОект МТ (ПРОМТ), лидер в области разработок систем машинного перевода, и компания ABBYY Software House, производитель систем распознавания FineReader и лингвистического ПО, объявляют об окончании проекта по переводу международных и российских стандартов и созданию баз данных переводов стандартов.

Проект предусматривал разработку Автоматизированного рабочего места переводчика (АРМП) для перевода международных и национальных стандартов других стран на русский язык, а российских стандартов - на английский. Переведенные стандарты заносились в базы данных (БДПС), которые содержат изображения документов, их распознанные тексты и соответствующие им переводы. Создаваемые базы данных переводов являются приоритетными в связи с планируемым вступлением России во Всемирную торговую организацию (ВТО) и необходимостью проведения работ по гармонизации российских стандартов и обеспечения доступности российских стандартов зарубежным пользователям.

Данная работа осуществлялась в рамках проекта «Развитие стандартизации», финансирующегося Международным банком реконструкции и развития. Генеральным подрядчиком в результате тендера, проведенного по правилам банка, была выбрана компания GMCS. Основным преимуществом компании GMCS стал ее опыт в организации выполнения многоаспектных комплексных проектов и привлечение квалифицированных подрядчиков, которыми в данном проекте выступили компании ABBYY Software House и ПРОМТ.

Евгений Петросян, начальник Научно-технического управления Госстандарта России: «Получив возможность осуществления крупномасштабной работы по переводу стандартов, мы планировали получить в результате не только собственно переведенные документы, но и инструмент для дальнейших работ по переводу, а также средство для хранения документов, обеспечивающее эффективный поиск и доступ пользователей корпоративной сети Госстандарта России».

На первом этапе работ компания ABBYY Software House обеспечила всех переводчиков адаптированной системой распознавания FineReader Professional и электронным англо-русским словарем ABBYY Lingvo (с дополнительными словарями по терминологии в области стандартизации).

На втором этапе компания ПРОМТ поставила системы машинного перевода PROMT, которые послужили основой для создания единого многопользовательского комплекса автоматизированных рабочих мест переводчиков (АРМП). В рамках проекта была выполнена адаптация системы перевода для оптимального решения поставленной задачи. В ходе обработки текстовой базы стандартов проводился постоянный мониторинг качества перевода с одновременным пополнением словарной базы системы. Особо следует отметить работу по созданию специализированных терминологических словарей, общий объем которых превысил 1,5 миллиона лексических единиц.

Всего при помощи АРМП было распознано и переведено около 2900 российских и более 1400 международных стандартов общим объемом около 100 тысяч страниц по различных областям стандартизации.

По мнению Михаила Каничева, коммерческого директора компании ПРОМТ «такие проекты служат наглядным подтверждением востребованности технологий машинного перевода и необходимости использования программ-переводчиков при обработке больших текстовых массивов. Попытка решения данной проблемы без использования программ-переводчиков привела бы к существенному увеличению затрат и времени на выполнение этой задачи. Благодаря нашим уникальным технологиям машинного перевода данный проект был выполнен в кратчайшие сроки, что облегчит вступление России во Всемирную Торговую Организацию».

Арам Пахчанян, руководитель службы корпоративных проектов и интеграции технологий компании ABBYY: « …Упрощенно это выглядит так: человек кладет документ в сканер, нажимает на кнопку и в базе данных появляется графический файл с изображением, текст документа и его перевод (!). Использование подобных комплексов, на наш взгляд, имеет хорошие перспективы. При обработке огромных массивов информации они выполняют за человека рутинную работу, на которую обычно приходиться тратить 90% времени».

Во время второго этапа работ все переведенные стандарты, их исходные и переведенные тексты и изображения были загружены в базы данных переводов стандартов (БДПС). Поскольку основной программной платформой в Госстандарте России является Lotus Notes, то и БДПС была организована как база данных Lotus Notes. Но в дополнение к стандартным возможностям этой платформы в БДПС была добавлена возможность полнотекстового морфологического поиска стандартов ABBYY Retrieval & Morphology Engine, которая производит поиск по текстам стандартов, как на русском, так и английском языке.

Константин Корнев, местный менеджер проекта (GMSС): «Основная сложность данного проекта заключалась в одновременной разработке автоматизированного рабочего места переводчика и его эксплуатации в процессе переводов стандартов. Поскольку за сравнительно короткий срок необходимо было перевести значительный объем сложных технических документов по различной тематике, требовалась скоординированная работа переводчиков, редакторов, экспертов, программистов, лингвистов. Доработка программных продуктов и словарей проводилась, что называется «по горячим следам».

Возврат к списку