Английская версия Русская версия Немецкая версия Французская версия Испанская версия Finland Brazil Mexico Argentina> Colombia

Разработка решений
для автоматизированного перевода

Для Big Data


PROMT Морфо-синтаксический анализатор

PROMT Морфо-синтаксический анализатор – это программа для Windows, которая выполняет глубокий морфологический, синтаксический и семантический анализ заданного текста на естественном языке. В настоящий момент поддерживаются следующие языки:

  • Английский
  • Французский
  • Испанский
  • Итальянский
  • Португальский
  • Русский

PROMT Морфо-синтаксический анализатор анализирует предложения любого уровня сложности и вложенности. Так как PROMT занимается разработкой решений по машинному переводу уже более 20 лет, в компании созданы передовые алгоритмы по разбору текстов на естественных языках, которые могут использоваться не только для перевода, но также и в фактографических системах, системах реферирования, системах data mining и в любых информационных системах, основанных на интеллектуальном полнотекстовом поиске информации.

Лингвистическая база данных содержит более 30 миллионов словоформ и позволяет вводить новые слова и модели, такие как новые семантические классы или определяемые пользователем синтаксические модели. Инструментарий для ввода новых классов и моделей может быть поставлен клиенту вместе с PROMT Морфо-синтаксический анализатор.

Результат по умолчанию для каждого данного предложения включает в себя (и может быть расширен при необходимости):

  • Границы предложения.
  • Границы простых предложений в пределах сложного предложения.
  • Синтаксические группы в пределах предложения (именные группы, глагольные группы и т. д.).
  • Результат для каждой лексической позиции:
    • Часть речи (существительное, прилагательное, глагол и т. д.).
    • Грамматическая форма с расширенными морфологическими и синтаксическими характеристиками. Например:
      • Для существительных: род, число, семантический класс, одушевленность и т. д.
      • Для глаголов: лицо, число, время, род, залог, наклонение, возвратность, переходность, семантический класс и т. д.
    • Синтаксическая роль в предложении (подлежащее, сказуемое, дополнение и т. д.).
    • Исходная (словарная) форма.
  • Идентификация специальных лексических единиц: людей, дат, названий компаний и организаций, географических названий и т. д.

Результат выдается в формате XML , который легко может быть проанализирован. Комплектация продукта также содержит средство визуализации результатов анализа для экспертной оценки.