Английская версия Русская версия Немецкая версия Французская версия Испанская версия Finland Brazil Mexico Argentina> China

Разработка решений
для автоматизированного перевода

Для Big Data


PROMT Analyzer SDK

Программное обеспечение «PROMT Analyzer SDK» представляет собой масштабируемое серверное программное обеспечение для анализа текстов на естественных языках с целью поиска, извлечения и обобщения информации о сущностях, фактах, событиях и их связях, путем лингвистического анализа соответствующих текстов с учетом синтаксиса и семантики.

В настоящий момент поддерживаются следующие языки:

  • Английский
  • Французский
  • Испанский
  • Итальянский
  • Португальский
  • Русский

PROMT Analyzer SDK анализирует предложения любого уровня сложности и вложенности. Так как PROMT занимается разработкой решений по машинному переводу уже более 20 лет, в компании созданы передовые алгоритмы по разбору текстов на естественных языках, которые могут использоваться не только для перевода, но также и в фактографических системах, системах реферирования, системах data mining и в любых информационных системах, основанных на интеллектуальном полнотекстовом поиске информации.

Лингвистическая база данных содержит более 30 миллионов словоформ и позволяет вводить новые слова и модели, такие как новые семантические классы или определяемые пользователем синтаксические модели. Инструментарий для ввода новых классов и моделей может быть поставлен клиенту вместе с PROMT Analyzer SDK.

Результат по умолчанию для каждого данного предложения включает в себя (и может быть расширен при необходимости):

  • Границы предложения.
  • Границы простых предложений в пределах сложного предложения.
  • Синтаксические группы в пределах предложения (именные группы, глагольные группы и т. д.).
  • Результат для каждой лексической позиции:
    • Часть речи (существительное, прилагательное, глагол и т. д.).
    • Грамматическая форма с расширенными морфологическими и синтаксическими характеристиками. Например:
      • Для существительных: род, число, семантический класс, одушевленность и т. д.
      • Для глаголов: лицо, число, время, род, залог, наклонение, возвратность, переходность, семантический класс и т. д.
    • Синтаксическая роль в предложении (подлежащее, сказуемое, дополнение и т. д.).
    • Исходная (словарная) форма.
  • Идентификация специальных лексических единиц: людей, дат, названий компаний и организаций, географических названий и т. д.

Документация:

Описание PROMT Analyzer SDK >>