Константы и флаги ядра NLP

Общие флаги
КонстантаЗначениеОписаниеПримерПримечание
1. Разрешение анафорРазрешение анафор
FLAG_COREFERENCE 100 Разрешение анафор местоимений На столе стояла ваза. Она (ваза) фарфоровая!-- Применяется в graphvectext (сбор вектора по графу), questionanswer (создание вопросно ответных пар по графу) --
2. Константы .boundГраницы смысловых блоков текста
BOUND_X0Не определено
BOUND_BREAK1Граница смыслового блока, как рассчитал алгоритм"Вася ехал на самокате, а Петя на роликах" = "Вася ехал на самокате" / "Петя на роликах"Может быть обозначено либо не обозначено знаком препинания
3. Константы .pos (части речи)Части речи
POS_X0Не определеноМожет применяться в виде параметров для создания условий идентификации слов и в виде параметров poolvectors (сливание векторов), graphvectext (сбор вектора по графу)
POS_NOUN1Существительноестол---
POS_VERB2Глаголчитать---
POS_ADJ3Прилагательноекрасивый---
POS_CONJ4Союзи---
POS_PRON5Местоимениеон---
POS_GER6Деепричастиечитая---
POS_PRTCP7Причастиепрочитанный---
POS_ADV8Наречиебыстро---
POS_NUM9Числительноетри---
POS_PART10Частицаже---
POS_PREP11ПредлогвВ .prep (у слова к которому относится этот предлог) индекс этого предлога
POS_INTJ12Междометиеой---
POS_INF13Инфинитивделать---
POS_QSC14Вопросная конструкция (ВСК)В какое время? Каким образом?В .qsc 0 если это не ВСК или количество слов в нее входящие
POS_NEG15ОтрицаниенеВ .prep (у слова к которому относится это слово отрицание) индекс этого слова отрицания
POS_NUM_VAL16Число (цифры)150---
4. Константы .user (кастомные категории)Пользовательские метки
USER_X0По умолчаниюСлово не помечено меткой
USER_TAG_01Тег пользователяможно указать любую меткуМожет применяться для быстрого тестирования и визуализации в окне Лога вызываемого nlplog
USER_TAG_12Тег пользователя...---
USER_TAG_23Тег пользователя...---
USER_TAG_34Тег пользователя...---
USER_TAG_1111Тег пользователя...---
5. Константы .gen (род)---
GEN_X0Неизвестно---
GEN_MASC1Мужскойстол---
GEN_FEM2Женскийкнига---
GEN_NEUT3Среднийморе---
6. Константы .num (число)---
NUM_X0Неизвестно---
NUM_SING1Единственноедерево---
NUM_PLUR2Множественноедеревья---
7. Константы .case (падеж)---
CASE_X0Неизвестно---
CASE_NOM1Именительныйдом стоит---
CASE_GEN2Родительныйнет дома---
CASE_DAT3Дательныйк дому---
CASE_ACC4Винительныйвижу дом---
CASE_INS5Творительныйдомом---
CASE_LOC6Предложныйо доме---
CASE_VOC7Звательныйнеопределенное - доме---
CASE_PART8Партитивчайку---
8. Константы .anim (одушевлённость)---
ANIM_X0Неизвестно---
ANIM_ANIM1Одушевлённоечеловек---
9. Константы .trans (переходность)---
TRANS_X0Неизвестно---
TRANS_INTR1Непереходныйспать---
TRANS_TR2Переходныйчитать книгу---
10. Константы .motion (движение)---
MOTION_X0Неизвестно---
MOTION_VERB1ДвижениеидтиГлагол означающий движение
11. Константы .refl (возвратность)---
REFL_X0Неизвестно---
REFL_FALSE1Невозвратныймыть---
REFL_TRUE2Возвратныймыться---
12. Константы .asp (вид)---
ASP_X0Неизвестно---
ASP_PERF1Совершенныйсделал---
ASP_IMP2Несовершенныйделать---
13. Константы .tense (время)---
TENSE_X0Неизвестно---
TENSE_PAST1Прошедшееделал---
TENSE_PRES2Настоящееделает---
TENSE_FUT3Будущеесделает---
14. Константы .ner (сущности)Словарные метки словам
NER_X0Неизвестно---
NER_ABBR1АббревиатураЖКХ---
NER_NUM2Числовое значение2025---
NER_NAME3ИмяДмитрий---
NER_FAM4ФамилияМенделеев---
NER_PATR5ОтчествоИванович---
NER_ORG6ОрганизацияСтройМаш---
NER_GEO7Гео-объектОдесса---
NER_NAME_FAM8Имя/фамилияспорные---
NER_ABBR_ORG9Аббревиатура/организацияспорные---
NER_PATR_FAM10Отчество/фамилияспорные---
NER_ABBR_GEO11Аббревиатура/геоспорные.. СНГ---
NER_QUAL12Качество/признакэлитный---
15. Константы .prontype (тип местоимения)---
PRON_X0Неизвестно / не применимо---
PRON_PERS1Личныея, ты, он---
PRON_REFL2Возвратныесебя---
PRON_POSSE3Притяжательныемой, твой---
PRON_DEMON4Указательныеэтот, тот---
PRON_INTER5Вопросительныекто, что---
PRON_REL6Относительныекоторый---
PRON_DEFI7Определительныевсякий, любой---
PRON_INDEF8Неопределённыекто-то, что-нибудь---
PRON_NEG9Отрицательныеникто, ничего---
16. Константы .pers (лицо)---
PERS_X0Неизвестно---
PERS_11Первое лицоя---
PERS_22Второе лицоты---
PERS_33Третье лицоон---
17. Константы .conj (тип союза)Разделяет / Не разделяет сложное предложение на простые
CONJ_X0Неизвестно---
CONJ_PART1Не делит на смысловые блокиВася и Петяtxt.conj[1]=CONJ_PART;
CONJ_FULL2Делит на смысловые блокиВася ехал на самокате, а Петя на роликахtxt.conj[4]=CONJ_FULL;
16. Константы .dep (синтаксические зависимости)---
DEP_X0Прочее / неизвестноечастицы, союзы, предлоги---
DEP_SUBJ1Подлежащеедерево---
DEP_PRED2Сказуемоерастет---
DEP_OBJ3Дополнениекнигу---
DEP_ATTR4Определение / атрибуткрасный---
DEP_ADV5Обстоятельствобыстро---
DEP_GER6Деепричастиеулыбаясь---
DEP_PART7Частицабы, ведь---
19. Константы .recog (статус распознавания слова)Распознано по базе / Распознано по контенту / Не распознано
RECOG_X0Не найдено в базе и не распознако контентомневозможно распознатьСлово отсутствует в базе и не было распознанно по контенту ввиду его отсутствия
RECOG_CONTEXT1Распознано контекстомраспознано на уровне контентаСлово отсутствует в базе, но было распознанно алгоритмом по контенту
RECOG_BASE2Распознано по базеприсутствует в базеСлово присутствует в базе и распорзнанно по ней
20. Выбор векторной базыСемантическая / Отношения / Категории
FLAG_VEC_SIM1SIM-векторасемантическое сходство (молоток - кувалда) Применяется в findvectoridx (возвращает ID вектора в базе), findvector (возвращает вектор с базы), nearvector (получение топ близких слов по векторным базам), poolvectors (сливание векторов), graphvectext (сбор вектора по графу), texttovec (обобщенный вектор текста)
FLAG_VEC_REL2REL-вектораотношения (забить - молотком)---
FLAG_VEC_CAT4Категориисемантические категории (молоток - бытовой_и_малогабаритный_инструмент)---
21. POS-фильтры для nearvectorФильтрация по частям речи
FLAG_POS_NOUN1Только существительныестолПрименяется в nearvector (получение топ близких слов по векторным базам) для фильтрации собранных слов или категорий
FLAG_POS_VERB2Только глаголыидти---
FLAG_POS_ADJ4Только прилагательныекрасный---
FLAG_POS_ADV8Только наречиябыстро---
22. Внутренние поля токенаПрименяется при составление условий идентификации слова
NEGЯвляется ли слово отрицаниемне, нетstring Tagset="NEG"; Указывает что слово является отрицанием. Tagset могут быть сложносоставными: string Y2=" POS_NOUN GEN_MASC CAT:человек|личное_имя|профессия:5"; Применяется в poolvectors (сливание векторов), graphvectext (сбор вектора по графу)
PREPЯвляется ли слово предлогомпо, в, наstring Tagset="PREP"; Указывает что слово является предлогом. Аналогично NEG