Список всех помет
Помета | Семантика | Терминал | Нетерминал | Фильтр | Отрицание | Синтаксис |
---|---|---|---|---|---|---|
Статьи с обращением к словарям | ||||||
kwtype | Символ ограничен статей или типом статей указанным в поле kwtype. | + | + | + | + | kwtype="статья1" kwtype="статья1" kwtype= type1 |
kwset | Символ ограничен одной из статей или типов статей, указанных в поле kwset. | + | + | - | + | kwset=[type1,"статья1"] kwset=[type1,"статья1"] |
kwsetf | Ограничение аналогичное kwset, которое применяется к первому (а не к главному) слову группы. | + | + | - | + | kwsetf=[type1,"статья1"] |
label | Символ ограничен списком из статьи указанной в поле label. | + | + | - | + | label="статья1" |
gztweight | Добавляет вес к общему весу нетерминала в левой части правила. Прибавляемый вес находится в словарной статье в поле, название которого указывается в поле пометы gztweight. Помету gztweight можно использовать только вместе с пометой kwtype. | + | + | - | - | kwtype="type1", gztweight=" type1weight" |
Грамматические ограничения | ||||||
gram | Проверяет значения грамматических характеристик отдельно для каждого омонима. | + | + | - | + | gram="sg,pl" |
GU | Проверяет значения грамматических характеристик отдельно для каждого омонима или для всех омонимов одновременно. | - | + | - | + | GU=[nom,sg] GU=[sg] GU=&[nom,acc] |
Согласования | ||||||
gnc-agr | Согласование по роду, числу и падежу: gender number case. | + | + | - | + | Adj<gnc-agr[1]> Noun<gnc-agr[1]> |
nc-agr | Согласование по числу и падежу: number case. | + | + | - | + | N1<nc-agr[2]> N2<nc-agr[2]> |
c-agr | Согласование по падежу: case. | + | + | - | + | Noun<c-agr[3]> 'и' Noun<c-agr[3]> |
gn-agr | Согласование по роду и числу: gender number. | + | + | - | + | |
gc-agr | Согласование по роду и падежу: gender case. | + | + | - | + | |
fem-c-agr | Расширенное согласование gnc-agr, которое допускает рассогласование по роду, если у одного из членов согласования есть граммемы "fem,famn". | + | + | - | + | Noun<fem-c-agr[1]> Noun<fem-c-agr[1]> Сработает так: + врач Анна - врач Михаил |
after-num-agr | Согласование пары прилагательное+существительное после числительного в русском, типа «5 американских президентов», но «2 американских президентА» | + | + | - | ||
sp-agr | Согласование между субъектом и предикатом: subject predicate. | + | + | - | + | Noun<sp-agr[4]> Verb<sp-agr[4]> |
fio-agr | Согласование двух объектов типа fio по формату записи. | + | + | - | + | |
geo-agr | Согласование двух объектов географического тезауруса по принадлежности одной ветви геотезауруса. | + | + | - | ||
Регулярные выражения | ||||||
wfm | Регулярное выражение применяется к словоформе, которая является вершиной синтаксической группы. | + | + | + | + | Word<wfm=".*банк(|a|у|е|ом)/"> |
wff | Регулярное выражение применяется к первой словоформе синтаксической группы. | + | + | + | + | Word<wff="им\\."> |
wfl | Регулярное выражение применяется к последней словоформе синтаксической группы. | + | + | + | + | AnyWord<wfl="[0-9]{3}-[0-9]{2}-[0-9]{2}">; // номер телефона |
Регистр букв в слове | ||||||
h-reg1 | Первая буква слова стоит в верхнем регистре. Помета применяется к началу фразы, а не к вершине. | + | + | + | Noun<h-reg1> | |
h-reg2 | В верхнем регистре стоит первая буква слова и как минимум еще одна буква слова, как например, в слове «МосСтрой». | + | + | + | ||
h-reg | Синоним h-reg2 | |||||
l-reg | Все буквы слова в нижнем регистре. | + | + | + | ||
Кавычки | ||||||
quoted | Слово или группа слов в кавычках. | + | + | - | + | SomeQuote<quoted> SomeName<quoted> |
l-quoted | Слово или группа слов c открывающей кавычкой перед первым символом и без закрывающей кавычки после последнего символа. | + | + | - | + | |
r-quoted | Слово или группа слов c закрывающей кавычкой после последнего символа и без закрывающей кавычки перед первым символом. | + | + | - | + | |
Специальное | ||||||
fw | Самое первое слово символа должно быть первым словом предложения. | + | - | - | + | Lead_in<fw> ProperName<fw> |
mw | Многословная сущность (multiword). | + | - | - | + | Noun<mw> SimpleWord<mw> |
lat | Слово состоит из букв латинского алфавита. | + | + | + | - | Word<lat> |
no_hom | Символ должно состоять из омонимов с одной частью речи. | + | + | - | - | Word<no_hom> |
cut | Слово или синтаксическая группа исключается из интерпретации. | + | + | - | - | MainWords Context<cut> |
rt | Обозначает вершину получившейся синтаксической группы. Строго говоря, rt не является ограничением, а относится к синтаксическим операторам, описанным ранее. | + | + | - | - | NP -> Adj Noun<rt>; |
Словарность | ||||||
dict | Слово должно быть в морфологическом словаре. | + | - | + | + |
Помета | Семантика | Терминал | Нетерминал | Фильтр | Отрицание | Синтаксис |
---|---|---|---|---|---|---|
Статьи с обращением к словарям | ||||||
kwtype | Символ ограничен статей или типом статей указанным в поле kwtype. | + | + | + | + | kwtype="статья1" kwtype="статья1" kwtype= type1 |
kwset | Символ ограничен одной из статей или типов статей, указанных в поле kwset. | + | + | - | + | kwset=[type1,"статья1"] kwset=[type1,"статья1"] |
kwsetf | Ограничение аналогичное kwset, которое применяется к первому (а не к главному) слову группы. | + | + | - | + | kwsetf=[type1,"статья1"] |
label | Символ ограничен списком из статьи указанной в поле label. | + | + | - | + | label="статья1" |
gztweight | Добавляет вес к общему весу нетерминала в левой части правила. Прибавляемый вес находится в словарной статье в поле, название которого указывается в поле пометы gztweight. Помету gztweight можно использовать только вместе с пометой kwtype. | + | + | - | - | kwtype="type1", gztweight=" type1weight" |
Грамматические ограничения | ||||||
gram | Проверяет значения грамматических характеристик отдельно для каждого омонима. | + | + | - | + | gram="sg,pl" |
GU | Проверяет значения грамматических характеристик отдельно для каждого омонима или для всех омонимов одновременно. | - | + | - | + | GU=[nom,sg] GU=[sg] GU=&[nom,acc] |
Согласования | ||||||
gnc-agr | Согласование по роду, числу и падежу: gender number case. | + | + | - | + | Adj<gnc-agr[1]> Noun<gnc-agr[1]> |
nc-agr | Согласование по числу и падежу: number case. | + | + | - | + | N1<nc-agr[2]> N2<nc-agr[2]> |
c-agr | Согласование по падежу: case. | + | + | - | + | Noun<c-agr[3]> 'и' Noun<c-agr[3]> |
gn-agr | Согласование по роду и числу: gender number. | + | + | - | + | |
gc-agr | Согласование по роду и падежу: gender case. | + | + | - | + | |
fem-c-agr | Расширенное согласование gnc-agr, которое допускает рассогласование по роду, если у одного из членов согласования есть граммемы "fem,famn". | + | + | - | + | Noun<fem-c-agr[1]> Noun<fem-c-agr[1]> Сработает так: + врач Анна - врач Михаил |
after-num-agr | Согласование пары прилагательное+существительное после числительного в русском, типа «5 американских президентов», но «2 американских президентА» | + | + | - | ||
sp-agr | Согласование между субъектом и предикатом: subject predicate. | + | + | - | + | Noun<sp-agr[4]> Verb<sp-agr[4]> |
fio-agr | Согласование двух объектов типа fio по формату записи. | + | + | - | + | |
geo-agr | Согласование двух объектов географического тезауруса по принадлежности одной ветви геотезауруса. | + | + | - | ||
Регулярные выражения | ||||||
wfm | Регулярное выражение применяется к словоформе, которая является вершиной синтаксической группы. | + | + | + | + | Word<wfm=".*банк(|a|у|е|ом)/"> |
wff | Регулярное выражение применяется к первой словоформе синтаксической группы. | + | + | + | + | Word<wff="им\\."> |
wfl | Регулярное выражение применяется к последней словоформе синтаксической группы. | + | + | + | + | AnyWord<wfl="[0-9]{3}-[0-9]{2}-[0-9]{2}">; // номер телефона |
Регистр букв в слове | ||||||
h-reg1 | Первая буква слова стоит в верхнем регистре. Помета применяется к началу фразы, а не к вершине. | + | + | + | Noun<h-reg1> | |
h-reg2 | В верхнем регистре стоит первая буква слова и как минимум еще одна буква слова, как например, в слове «МосСтрой». | + | + | + | ||
h-reg | Синоним h-reg2 | |||||
l-reg | Все буквы слова в нижнем регистре. | + | + | + | ||
Кавычки | ||||||
quoted | Слово или группа слов в кавычках. | + | + | - | + | SomeQuote<quoted> SomeName<quoted> |
l-quoted | Слово или группа слов c открывающей кавычкой перед первым символом и без закрывающей кавычки после последнего символа. | + | + | - | + | |
r-quoted | Слово или группа слов c закрывающей кавычкой после последнего символа и без закрывающей кавычки перед первым символом. | + | + | - | + | |
Специальное | ||||||
fw | Самое первое слово символа должно быть первым словом предложения. | + | - | - | + | Lead_in<fw> ProperName<fw> |
mw | Многословная сущность (multiword). | + | - | - | + | Noun<mw> SimpleWord<mw> |
lat | Слово состоит из букв латинского алфавита. | + | + | + | - | Word<lat> |
no_hom | Символ должно состоять из омонимов с одной частью речи. | + | + | - | - | Word<no_hom> |
cut | Слово или синтаксическая группа исключается из интерпретации. | + | + | - | - | MainWords Context<cut> |
rt | Обозначает вершину получившейся синтаксической группы. Строго говоря, rt не является ограничением, а относится к синтаксическим операторам, описанным ранее. | + | + | - | - | NP -> Adj Noun<rt>; |
Словарность | ||||||
dict | Слово должно быть в морфологическом словаре. | + | - | + | + |
Подробно про кавычки
Внуково | "Внуково" | "Внуково | Внуково" | ." | |
quoted | no | yes | no | no | no |
~quoted | yes | no | yes | yes | yes |
l-quoted | no | no | yes | no | no |
~l-quoted | yes | yes | no | yes | yes |
r-quoted | no | no | no | yes | yes |
~r-quoted | yes | yes | yes | no | no |
Внуково | "Внуково" | "Внуково | Внуково" | ." | |
quoted | no | yes | no | no | no |
~quoted | yes | no | yes | yes | yes |
l-quoted | no | no | yes | no | no |
~l-quoted | yes | yes | no | yes | yes |
r-quoted | no | no | no | yes | yes |
~r-quoted | yes | yes | yes | no | no |