[cat : {v, n, a, part, prsp, reflp, demp, posp, indp, relp, intp, pa, adv, prep, ptl, conj, seq} adm : {+adm, -adm} mod : {ind, konj, opt, imp} stat : {act, pass} temp : {prs, ipf, aor} pers : {1, 2, 3} num : {sg, pl} gen : {fem, masc, neutr} case : {nom, gen/dat, acc, abl} def : {+def, -def} weak : {+weak, -weak} idpt : {+idpt, -idpt}]
Erläuterungen:
v
bedeutet Verb
n
bedeutet Nomen
a
bedeutet Adjektiv
part
bedeutet Partizip
prsp
bedeutet Personalpronomen
reflp
bedeutet Reflexivpronomen
demp
bedeutet Demonstrativpronomen
posp
bedeutet Possessivpronomen
indp
bedeutet Indefinitpronomen
relp
bedeutet Relativpronomen
intp
bedeutet Interrogativpronomen
pa
bedeutet Vorangestellter Artikel
ptl
bedeutet Partikel
adv
bedeutet Adverb
prep
bedeutet Präposition
conj
bedeutet Konjunktion
seq
bedeutet Satzäquivalent
Da die Wertmengen der einzelnen Merkmale disjunkt sind, können die Features in den einzelnen Listen weggelassen werden, sie sind hier nur aufgeführt, um die Übersicht zu behalten. Die eckigen Klammern bleiben, um tags (im Lexikon?) eindeutig als solche identifizierbar zu machen. Die einzelnen Werte werden nur durch Leerzeichen getrennt. Ein Tag sähe dann beispielsweise so aus:
[v act prs 1 sg fem]
zu -idpt bei posp gehört auch noch eine komplexe Featurestuktur:
[agr : [num : {sg, pl} gen : {fem, masc}] inh : [num : {sg,pl} gen : {fem, masc} pers: {1,2,3}] art : [def : {+def, -def} case: {nom, dat, acc, abl}] ]Man könnte die auch in das Tagset reinhängen; die Idee war ja, daß bei nicht unabhängigen Possessivpronomina bestimmte Fälle zu beachten sind, die bei unabhängigen posp nicht ins Spiel kommen. Andererseits ist dies hier ja eine Featurestruktur, die alle nötigen Kombinationen prinzipiell abdeckt, die aber eben auch falsche Kombinationen ermöglicht. Insofern plädiere ich dafür, daß wir solche zusätzlichen constraints anders realisieren.
Man könnte auch nur eine Kategorie pro
wählen statt der vielen Pronominakategorien und die Variation durch ein type
-Feature erläutern.
Zudem kann man die Indeklinabil(i)a noch weiter aufspalten z.B. in alle möglichen Adverbtypen, aber das steht ja sowieso nicht im Lexikon, daher könnten wir sowas nur über eigens erstellte Listen rausfinden.