Tagset für Albanisch

Die Vorschläge von Britta für die Verben, die von Thomas für die Nomen, die von Jochen für die Pronomen, die von Andreas für die Indeklinabilia ergeben gemeinsam mit meinen für die Adjektive folgendes Bild:
[cat  : {v, n, a, part, prsp, reflp, demp, posp, indp, relp, intp, 
         pa, adv, prep, ptl, conj, seq}
 adm  : {+adm, -adm}
 mod  : {ind, konj, opt, imp}
 stat : {act, pass}
 temp : {prs, ipf, aor}
 pers : {1, 2, 3}
 num  : {sg, pl}
 gen  : {fem, masc, neutr}
 case : {nom, gen/dat, acc, abl}
 def  : {+def, -def}
 weak : {+weak, -weak}
 idpt : {+idpt, -idpt}]

Erläuterungen:
v bedeutet Verb
n bedeutet Nomen
a bedeutet Adjektiv
part bedeutet Partizip
prsp bedeutet Personalpronomen
reflp bedeutet Reflexivpronomen
demp bedeutet Demonstrativpronomen
posp bedeutet Possessivpronomen
indp bedeutet Indefinitpronomen
relp bedeutet Relativpronomen
intp bedeutet Interrogativpronomen
pa bedeutet Vorangestellter Artikel
ptl bedeutet Partikel
adv bedeutet Adverb
prep bedeutet Präposition
conj bedeutet Konjunktion
seq bedeutet Satzäquivalent

Da die Wertmengen der einzelnen Merkmale disjunkt sind, können die Features in den einzelnen Listen weggelassen werden, sie sind hier nur aufgeführt, um die Übersicht zu behalten. Die eckigen Klammern bleiben, um tags (im Lexikon?) eindeutig als solche identifizierbar zu machen. Die einzelnen Werte werden nur durch Leerzeichen getrennt. Ein Tag sähe dann beispielsweise so aus:

[v act prs 1 sg fem]

zu -idpt bei posp gehört auch noch eine komplexe Featurestuktur:

[agr : [num : {sg, pl}
        gen : {fem, masc}]
 inh : [num : {sg,pl}
        gen : {fem, masc}
        pers: {1,2,3}]
 art : [def : {+def, -def}
        case: {nom, dat, acc, abl}]
]
Man könnte die auch in das Tagset reinhängen; die Idee war ja, daß bei nicht unabhängigen Possessivpronomina bestimmte Fälle zu beachten sind, die bei unabhängigen posp nicht ins Spiel kommen. Andererseits ist dies hier ja eine Featurestruktur, die alle nötigen Kombinationen prinzipiell abdeckt, die aber eben auch falsche Kombinationen ermöglicht. Insofern plädiere ich dafür, daß wir solche zusätzlichen constraints anders realisieren.

Man könnte auch nur eine Kategorie pro wählen statt der vielen Pronominakategorien und die Variation durch ein type-Feature erläutern.
Zudem kann man die Indeklinabil(i)a noch weiter aufspalten z.B. in alle möglichen Adverbtypen, aber das steht ja sowieso nicht im Lexikon, daher könnten wir sowas nur über eigens erstellte Listen rausfinden.


letzte Änderung: Philip Reuter, 10.01.2001