prev up inhalt next


10.3 Trigramme

Welcher von den wahrscheinlichsten Lautschriftkandidaten der richtige ist und wie seine Schreibweise lautet, wird kontextbezogen ermittelt, da bei gegebenem Sprachsignal die Wahrscheinlichkeit für eine Wortfolge proportional zum Produkt aus Synthese- und Grundwahrscheinlichkeit ist. Z.B. wird in einem medizinischen Befund, diktiert von einem Zahnarzt, das Wort Zähne eine deutlich höhere Grundwahrscheinlichkeit besitzen als das Wort Sehne, so daß selbst bei recht hoher Synthesewahrscheinlichkeit für Sehne die beobachtete Merkmalsvektorfolge auf Zähne abgebildet werden sollte. Hierzu werden in einer Datenbank Häufigkeitsbeobachtungen von Dreiwortfolgen (Trigrammen) gespeichert. Grundlage sind vom Anwender gelieferte Textproben. Die Häufigkeiten von nicht beobachteten Dreiwortfolgen müssen geschätzt werden.
prev up inhalt next