Welcher von den wahrscheinlichsten
Lautschriftkandidaten der richtige ist und
wie seine Schreibweise lautet, wird kontextbezogen
ermittelt, da bei gegebenem Sprachsignal
die Wahrscheinlichkeit für eine Wortfolge
proportional zum Produkt aus Synthese- und
Grundwahrscheinlichkeit ist.
Z.B. wird in einem medizinischen Befund, diktiert von einem Zahnarzt,
das Wort Zähne eine deutlich höhere Grundwahrscheinlichkeit
besitzen als das Wort Sehne,
so daß selbst bei recht hoher Synthesewahrscheinlichkeit
für Sehne die beobachtete Merkmalsvektorfolge auf Zähne
abgebildet werden sollte.
Hierzu werden in einer Datenbank Häufigkeitsbeobachtungen von
Dreiwortfolgen (Trigrammen) gespeichert.
Grundlage sind vom Anwender gelieferte Textproben.
Die Häufigkeiten von nicht beobachteten Dreiwortfolgen müssen
geschätzt werden.