prev up inhalt next


13.2 MPEG

25 PAL-Fernseh-Bilder pro Sekunde im Format 768 × 576 bei 24 Bit Farbtiefe ergeben einen Datenstrom von 32 MBytes/sec. Auf eine CD mit 660 MByte Speicherkapazität würde demnach ein 20-Sekunden-Film passen. Aber zum Abspielen durch ein Single-Speed-CDROM-Laufwerk wäre die übliche Transferrate von 1.34 MBit/sec um den Faktor 180 zu niedrig. Drei Komponenten tragen zur Datenreduktion bei:
1.
Vereinfachung des Video-Signals (Subsampling, Faktor 4)
2.
Ausnutzung räumlicher Redundanz (JPEG, Faktor 15)
3.
Ausnutzung zeitlicher Redundanz (MPEG, Faktor 3).
Da bei sich bewegenden Motiven zwei Halbbilder mit einer zeitlichen Verzögerung von 1/50 sec = 20 msec entstanden sind, können sie nicht exakt zu einem konsistenten Vollbild vereinigt werden. Daher stützt sich die Kompression eines Einzelbilds nur auf ein Halbbild mit halbierter Auflösung. Von 575 sichtbaren PAL-Zeilen bleiben also nur 288 übrig. Entsprechend wird auch die horizontale Auflösung in etwa halbiert, und zwar auf 352 Pixel pro Zeile. Als Source-Input-Format (SIF) für die Digitalisierung wurde daher festgelegt

   
Europa: 352 × 288 à 25 Hz
USA: 352 × 240 à 30 Hz.
   

In beiden Fällen beträgt bei 24 Bit Farbtiefe die Datenrate 58 MBit/sec. Das SIF wird durch ein Preprocessing vor der Digitalisierung bereitgestellt.
Zunächst wird die Farbinformation in das YUV-Modell überführt und ein 4 : 1 : 1 Subsampling angewendet. D.h. unter Beibehaltung der Helligkeitsauflösung werden beide Farbdifferenzauflösungen halbiert. Somit entstehen pro PAL-Bild

     
1 Luminanzmatrix 352 × 288
2 Crominanzmatrizen 176 × 144
     

mit insgesamt 22 · 18 = 396 Makroblöcken, bestehend aus 16 × 16 Blöcken der Luminanzmatrix und zwei assoziierten 8 × 8 Blöcken der Chrominanzmatrizen.

Eine Videosequenz wird in Gruppen unterteilt. Alle Gruppen haben die gleiche Anzahl von Bildern. Die Gruppen werden zusammenhängend komprimiert und erlauben den unmittelbaren Zugriff nur auf das Anfangsbild. Da drei Zugriffsmöglichkeiten pro Sekunde möglich sein sollen, enthält eine Gruppe je nach Videonorm 8-10 Bilder.

I-Picture
(Intro Coded Picture)
Das Anfangsbild einer Gruppe wird auf der Basis von 8 × 8 Blöcken einer JPEG-Kompression unterworfen, d.h. Diskrete Cosinus Transformation, Quantisierung, Differenzkodierung der DC-Koeffizienten und Lauflängenkodierung der AC-Koeffizienten mit Huffman-Tabellen.
P-Picture
(Predictive Coded Picture)
Ein P-Picture wird mit Bezug auf ein Referenzbild kodiert, welches durch ein vorangegangenes I- oder P-Picture gegeben ist. Hierbei wird ausgenutzt, daß sich in zeitlich aufeinanderfolgenden Einzelbildern gewisse Bildbereiche komplett verschieben, z.B. durch einen Kameraschwenk oder durch ein sich bewegendes Objekt. Es wird daher zu jedem Macro-Block des P-Pictures ein möglichst ähnlicher Macroblock im Referenzbild gesucht. Gespeichert wird der Verschiebungsvektor und ggf. eine Differenzmatrix mit den beobachteten Pixelabweichungen. Für die Folge der Bewegungsvektoren wird eine DPCM-Kodierung verwendet. Läßt sich kein geeigneter Macroblock finden, wird die für I-Picture vorgesehene Kompression angewendet.
B-Picture
(Bidirectionally predictive Coded Picture)
Ein B-Picture bezieht sich auf ein vorangegangenes P- oder I-Picture, auf ein nachfolgendes P- oder I-Picture oder auf beide. In diesem Fall wird die Differenz zur Interpolation zweier Macroblöcke abgespeichert. Dies ist sinnvoll bei sich bewegenden Objekten, die sukzessive einen Teil des bislang verdeckten Hintergrunds sichtbar werden lassen.
D-Picture
(DC-Coded Picture)
D-Pictures enthalten I-Picture-Kodierungen eingeschränkt auf die DC-Koeffizienten. Hierdurch wird eine eingeschränkte Bildqualität bei schnellem Vor- oder Rücklauf bereitgestellt.

Zur Kompression und Dekompression muß die ursprüngliche Bildfolge umgestellt werden.


Umstellung der Bildfolge

Während der Anzeige des ersten I -Bildes wird das nachfolgende P -Bild decodiert. Die nächsten B -Bilder werden unmittelbar nach ihrer Decodierung angezeigt. Nun kann das bereits decodierte P -Bild angezeigt werden, während das nächste I -Bild decodiert wird.

Zur Synchronisation wird spätestens nach 16 Bildern eine Zeitmarke eingefügt und ggf. mit einem Audiostrom verschachtelt. Bei der Wiedergabe kann der Dekodierer aus den Zeitmarken ersehen, ob er bei einem Synchronisationsverlust Bilder überspringen oder wiederholen muß.

Da Videorecorder ihre Bildsequenzen mit 25 Hz abliefern, muß die Kodierung in Realzeit erfolgen. Zur Erzeugung einer MPEG-Datei wird oft zunächst mit Hilfe einer Hardwarekompression eine Folge von I-Pictures erzeugt (Motion JPEG). Daraus entsteht dann offline per Software das MPEG-Format.


Mit dem LSX MPEG-Encoder erzeugte mpeg-1-Datei


prev up inhalt next