25 PAL-Fernseh-Bilder pro Sekunde im Format 768 ×
576 bei 24 Bit Farbtiefe ergeben einen Datenstrom von 32 MBytes/sec.
Auf eine CD mit 660 MByte Speicherkapazität würde demnach
ein 20-Sekunden-Film passen.
Aber zum Abspielen durch ein Single-Speed-CDROM-Laufwerk
wäre die übliche Transferrate von 1.34 MBit/sec
um den Faktor 180 zu niedrig.
Drei Komponenten tragen zur Datenreduktion bei:
- 1.
- Vereinfachung des Video-Signals (Subsampling, Faktor 4)
- 2.
- Ausnutzung räumlicher Redundanz (JPEG, Faktor 15)
- 3.
- Ausnutzung zeitlicher Redundanz (MPEG, Faktor 3).
Da bei sich bewegenden Motiven zwei Halbbilder mit einer zeitlichen
Verzögerung von 1/50 sec = 20 msec entstanden sind, können sie
nicht exakt zu einem konsistenten Vollbild vereinigt werden.
Daher stützt sich die Kompression eines Einzelbilds
nur auf ein Halbbild mit halbierter Auflösung.
Von 575 sichtbaren PAL-Zeilen bleiben also nur 288 übrig.
Entsprechend wird auch die horizontale Auflösung in
etwa halbiert, und zwar auf 352 Pixel pro Zeile.
Als Source-Input-Format (SIF) für die
Digitalisierung wurde daher festgelegt
|
|
Europa: |
352 × 288 à 25 Hz |
USA: |
352 × 240 à 30 Hz. |
|
|
In beiden Fällen beträgt bei 24 Bit Farbtiefe
die Datenrate 58 MBit/sec.
Das SIF wird durch ein Preprocessing vor der Digitalisierung
bereitgestellt.
Zunächst wird die Farbinformation in das
YUV-Modell überführt und ein 4 : 1 : 1 Subsampling angewendet.
D.h. unter Beibehaltung der Helligkeitsauflösung werden beide
Farbdifferenzauflösungen halbiert.
Somit entstehen pro PAL-Bild
|
|
|
1 |
Luminanzmatrix |
352 × 288 |
2 |
Crominanzmatrizen |
176 × 144 |
|
|
|
mit insgesamt
22 · 18 = 396 Makroblöcken, bestehend
aus 16 × 16 Blöcken der Luminanzmatrix und zwei
assoziierten 8 × 8 Blöcken der Chrominanzmatrizen.
Eine Videosequenz wird in Gruppen unterteilt.
Alle Gruppen haben die gleiche Anzahl von Bildern.
Die Gruppen werden zusammenhängend komprimiert
und erlauben den unmittelbaren Zugriff nur auf
das Anfangsbild.
Da drei Zugriffsmöglichkeiten
pro Sekunde möglich sein sollen, enthält eine
Gruppe je nach Videonorm 8-10 Bilder.
- I-Picture
- (Intro Coded Picture)
Das Anfangsbild einer Gruppe wird auf der Basis
von 8 × 8 Blöcken einer JPEG-Kompression
unterworfen, d.h. Diskrete Cosinus Transformation, Quantisierung,
Differenzkodierung der DC-Koeffizienten und Lauflängenkodierung
der AC-Koeffizienten mit Huffman-Tabellen.
- P-Picture
- (Predictive Coded Picture)
Ein P-Picture wird mit Bezug auf ein Referenzbild
kodiert, welches durch ein vorangegangenes I- oder
P-Picture gegeben ist.
Hierbei wird ausgenutzt, daß sich
in zeitlich aufeinanderfolgenden Einzelbildern
gewisse Bildbereiche komplett verschieben, z.B. durch
einen Kameraschwenk oder durch ein sich bewegendes Objekt.
Es wird daher zu jedem Macro-Block des P-Pictures ein möglichst
ähnlicher Macroblock im Referenzbild gesucht.
Gespeichert wird der Verschiebungsvektor und ggf. eine Differenzmatrix
mit den beobachteten Pixelabweichungen.
Für die Folge der Bewegungsvektoren wird eine DPCM-Kodierung verwendet.
Läßt sich kein geeigneter Macroblock finden, wird die für
I-Picture vorgesehene Kompression angewendet.
- B-Picture
- (Bidirectionally predictive Coded Picture)
Ein B-Picture bezieht sich auf ein vorangegangenes
P- oder I-Picture, auf ein nachfolgendes P-
oder I-Picture oder auf beide.
In diesem Fall wird die Differenz zur
Interpolation zweier Macroblöcke abgespeichert.
Dies ist sinnvoll bei sich bewegenden Objekten,
die sukzessive einen Teil des bislang verdeckten
Hintergrunds sichtbar werden lassen.
- D-Picture
- (DC-Coded Picture)
D-Pictures enthalten I-Picture-Kodierungen
eingeschränkt auf die DC-Koeffizienten.
Hierdurch wird eine eingeschränkte Bildqualität bei schnellem
Vor- oder Rücklauf bereitgestellt.
Zur Kompression und Dekompression muß die ursprüngliche
Bildfolge umgestellt werden.
Umstellung der Bildfolge
Während der Anzeige des ersten I -Bildes wird das nachfolgende
P -Bild decodiert.
Die nächsten B -Bilder werden unmittelbar nach ihrer
Decodierung angezeigt.
Nun kann das bereits decodierte P -Bild angezeigt werden, während das
nächste I -Bild decodiert wird.
Zur Synchronisation wird spätestens nach 16 Bildern
eine Zeitmarke eingefügt und ggf. mit einem Audiostrom
verschachtelt.
Bei der Wiedergabe kann der Dekodierer aus den Zeitmarken ersehen,
ob er bei einem Synchronisationsverlust Bilder überspringen oder
wiederholen muß.
Da Videorecorder ihre Bildsequenzen mit 25 Hz abliefern,
muß die Kodierung in Realzeit erfolgen.
Zur Erzeugung einer MPEG-Datei wird oft zunächst
mit Hilfe einer Hardwarekompression eine Folge von
I-Pictures erzeugt (Motion JPEG).
Daraus entsteht dann offline per Software das MPEG-Format.