4.2 Quellencodierung
4.2.1 Untersuchung für den Fall N = 2
Theoretische Evaluierung
in Abhängigkeit von der für die Quantisierungen aufgewendeten Gesamtbitrate R =R1+R2.
4.2.1.1 Annahme von gedächtnisfreien Quellensignalen
Als weitere Vereinfachung soll angenommen werden, daß die Signale y0[n] und y1[n] Signale von gedächtnisfreien Quellen mit gaußförmiger ADV sind. Nach [JN90] läßt sich für solche Signale der Zusammenhang zwischen Quantisierungs-verzerrung D und aufgewendeter RateR als
D(R)G = 2−2R·σx2 (4.1)
angeben.
Unter der Annahme von statistisch unabhängigen Quantisierungsfehlern läßt sich deren Korrelationsmatrix im Transformationskoeffizientenbereich als
Rqq =
σq21 0 0 σq22
mit σ2q1/2 =σy21/2 ·2−2R1/2 (4.2) schreiben. Da es sich bei der CCT um eine nicht-orthonormale Transformation handelt, muß dieser Quantisierungsfehler in den Ortsbereich zurücktransformiert werden. Unter der Annahme eines additiven Fehlermodells ergibt sich also
Rdd =Tinv.·Rqq·THinv. (4.3)
Setzt man fürT bzw. Tinv. die CCT an (die DCT und die KLT ergeben sich für N = 2 als Sonderfall für α= √12)
2T=
α 2α1
−α 2α1
und (4.4)
2Tinv. = 1
2α −2α1
α α
, (4.5)
erhält man für Rdd =
σq2 2
4α2 +4σqα212
σq2 1
2 − σ2q22
σq2 1
2 −σ2q22 σq2
2α2+σq2 1α2
!
. (4.6)
Wie in Abschnitt 4.2.1.2 gezeigt wird, sind die Elemente der Nebendiagonale bei optimaler Bitzuteilung 0. Somit ergibt die Spur von Rqq den Gesamtquantisie-rungsfehler und damit die Verzerrung D im Zeitbereich
D(R1, R2) =spur(Rqq), (4.7)
4.2 Quellencodierung
womit sich
D(R1, R2) = σ2q1+σq22
· 1
4α2 +α2
(4.8)
= σ2q1+σq22
·κ (4.9)
ergibt. Betrachtet man mit α = √12 den orthonormalen Fall, so erhält man das erwartete ErgebnisD(R1, R2) =σq21+σ2q2. Setzt man nun den Ausdruck fürσq21/2 aus Gleichung 4.2 ein, so erhält man
D(R1, R2) = κ· σy21 ·2−2R1 +σy22·2−2R2
. (4.10)
Die Varianzen der Transformationskoeffizienten ergeben sich aus der Hauptdia-gonale von
Ryy =T·Rxx·TH (4.11)
Nach dem AR(1)-Modell ergibt sich Rxx =
1 ρ ρ 1
(4.12)
⇒Ryy = 1
4α2 +α2
+ρ 4α12 −α2
1
4α2 −α2 4α12 +α2
−ρ
(4.13) und somit
σ2y1 =κ+ρ und (4.14)
σ2y2 =κ−ρ . (4.15)
Für den orthonormalen Fall ergeben sich mit κ = 1 wiederum die bekannten Ergebnisse σ2y1/2 = 1±ρ. Somit ergibt sich für die Verzerrung
D(R1, R2) = κ· (κ+ρ)·2−2R1 + (κ−ρ)·2−2R2
. (4.16)
Aus der Definition der mittleren Rate ergibt sichR2 = 2R−R1 und somit D(R1, R) = κ· (κ+ρ)·2−2R1 + (κ−ρ)·2−2·(2R−R1)
(4.17)
=κ· (κ+ρ)·2−2R1 + (κ−ρ)·2−4R·22R1
. (4.18)
Für die Distortion-Rate-Funktion muß nun die optimale Bitzuordnung erarbeitet werden. Diese ergibt sich für die RateR1, für welche die Verzerrung minimal ist.
Theoretische Evaluierung
Der Ansatz lautet somit d D(R1, R)
d R1
= 0! (4.19)
⇒ 0=! κ· (κ+ρ)·(−2)·ln(2)·2−2R1 + (κ−ρ)·2−4R·2·ln(2)·22R1 (4.20) (κ+ρ)·2−2R1 = (κ−ρ)·2−4R·22R1 (4.21) 24R1 = κ+ρ
κ−ρ ·24R (4.22)
4R1 = log2
κ+ρ κ−ρ
+ 4R (4.23)
und damit schließlich R1 =R+1
4 ·log2
κ+ρ κ−ρ
. (4.24)
Diese Formel soll wiederum anhand des orthonormalen Falls (α = √12 ⇒ κ = 1) überprüft werden. Für diesen Fall ergibt Gleichung 4.24
R1 =R+1 4 ·log2
1 +ρ 1−ρ
, (4.25)
woraus sich mit den Gleichungen 4.14 und 4.15 R1 =R+1
4 ·log2 σ2y1
σ2y2
(4.26) ergibt. Für orthonormale Transformationen gilt nach Formel 12.60 in [JN90] fol-gende Lösung
Rk =R+1 2 ·log2
σy2k
N
sNQ−1 l=0
σy2l
, (4.27)
konkret für N = 2 also R1 =R+1
2 ·log2 σ2y1 pσ2y1 ·σ2y2
!
(4.28)
=R+1 2 ·log2
σy1
σy2
(4.29)
=R+1 4 ·log2
σ2y1 σ2y2
, (4.30)
4.2 Quellencodierung
was identisch zu der Lösung in Gleichung 4.24 ist.
Es ist hervorzuheben, daß sich die Lösung für die optimale Bitzuteilung nach Gleichung 4.24 auch dann ergibt, wenn man die Varianzen der Transformations-koeffizienten nach Gleichung 4.14 und 4.15 in die bekannte Lösung aus Gleichung 4.27 einsetzt:
R1/2 =R+1
2 ·log2 σy2k pσy21 ·σ2y2
!
, (4.31)
woraus mit den Gleichungen 4.14 und 4.15 für R1 folgt R1 =R+1
2 ·log2 κ+ρ p(κ+ρ)·(κ−ρ)
!
(4.32)
=R+1 2 ·log2
rκ+ρ κ−ρ
(4.33)
=R+1 4 ·log2
κ+ρ κ−ρ
. (4.34)
Setzt man diese Lösung nun in Gleichung 4.18 ein, erhält man die gesuchte Distortion-Rate-Funktion zu
D(R) = 21−2·R·κ·p
κ2−ρ2 (4.35)
bzw. umgerechnet auf die mittlere Verzerrung pro Koeffizient D(R) = 2−2·R·κ·p
κ2−ρ2 (4.36)
bzw. umgestellt zu Rate-Distortion-Lösung als R(D) = 1
2 ·
"
log2 κ·p
κ2−ρ2 D
!#
. (4.37)
Zur Verifizierung sollen wiederum die bekannten Ergebnisse für den orthonorma-len Fall herangezogen werden. Da für N = 2 die orthonormale Transformation identisch zur KLT ist, kann Formel 12.91b aus [JN90] herangezogen werden:
min{σr2}=2·2−2R·
"N−1 Y
k=0
λk
#N1
, (4.38)
wobeiλk die Eigenwerte der Quellen-KovarianzmatrixRxx sind. Für eine AR(1)-Quelle undN = 2 ergeben sich diese gemäß Gleichung 1.41 zu
λ0 = 1 +ρ und λ1 = 1−ρ . (4.39)
Theoretische Evaluierung
Damit ist die minimale Verzerrung gegeben als min{σr2}=2·2−2R·p
(1−ρ)·(1 +ρ) (4.40)
=2·2−2R·p
1−ρ2. (4.41)
4.2.1.2 Gültigkeitsbereich von Gleichung 4.37.
Bei der Herleitung von Gleichung 4.37 wurde davon ausgegangen, dass das Quan-tisierungsfehlerspektrum weiß ist, also σq21 = σ2q2 gilt. Da der Quantisierungsfeh-ler höchstens gleich der Varianz des zugehörigen Transformationskoeffizienten ist, kann diese Bedingung nur eingehalten werden, solange
min
σy2k ≥σ2q (4.42)
gilt. Mit Gleichung 4.15 und Gleichung 4.53 folgt 2−2R·p
κ2 −ρ2 ≤κ−ρ (4.43)
2−2R ≤ κ−ρ
p(κ−ρ)·(κ+ρ) =
rκ−ρ
κ+ρ (4.44)
⇒R ≥ 1 2 ·log2
rκ+ρ κ−ρ
(4.45) R ≥ 1
4 ·log2
κ+ρ κ−ρ
. (4.46)
4.2.1.3 Beweis der Gleichheit von σq21 und σq22
Die für die Formulierung von Gleichung 4.8 angenommene Gleichheit der Quan-tisierungsfehlervarianzen bei optimaler Bitzuweisung gilt, wie im Folgenden be-wiesen wird, auch für den nichtorthonormalen Fall. Setzt man das Ergebnis der optimalen Bitzuweisung aus Gleichung 4.24 und R2 = 2R−R1 an, so ergibt sich
R1 =R+1 4 ·log2
κ+ρ κ−ρ
und (4.47)
R2 =R− 1 4·log2
κ+ρ κ−ρ
. (4.48)
Eingesetzt in σ2q1/2 =σy21/2 ·2−2R1/2, folgt
σq21 = (κ+ρ)·2−2R−12·log2(κ+ρκ−ρ) (4.49) σq22 = (κ+ρ)·2−2R+12·log2(κ+ρκ−ρ) (4.50)
4.2 Quellencodierung
und somit
σ2q1 = (κ+ρ)·2−2R·
rκ−ρ
κ+ρ und (4.51)
σ2q1 = (κ−ρ)·2−2R·
rκ+ρ
κ−ρ. (4.52)
woraus sich in beiden Fällen σq21/2 = 2−2R·p
κ2−ρ2 (4.53)
ergibt. Der bekannte Sachverhalt, daß bei optimaler Bitzuweisung das Spektrum des Quantisierungsfehlers konstant ist, bleibt demnach auch für nichtorthonor-male Transformationen gültig.
4.2.1.4 Evaluierung der Ergebnisse für die Lösung im R2
Abbildung 4.2.1.4 zeigt den Verlauf der in Gleichung 4.36 erarbeiteten Distortion-Rate-Lösung für verschiedene Transformationen und der für Bildsignale typischen Quellenkorrelation vonρ= 0,95unter Beachtung der für die Gültigkeit von Glei-chung 4.36 nötigen Mindestrate nach GleiGlei-chung 4.46. Deutlich erkennbar ist die Erhöhung der Fehlervarianz bei steigender Nichtorthogonalität der Transforma-tionen.
Die Gesamtvarianz des Transformationskoeffizientenvektors ist
σ2y =σy21 +σy22 =spur(Ryy), (4.54) woraus mit Gleichung 4.13
σ2y = (κ+%) + (κ−%) = 2κ (4.55)
wird. Die Varianz des Transformationskoeffizientenvektors steigt also mit wach-sendemκ. Betrachtet man nun auch noch die Gesamtverzerrung
σ2d =spur(Rdd) (4.56)
Rdd =Tinv.·Rqq·Tinv.H (4.57)
=Tinv.·
σ2q1 0 0 σq22
·Tinv.H (4.58)
=
σ2q1 +σ2q2
·4α12 (σq21−σq22) (σ2q1−σ2q2) 2
2 α2· σq21 +σ2q2
, (4.59)
Theoretische Evaluierung
dann ist die Spur dieser Matrix und somit die Gesamtfehlervarianz σd2 = σq21 +σq22
· 1
4α2 +α2
(4.60)
= σq21 +σq22
·κ . (4.61)
Paradoxerweise steigen die Varianzen sowohl bei der Hin- als auch bei der Rück-transformation. Dieses Paradoxum wurde schon im Abschnitt 2.1.3.1 aufgelöst.
Man mag zudem einwenden, daß diese Gleichungen offensichtlich falsch sind, da bei R = 0 für die Quantisierungsfehler σq21/2 = σy21/2 gelten müssen und damit σd2 =·σ2x gelten müsse.
Dies widerspricht aber dem Umstand, daß bei optimaler Bitzuweisung σq2k = const. ist. Dies kann aber nur so lange erfüllt werden, wie σq2 ≤ min{σy2k}, was für R = 0 aber nicht mehr gelten kann, da für die nur leicht nichtorthogonale CCT weiterhin die Relation σy1 σy2 fürρ6= 0 gilt.
Für den Fall, daß die Rate hoch genug für eine optimale Bitzuweisung ist, be-schreibt die Korrelationsmatrix der Verzerrung Rdd in Gleichung 4.57 wie bei der inversen Transformation die Leistung bei der Zurücktransformation auf den ersten Koeffizienten mit dem Faktor 4α12 gedämpft und die Leistung des zweiten Koeffizienten mit α2 verstärkt wird. In der Summe wird der Quantisierungsfehler aber im nichtorthonormalem Fall verstärkt, da κ für α = √12 sein Minimum mit κ = 1 erreicht. Der Hintergrund dieser Verstärkung wurde im Abschnitt 2.1.3.1 beleuchtet.
Berücksichtigt man nun, daß bei optimaler Bitzuweisung der Quantisierungsfeh-ler relativ zur Varianz des Transformationskoeffizienten umgekehrt proportional ist (die Transformationskoeffizienten mit der höchsten Leistung werden am be-sten aufgelöst), so wird ersichtlich, daß dies mit der Verstärkung/Absenkung der Leistungsanteile bei der inversen Transformation konträr läuft. Auch dieses Pa-radoxum ist ein Hinweis darauf, daß die Überlegungen für die Quantisierung von Transformationskoeffizienten orthonormaler Transformationen nicht einfach auf die nichtorthonormalen Transformationen abgebildet werden können. Allein der Umstand, daß die Quantisiererzellen im Ortsbereich keine N-dimensionalen Rechtecke, sondern Parallelogramme darstellen, verletzt oft die für die Herlei-tung der Optimalquantisierung gemachte Annahme, daß die ADV des Signals innerhalb der Quantisiererzelle näherungsweise konstant ist. In [WOVR01] wird deshalb empfohlen, die Quantisierung vor der Anwendung der Transformation durchzuführen.
Da die CCT aber als regulierbar optimale Transformation eingesetzt werden soll, muß von diesem Ansatz abgewichen werden, da ansonsten die Transformation nicht zur Irrelevanzreduktion ausgenutzt werden kann.
Für kleine Werte vonεund damit nur leicht nichtorthonormale Transformationen
4.2 Quellencodierung
sollte dies aber kein Hindernis sein.
In Abbildung 4.2.1.4 werden die orthogonale und die am stärksten nichtorthogo-nale Variante der in Abbildung 4.2.1.4 untersuchten CCT-Varianten bei verschie-denen Quellenkorrelationen gegenübergestellt. Aus dieser Abbildung wird leicht ersichtlich, daß die Abhängigkeit der Distortion-Rate-Kurven von der Quellen-korrelation ρ mit steigender Nichtorthogonalität sinkt. In Abbildung 4.2.1.4 ist zur besseren Verständlichkeit dieser Zusammenhang noch einmal für die Rate-Distortion-Kurve nach Gleichung 4.37 dargestellt.
1 1,5 2
Rate R 0,0
0,1 0,2 0,3
DistortionD KLT
CCTǫ=0.05
CCTǫ=0.1
CCTǫ=0.2
Abbildung 4.2: Distortion-Rate-Lösung aus Gleichung 4.36 für verschiedene Transformationen und der für Bildsignale typischen Quellenkorrelation von ρ = 0,95.
0,05 0,10 0,15
DistortionD
1 1,5 2
Rate R
KLT (ρ= 0.95) KLT (ρ= 0.98) CCTǫ=0.2(ρ= 0.95) CCTǫ=0.2(ρ= 0.98)
Abbildung 4.3: Distortion-Rate-Lösung aus Gleichung 4.36 für verschiedene Transformationen und Quellenkorrelationen.