• Keine Ergebnisse gefunden

4.2 Quellencodierung

4.2.1 Untersuchung für den Fall N = 2

Theoretische Evaluierung

in Abhängigkeit von der für die Quantisierungen aufgewendeten Gesamtbitrate R =R1+R2.

4.2.1.1 Annahme von gedächtnisfreien Quellensignalen

Als weitere Vereinfachung soll angenommen werden, daß die Signale y0[n] und y1[n] Signale von gedächtnisfreien Quellen mit gaußförmiger ADV sind. Nach [JN90] läßt sich für solche Signale der Zusammenhang zwischen Quantisierungs-verzerrung D und aufgewendeter RateR als

D(R)G = 22R·σx2 (4.1)

angeben.

Unter der Annahme von statistisch unabhängigen Quantisierungsfehlern läßt sich deren Korrelationsmatrix im Transformationskoeffizientenbereich als

Rqq =

σq21 0 0 σq22

mit σ2q1/2y21/2 ·2−2R1/2 (4.2) schreiben. Da es sich bei der CCT um eine nicht-orthonormale Transformation handelt, muß dieser Quantisierungsfehler in den Ortsbereich zurücktransformiert werden. Unter der Annahme eines additiven Fehlermodells ergibt sich also

Rdd =Tinv.·Rqq·THinv. (4.3)

Setzt man fürT bzw. Tinv. die CCT an (die DCT und die KLT ergeben sich für N = 2 als Sonderfall für α= 12)

2T=

α 1

−α 1

und (4.4)

2Tinv. = 1

1

α α

, (4.5)

erhält man für Rdd =

σq2 2

4α2 +4σqα212

σq2 1

2σ2q22

σq2 1

2σ2q22 σq2

2α2q2 1α2

!

. (4.6)

Wie in Abschnitt 4.2.1.2 gezeigt wird, sind die Elemente der Nebendiagonale bei optimaler Bitzuteilung 0. Somit ergibt die Spur von Rqq den Gesamtquantisie-rungsfehler und damit die Verzerrung D im Zeitbereich

D(R1, R2) =spur(Rqq), (4.7)

4.2 Quellencodierung

womit sich

D(R1, R2) = σ2q1q22

· 1

22

(4.8)

= σ2q1q22

·κ (4.9)

ergibt. Betrachtet man mit α = 12 den orthonormalen Fall, so erhält man das erwartete ErgebnisD(R1, R2) =σq212q2. Setzt man nun den Ausdruck fürσq21/2 aus Gleichung 4.2 ein, so erhält man

D(R1, R2) = κ· σy21 ·22R1y22·22R2

. (4.10)

Die Varianzen der Transformationskoeffizienten ergeben sich aus der Hauptdia-gonale von

Ryy =T·Rxx·TH (4.11)

Nach dem AR(1)-Modell ergibt sich Rxx =

1 ρ ρ 1

(4.12)

⇒Ryy = 1

22

12 −α2

1

2 −α2 122

−ρ

(4.13) und somit

σ2y1 =κ+ρ und (4.14)

σ2y2 =κ−ρ . (4.15)

Für den orthonormalen Fall ergeben sich mit κ = 1 wiederum die bekannten Ergebnisse σ2y1/2 = 1±ρ. Somit ergibt sich für die Verzerrung

D(R1, R2) = κ· (κ+ρ)·22R1 + (κ−ρ)·22R2

. (4.16)

Aus der Definition der mittleren Rate ergibt sichR2 = 2R−R1 und somit D(R1, R) = κ· (κ+ρ)·22R1 + (κ−ρ)·22·(2RR1)

(4.17)

=κ· (κ+ρ)·2−2R1 + (κ−ρ)·2−4R·22R1

. (4.18)

Für die Distortion-Rate-Funktion muß nun die optimale Bitzuordnung erarbeitet werden. Diese ergibt sich für die RateR1, für welche die Verzerrung minimal ist.

Theoretische Evaluierung

Der Ansatz lautet somit d D(R1, R)

d R1

= 0! (4.19)

⇒ 0=! κ· (κ+ρ)·(−2)·ln(2)·22R1 + (κ−ρ)·24R·2·ln(2)·22R1 (4.20) (κ+ρ)·2−2R1 = (κ−ρ)·2−4R·22R1 (4.21) 24R1 = κ+ρ

κ−ρ ·24R (4.22)

4R1 = log2

κ+ρ κ−ρ

+ 4R (4.23)

und damit schließlich R1 =R+1

4 ·log2

κ+ρ κ−ρ

. (4.24)

Diese Formel soll wiederum anhand des orthonormalen Falls (α = 12 ⇒ κ = 1) überprüft werden. Für diesen Fall ergibt Gleichung 4.24

R1 =R+1 4 ·log2

1 +ρ 1−ρ

, (4.25)

woraus sich mit den Gleichungen 4.14 und 4.15 R1 =R+1

4 ·log2 σ2y1

σ2y2

(4.26) ergibt. Für orthonormale Transformationen gilt nach Formel 12.60 in [JN90] fol-gende Lösung

Rk =R+1 2 ·log2





 σy2k

N

sNQ1 l=0

σy2l





 , (4.27)

konkret für N = 2 also R1 =R+1

2 ·log2 σ2y12y1 ·σ2y2

!

(4.28)

=R+1 2 ·log2

σy1

σy2

(4.29)

=R+1 4 ·log2

σ2y1 σ2y2

, (4.30)

4.2 Quellencodierung

was identisch zu der Lösung in Gleichung 4.24 ist.

Es ist hervorzuheben, daß sich die Lösung für die optimale Bitzuteilung nach Gleichung 4.24 auch dann ergibt, wenn man die Varianzen der Transformations-koeffizienten nach Gleichung 4.14 und 4.15 in die bekannte Lösung aus Gleichung 4.27 einsetzt:

R1/2 =R+1

2 ·log2 σy2ky21 ·σ2y2

!

, (4.31)

woraus mit den Gleichungen 4.14 und 4.15 für R1 folgt R1 =R+1

2 ·log2 κ+ρ p(κ+ρ)·(κ−ρ)

!

(4.32)

=R+1 2 ·log2

rκ+ρ κ−ρ

(4.33)

=R+1 4 ·log2

κ+ρ κ−ρ

. (4.34)

Setzt man diese Lösung nun in Gleichung 4.18 ein, erhält man die gesuchte Distortion-Rate-Funktion zu

D(R) = 21−2·R·κ·p

κ2−ρ2 (4.35)

bzw. umgerechnet auf die mittlere Verzerrung pro Koeffizient D(R) = 22·R·κ·p

κ2−ρ2 (4.36)

bzw. umgestellt zu Rate-Distortion-Lösung als R(D) = 1

2 ·

"

log2 κ·p

κ2−ρ2 D

!#

. (4.37)

Zur Verifizierung sollen wiederum die bekannten Ergebnisse für den orthonorma-len Fall herangezogen werden. Da für N = 2 die orthonormale Transformation identisch zur KLT ist, kann Formel 12.91b aus [JN90] herangezogen werden:

min{σr2}=2·2−2R·

"N−1 Y

k=0

λk

#N1

, (4.38)

wobeiλk die Eigenwerte der Quellen-KovarianzmatrixRxx sind. Für eine AR(1)-Quelle undN = 2 ergeben sich diese gemäß Gleichung 1.41 zu

λ0 = 1 +ρ und λ1 = 1−ρ . (4.39)

Theoretische Evaluierung

Damit ist die minimale Verzerrung gegeben als min{σr2}=2·2−2R·p

(1−ρ)·(1 +ρ) (4.40)

=2·2−2R·p

1−ρ2. (4.41)

4.2.1.2 Gültigkeitsbereich von Gleichung 4.37.

Bei der Herleitung von Gleichung 4.37 wurde davon ausgegangen, dass das Quan-tisierungsfehlerspektrum weiß ist, also σq21 = σ2q2 gilt. Da der Quantisierungsfeh-ler höchstens gleich der Varianz des zugehörigen Transformationskoeffizienten ist, kann diese Bedingung nur eingehalten werden, solange

min

σy2k ≥σ2q (4.42)

gilt. Mit Gleichung 4.15 und Gleichung 4.53 folgt 22R·p

κ2 −ρ2 ≤κ−ρ (4.43)

22R ≤ κ−ρ

p(κ−ρ)·(κ+ρ) =

rκ−ρ

κ+ρ (4.44)

⇒R ≥ 1 2 ·log2

rκ+ρ κ−ρ

(4.45) R ≥ 1

4 ·log2

κ+ρ κ−ρ

. (4.46)

4.2.1.3 Beweis der Gleichheit von σq21 und σq22

Die für die Formulierung von Gleichung 4.8 angenommene Gleichheit der Quan-tisierungsfehlervarianzen bei optimaler Bitzuweisung gilt, wie im Folgenden be-wiesen wird, auch für den nichtorthonormalen Fall. Setzt man das Ergebnis der optimalen Bitzuweisung aus Gleichung 4.24 und R2 = 2R−R1 an, so ergibt sich

R1 =R+1 4 ·log2

κ+ρ κ−ρ

und (4.47)

R2 =R− 1 4·log2

κ+ρ κ−ρ

. (4.48)

Eingesetzt in σ2q1/2y21/2 ·22R1/2, folgt

σq21 = (κ+ρ)·22R12·log2(κ+ρκ−ρ) (4.49) σq22 = (κ+ρ)·22R+12·log2(κ+ρκ−ρ) (4.50)

4.2 Quellencodierung

und somit

σ2q1 = (κ+ρ)·22R·

rκ−ρ

κ+ρ und (4.51)

σ2q1 = (κ−ρ)·2−2R·

rκ+ρ

κ−ρ. (4.52)

woraus sich in beiden Fällen σq21/2 = 22R·p

κ2−ρ2 (4.53)

ergibt. Der bekannte Sachverhalt, daß bei optimaler Bitzuweisung das Spektrum des Quantisierungsfehlers konstant ist, bleibt demnach auch für nichtorthonor-male Transformationen gültig.

4.2.1.4 Evaluierung der Ergebnisse für die Lösung im R2

Abbildung 4.2.1.4 zeigt den Verlauf der in Gleichung 4.36 erarbeiteten Distortion-Rate-Lösung für verschiedene Transformationen und der für Bildsignale typischen Quellenkorrelation vonρ= 0,95unter Beachtung der für die Gültigkeit von Glei-chung 4.36 nötigen Mindestrate nach GleiGlei-chung 4.46. Deutlich erkennbar ist die Erhöhung der Fehlervarianz bei steigender Nichtorthogonalität der Transforma-tionen.

Die Gesamtvarianz des Transformationskoeffizientenvektors ist

σ2yy21y22 =spur(Ryy), (4.54) woraus mit Gleichung 4.13

σ2y = (κ+%) + (κ−%) = 2κ (4.55)

wird. Die Varianz des Transformationskoeffizientenvektors steigt also mit wach-sendemκ. Betrachtet man nun auch noch die Gesamtverzerrung

σ2d =spur(Rdd) (4.56)

Rdd =Tinv.·Rqq·Tinv.H (4.57)

=Tinv.·

σ2q1 0 0 σq22

·Tinv.H (4.58)

=

 σ2q12q2

·12 (σq21−σq22) (σ2q1−σ2q2) 2

2 α2· σq212q2

 , (4.59)

Theoretische Evaluierung

dann ist die Spur dieser Matrix und somit die Gesamtfehlervarianz σd2 = σq21q22

· 1

22

(4.60)

= σq21q22

·κ . (4.61)

Paradoxerweise steigen die Varianzen sowohl bei der Hin- als auch bei der Rück-transformation. Dieses Paradoxum wurde schon im Abschnitt 2.1.3.1 aufgelöst.

Man mag zudem einwenden, daß diese Gleichungen offensichtlich falsch sind, da bei R = 0 für die Quantisierungsfehler σq21/2 = σy21/2 gelten müssen und damit σd2 =·σ2x gelten müsse.

Dies widerspricht aber dem Umstand, daß bei optimaler Bitzuweisung σq2k = const. ist. Dies kann aber nur so lange erfüllt werden, wie σq2 ≤ min{σy2k}, was für R = 0 aber nicht mehr gelten kann, da für die nur leicht nichtorthogonale CCT weiterhin die Relation σy1 σy2 fürρ6= 0 gilt.

Für den Fall, daß die Rate hoch genug für eine optimale Bitzuweisung ist, be-schreibt die Korrelationsmatrix der Verzerrung Rdd in Gleichung 4.57 wie bei der inversen Transformation die Leistung bei der Zurücktransformation auf den ersten Koeffizienten mit dem Faktor 12 gedämpft und die Leistung des zweiten Koeffizienten mit α2 verstärkt wird. In der Summe wird der Quantisierungsfehler aber im nichtorthonormalem Fall verstärkt, da κ für α = 12 sein Minimum mit κ = 1 erreicht. Der Hintergrund dieser Verstärkung wurde im Abschnitt 2.1.3.1 beleuchtet.

Berücksichtigt man nun, daß bei optimaler Bitzuweisung der Quantisierungsfeh-ler relativ zur Varianz des Transformationskoeffizienten umgekehrt proportional ist (die Transformationskoeffizienten mit der höchsten Leistung werden am be-sten aufgelöst), so wird ersichtlich, daß dies mit der Verstärkung/Absenkung der Leistungsanteile bei der inversen Transformation konträr läuft. Auch dieses Pa-radoxum ist ein Hinweis darauf, daß die Überlegungen für die Quantisierung von Transformationskoeffizienten orthonormaler Transformationen nicht einfach auf die nichtorthonormalen Transformationen abgebildet werden können. Allein der Umstand, daß die Quantisiererzellen im Ortsbereich keine N-dimensionalen Rechtecke, sondern Parallelogramme darstellen, verletzt oft die für die Herlei-tung der Optimalquantisierung gemachte Annahme, daß die ADV des Signals innerhalb der Quantisiererzelle näherungsweise konstant ist. In [WOVR01] wird deshalb empfohlen, die Quantisierung vor der Anwendung der Transformation durchzuführen.

Da die CCT aber als regulierbar optimale Transformation eingesetzt werden soll, muß von diesem Ansatz abgewichen werden, da ansonsten die Transformation nicht zur Irrelevanzreduktion ausgenutzt werden kann.

Für kleine Werte vonεund damit nur leicht nichtorthonormale Transformationen

4.2 Quellencodierung

sollte dies aber kein Hindernis sein.

In Abbildung 4.2.1.4 werden die orthogonale und die am stärksten nichtorthogo-nale Variante der in Abbildung 4.2.1.4 untersuchten CCT-Varianten bei verschie-denen Quellenkorrelationen gegenübergestellt. Aus dieser Abbildung wird leicht ersichtlich, daß die Abhängigkeit der Distortion-Rate-Kurven von der Quellen-korrelation ρ mit steigender Nichtorthogonalität sinkt. In Abbildung 4.2.1.4 ist zur besseren Verständlichkeit dieser Zusammenhang noch einmal für die Rate-Distortion-Kurve nach Gleichung 4.37 dargestellt.

1 1,5 2

Rate R 0,0

0,1 0,2 0,3

DistortionD KLT

CCTǫ=0.05

CCTǫ=0.1

CCTǫ=0.2

Abbildung 4.2: Distortion-Rate-Lösung aus Gleichung 4.36 für verschiedene Transformationen und der für Bildsignale typischen Quellenkorrelation von ρ = 0,95.

0,05 0,10 0,15

DistortionD

1 1,5 2

Rate R

KLT (ρ= 0.95) KLT (ρ= 0.98) CCTǫ=0.2= 0.95) CCTǫ=0.2= 0.98)

Abbildung 4.3: Distortion-Rate-Lösung aus Gleichung 4.36 für verschiedene Transformationen und Quellenkorrelationen.