Untersuchung für den Fall N = 2 - Multiple Description Coding mittels kaskadierter korrelierend

4.2 Quellencodierung

4.2.1 Untersuchung für den Fall N = 2

Theoretische Evaluierung

in Abhängigkeit von der für die Quantisierungen aufgewendeten Gesamtbitrate R =R1+R2.

4.2.1.1 Annahme von gedächtnisfreien Quellensignalen

Als weitere Vereinfachung soll angenommen werden, daß die Signale y0[n] und y1[n] Signale von gedächtnisfreien Quellen mit gaußförmiger ADV sind. Nach [JN90] läßt sich für solche Signale der Zusammenhang zwischen Quantisierungs-verzerrung D und aufgewendeter RateR als

D(R)G = 2⁻^2R·σ_x² (4.1)

angeben.

Unter der Annahme von statistisch unabhängigen Quantisierungsfehlern läßt sich deren Korrelationsmatrix im Transformationskoeffizientenbereich als

R_qq =

σ_q²₁ 0 0 σ_q²₂

mit σ²_q_1/2 =σ_y²_1/2 ·2^−2R^1/2 (4.2) schreiben. Da es sich bei der CCT um eine nicht-orthonormale Transformation handelt, muß dieser Quantisierungsfehler in den Ortsbereich zurücktransformiert werden. Unter der Annahme eines additiven Fehlermodells ergibt sich also

Rdd =Tinv.·Rqq·T^H_inv. (4.3)

Setzt man fürT bzw. Tinv. die CCT an (die DCT und die KLT ergeben sich für N = 2 als Sonderfall für α= ^√¹₂)

2T=

α _2α¹

−α _2α¹

und (4.4)

2Tinv. = ₁

2α −_2α¹

α α

, (4.5)

erhält man für Rdd =

σq2 2

4α² +₄^σ^q_α²¹2

σq2 1

2 − ^σ₂^q²²

σq2 1

2 −^σ₂^q²² σq2

2α²+σq2 1α²

. (4.6)

Wie in Abschnitt 4.2.1.2 gezeigt wird, sind die Elemente der Nebendiagonale bei optimaler Bitzuteilung 0. Somit ergibt die Spur von Rqq den Gesamtquantisie-rungsfehler und damit die Verzerrung D im Zeitbereich

D(R1, R2) =spur(Rqq), (4.7)

4.2 Quellencodierung

womit sich

D(R₁, R₂) = σ²_q₁+σ_q²₂

· 1

4α² +α²

(4.8)

= σ²_q₁+σ_q²₂

·κ (4.9)

ergibt. Betrachtet man mit α = ^√¹₂ den orthonormalen Fall, so erhält man das erwartete ErgebnisD(R1, R2) =σ_q²₁+σ²_q₂. Setzt man nun den Ausdruck fürσ_q²_1/2 aus Gleichung 4.2 ein, so erhält man

D(R₁, R₂) = κ· σ_y²₁ ·2⁻^2R¹ +σ_y²₂·2⁻^2R²

. (4.10)

Die Varianzen der Transformationskoeffizienten ergeben sich aus der Hauptdia-gonale von

Ryy =T·Rxx·T^H (4.11)

Nach dem AR(1)-Modell ergibt sich R_xx =

1 ρ ρ 1

(4.12)

⇒Ryy = ₁

4α² +α²

+ρ _4α¹2 −α²

4α² −α² _4α¹2 +α²

−ρ

(4.13) und somit

σ²_y₁ =κ+ρ und (4.14)

σ²_y₂ =κ−ρ . (4.15)

Für den orthonormalen Fall ergeben sich mit κ = 1 wiederum die bekannten Ergebnisse σ²_y_1/2 = 1±ρ. Somit ergibt sich für die Verzerrung

D(R₁, R₂) = κ· (κ+ρ)·2⁻^2R¹ + (κ−ρ)·2⁻^2R²

. (4.16)

Aus der Definition der mittleren Rate ergibt sichR₂ = 2R−R₁ und somit D(R₁, R) = κ· (κ+ρ)·2⁻^2R¹ + (κ−ρ)·2⁻²^·^(2R⁻^R¹⁾

(4.17)

=κ· (κ+ρ)·2^−2R¹ + (κ−ρ)·2^−4R·2^2R¹

. (4.18)

Für die Distortion-Rate-Funktion muß nun die optimale Bitzuordnung erarbeitet werden. Diese ergibt sich für die RateR1, für welche die Verzerrung minimal ist.

Theoretische Evaluierung

Der Ansatz lautet somit d D(R1, R)

d R1

= 0! (4.19)

⇒ 0=^! κ· (κ+ρ)·(−2)·ln(2)·2⁻^2R¹ + (κ−ρ)·2⁻^4R·2·ln(2)·2^2R¹ (4.20) (κ+ρ)·2^−2R¹ = (κ−ρ)·2^−4R·2^2R¹ (4.21) 2^4R¹ = κ+ρ

κ−ρ ·2^4R (4.22)

4R1 = log₂

κ+ρ κ−ρ

+ 4R (4.23)

und damit schließlich R₁ =R+1

4 ·log₂

κ+ρ κ−ρ

. (4.24)

Diese Formel soll wiederum anhand des orthonormalen Falls (α = ^√¹₂ ⇒ κ = 1) überprüft werden. Für diesen Fall ergibt Gleichung 4.24

R₁ =R+1 4 ·log₂

1 +ρ 1−ρ

, (4.25)

woraus sich mit den Gleichungen 4.14 und 4.15 R₁ =R+1

4 ·log₂ σ²_y₁

σ²_y₂

(4.26) ergibt. Für orthonormale Transformationen gilt nach Formel 12.60 in [JN90] fol-gende Lösung

R_k =R+1 2 ·log₂





 σ_y²_k

sNQ−1 l=0

σ_y²_l





 , (4.27)

konkret für N = 2 also R1 =R+1

2 ·log₂ σ²_y₁ pσ²_y₁ ·σ²_y₂

(4.28)

=R+1 2 ·log₂

σy1

σy2

(4.29)

=R+1 4 ·log₂

σ²_y₁ σ²_y₂

, (4.30)

4.2 Quellencodierung

was identisch zu der Lösung in Gleichung 4.24 ist.

Es ist hervorzuheben, daß sich die Lösung für die optimale Bitzuteilung nach Gleichung 4.24 auch dann ergibt, wenn man die Varianzen der Transformations-koeffizienten nach Gleichung 4.14 und 4.15 in die bekannte Lösung aus Gleichung 4.27 einsetzt:

R1/2 =R+1

2 ·log₂ σ_y²_k pσ_y²₁ ·σ²_y₂

, (4.31)

woraus mit den Gleichungen 4.14 und 4.15 für R1 folgt R1 =R+1

2 ·log₂ κ+ρ p(κ+ρ)·(κ−ρ)

(4.32)

=R+1 2 ·log₂

rκ+ρ κ−ρ

(4.33)

=R+1 4 ·log₂

κ+ρ κ−ρ

. (4.34)

Setzt man diese Lösung nun in Gleichung 4.18 ein, erhält man die gesuchte Distortion-Rate-Funktion zu

D(R) = 2^1−2·R·κ·p

κ²−ρ² (4.35)

bzw. umgerechnet auf die mittlere Verzerrung pro Koeffizient D(R) = 2⁻²^·^R·κ·p

κ²−ρ² (4.36)

bzw. umgestellt zu Rate-Distortion-Lösung als R(D) = 1

2 ·

log₂ κ·p

κ²−ρ² D

. (4.37)

Zur Verifizierung sollen wiederum die bekannten Ergebnisse für den orthonorma-len Fall herangezogen werden. Da für N = 2 die orthonormale Transformation identisch zur KLT ist, kann Formel 12.91b aus [JN90] herangezogen werden:

min{σ_r²}=²·2^−2R·

"_N−1 Y

k=0

λk

#_N¹

, (4.38)

wobeiλk die Eigenwerte der Quellen-KovarianzmatrixRxx sind. Für eine AR(1)-Quelle undN = 2 ergeben sich diese gemäß Gleichung 1.41 zu

λ0 = 1 +ρ und λ1 = 1−ρ . (4.39)

Theoretische Evaluierung

Damit ist die minimale Verzerrung gegeben als min{σ_r²}=²·2^−2R·p

(1−ρ)·(1 +ρ) (4.40)

=²·2^−2R·p

1−ρ². (4.41)

4.2.1.2 Gültigkeitsbereich von Gleichung 4.37.

Bei der Herleitung von Gleichung 4.37 wurde davon ausgegangen, dass das Quan-tisierungsfehlerspektrum weiß ist, also σ_q²₁ = σ²_q₂ gilt. Da der Quantisierungsfeh-ler höchstens gleich der Varianz des zugehörigen Transformationskoeffizienten ist, kann diese Bedingung nur eingehalten werden, solange

min

σ_y²_k ≥σ²_q (4.42)

gilt. Mit Gleichung 4.15 und Gleichung 4.53 folgt 2⁻^2R·p

κ² −ρ² ≤κ−ρ (4.43)

2⁻^2R ≤ κ−ρ

p(κ−ρ)·(κ+ρ) =

rκ−ρ

κ+ρ (4.44)

⇒R ≥ 1 2 ·log₂

rκ+ρ κ−ρ

(4.45) R ≥ 1

4 ·log₂

κ+ρ κ−ρ

. (4.46)

4.2.1.3 Beweis der Gleichheit von σ_q²₁ und σ_q²₂

Die für die Formulierung von Gleichung 4.8 angenommene Gleichheit der Quan-tisierungsfehlervarianzen bei optimaler Bitzuweisung gilt, wie im Folgenden be-wiesen wird, auch für den nichtorthonormalen Fall. Setzt man das Ergebnis der optimalen Bitzuweisung aus Gleichung 4.24 und R2 = 2R−R1 an, so ergibt sich

R1 =R+1 4 ·log₂

κ+ρ κ−ρ

und (4.47)

R2 =R− 1 4·log₂

κ+ρ κ−ρ

. (4.48)

Eingesetzt in σ²_q_1/2 =σ_y²_1/2 ·2⁻^2R^1/2, folgt

σ_q²₁ = (κ+ρ)·2⁻^2R⁻¹²^·^log²(^κ+ρκ−ρ) (4.49) σ_q²₂ = (κ+ρ)·2⁻^2R+¹²^·^log²(^κ+ρκ−ρ) (4.50)

4.2 Quellencodierung

und somit

σ²_q₁ = (κ+ρ)·2⁻^2R·

rκ−ρ

κ+ρ und (4.51)

σ²_q₁ = (κ−ρ)·2^−2R·

rκ+ρ

κ−ρ. (4.52)

woraus sich in beiden Fällen σ_q²_1/2 = 2⁻^2R·p

κ²−ρ² (4.53)

ergibt. Der bekannte Sachverhalt, daß bei optimaler Bitzuweisung das Spektrum des Quantisierungsfehlers konstant ist, bleibt demnach auch für nichtorthonor-male Transformationen gültig.

4.2.1.4 Evaluierung der Ergebnisse für die Lösung im R²

Abbildung 4.2.1.4 zeigt den Verlauf der in Gleichung 4.36 erarbeiteten Distortion-Rate-Lösung für verschiedene Transformationen und der für Bildsignale typischen Quellenkorrelation vonρ= 0,95unter Beachtung der für die Gültigkeit von Glei-chung 4.36 nötigen Mindestrate nach GleiGlei-chung 4.46. Deutlich erkennbar ist die Erhöhung der Fehlervarianz bei steigender Nichtorthogonalität der Transforma-tionen.

Die Gesamtvarianz des Transformationskoeffizientenvektors ist

σ²_y =σ_y²₁ +σ_y²₂ =spur(Ryy), (4.54) woraus mit Gleichung 4.13

σ²_y = (κ+%) + (κ−%) = 2κ (4.55)

wird. Die Varianz des Transformationskoeffizientenvektors steigt also mit wach-sendemκ. Betrachtet man nun auch noch die Gesamtverzerrung

σ²_d =spur(Rdd) (4.56)

Rdd =Tinv.·Rqq·Tinv.H (4.57)

=Tinv.·

σ²_q₁ 0 0 σ_q²₂

·Tinv.H (4.58)



 σ²_q₁ +σ²_q₂

·_4α¹² (^σq²1−σq²2) (^σ²q1−σ²q2) 2

2 α²· σ_q²₁ +σ²_q₂



 , (4.59)

Theoretische Evaluierung

dann ist die Spur dieser Matrix und somit die Gesamtfehlervarianz σ_d² = σ_q²₁ +σ_q²₂

· 1

4α² +α²

(4.60)

= σ_q²₁ +σ_q²₂

·κ . (4.61)

Paradoxerweise steigen die Varianzen sowohl bei der Hin- als auch bei der Rück-transformation. Dieses Paradoxum wurde schon im Abschnitt 2.1.3.1 aufgelöst.

Man mag zudem einwenden, daß diese Gleichungen offensichtlich falsch sind, da bei R = 0 für die Quantisierungsfehler σ_q²_1/2 = σ_y²_1/2 gelten müssen und damit σ_d² =·σ²_x gelten müsse.

Dies widerspricht aber dem Umstand, daß bei optimaler Bitzuweisung σ_q²_k = const. ist. Dies kann aber nur so lange erfüllt werden, wie σ_q² ≤ min{σ_y²_k}, was für R = 0 aber nicht mehr gelten kann, da für die nur leicht nichtorthogonale CCT weiterhin die Relation σy1 σy2 fürρ6= 0 gilt.

Für den Fall, daß die Rate hoch genug für eine optimale Bitzuweisung ist, be-schreibt die Korrelationsmatrix der Verzerrung Rdd in Gleichung 4.57 wie bei der inversen Transformation die Leistung bei der Zurücktransformation auf den ersten Koeffizienten mit dem Faktor _4α¹2 gedämpft und die Leistung des zweiten Koeffizienten mit α² verstärkt wird. In der Summe wird der Quantisierungsfehler aber im nichtorthonormalem Fall verstärkt, da κ für α = ^√¹₂ sein Minimum mit κ = 1 erreicht. Der Hintergrund dieser Verstärkung wurde im Abschnitt 2.1.3.1 beleuchtet.

Berücksichtigt man nun, daß bei optimaler Bitzuweisung der Quantisierungsfeh-ler relativ zur Varianz des Transformationskoeffizienten umgekehrt proportional ist (die Transformationskoeffizienten mit der höchsten Leistung werden am be-sten aufgelöst), so wird ersichtlich, daß dies mit der Verstärkung/Absenkung der Leistungsanteile bei der inversen Transformation konträr läuft. Auch dieses Pa-radoxum ist ein Hinweis darauf, daß die Überlegungen für die Quantisierung von Transformationskoeffizienten orthonormaler Transformationen nicht einfach auf die nichtorthonormalen Transformationen abgebildet werden können. Allein der Umstand, daß die Quantisiererzellen im Ortsbereich keine N-dimensionalen Rechtecke, sondern Parallelogramme darstellen, verletzt oft die für die Herlei-tung der Optimalquantisierung gemachte Annahme, daß die ADV des Signals innerhalb der Quantisiererzelle näherungsweise konstant ist. In [WOVR01] wird deshalb empfohlen, die Quantisierung vor der Anwendung der Transformation durchzuführen.

Da die CCT aber als regulierbar optimale Transformation eingesetzt werden soll, muß von diesem Ansatz abgewichen werden, da ansonsten die Transformation nicht zur Irrelevanzreduktion ausgenutzt werden kann.

Für kleine Werte vonεund damit nur leicht nichtorthonormale Transformationen

4.2 Quellencodierung

sollte dies aber kein Hindernis sein.

In Abbildung 4.2.1.4 werden die orthogonale und die am stärksten nichtorthogo-nale Variante der in Abbildung 4.2.1.4 untersuchten CCT-Varianten bei verschie-denen Quellenkorrelationen gegenübergestellt. Aus dieser Abbildung wird leicht ersichtlich, daß die Abhängigkeit der Distortion-Rate-Kurven von der Quellen-korrelation ρ mit steigender Nichtorthogonalität sinkt. In Abbildung 4.2.1.4 ist zur besseren Verständlichkeit dieser Zusammenhang noch einmal für die Rate-Distortion-Kurve nach Gleichung 4.37 dargestellt.

1 1,5 2

Rate R 0,0

0,1 0,2 0,3

DistortionD KLT

CCTǫ=0.05

CCTǫ=0.1

CCTǫ=0.2

Abbildung 4.2: Distortion-Rate-Lösung aus Gleichung 4.36 für verschiedene Transformationen und der für Bildsignale typischen Quellenkorrelation von ρ = 0,95.

0,05 0,10 0,15

DistortionD

1 1,5 2

Rate R

KLT (ρ= 0.95) KLT (ρ= 0.98) CCTǫ=0.2(ρ= 0.95) CCTǫ=0.2(ρ= 0.98)

Abbildung 4.3: Distortion-Rate-Lösung aus Gleichung 4.36 für verschiedene Transformationen und Quellenkorrelationen.

Im Dokument Multiple Description Coding mittels kaskadierter korrelierender Transformationen (Seite 109-117)