Steffen
Reith1.6.17
3. 1.
Datenkompression
Bee
Ziel d. Quell Kodierung ist es einenmöglichst
kompakten Code zufinden
, um d. Übertragungs kanal auszulasten .⇒ möglichst hoher
Informationsgehalt
Bekannte Verfahren
:.
Entropie
kodierungen ( Shannon , Fano ,Huffman )
- Arithmetisch Kodierung
. Substitutions verfahren CLZ 77, LZW )
Defni Sei e : Zt → IT eine Kodierung , dann
heißt
1 ccnll
him
-In t.sn In 1
K_ompressiousrate_lv.no
)Defi
Sei c : El → IT' eine Codierung und E- lre , . i. rules ,dann heißt
Fez
lclrll .pcr
)die mittlere
Wahrscheinlichkeit
vonCodewortr istlänge, , wennper
) die Auftretens3. 1.1 . Shannon . Codierung
Idee : "
häufige
" Buchstaben bekommen kurze Code wörterund " seltene "
Buchstaben lange
CodewörtoShannon
schlägt
folgendes Verfahren vor , wobei wir kurz pifür
pcoi) schreiben .
i, Sei Z = hon, . , rnb das Quell
alphabet
, wobeipihpi.ie
,1 Ei Eu - 1 L Wahrscheinlichkeiten absteigende sortieren
)
ii , Berechne kumulierte Summen
4A
) P, = 0( Is )
Pin
=Pitpi
iii , Die Shannon Codierung c ist dann wie
folgt definiert
:cloi ) = aeg " Die ersten mi Nachkommen stellen
der Binär darstellung von Pi "
, wobei
mi = def
flog
.IT )
Bsg
: Sei Z ' la , b. c. d. e } mit Pca) = % ,plbkplckpld
) =hßuäfntsitatbeu
} III. %
, p, > o.nu , p, = ruhen . 56 , R, = 5kt482618
bekommen kurze
Und 175 =
6/8+48
= 7/8 und mit und mz.mg zmyzmsn =3 TCodewörter r
Somit cla ) -0 , clb
)
= 100 , c(c)
= 101 , c (d) = 110 , de ) " TDer Code ist
sogar präfix
frei ! Ist das immer so ?Satan Das
Verfahren
von Shannon konstruierte einenpräfix
freien Code ,Beweise Ein ähnliches
Argument
wie bei der Ungleichung vonKraft führt
zum Ziel .Sei c : -2 → ho.is * die konstruierte
Codierung
.Wir wissen
Pi
= 0 , a.az as ... . =%
+¥
+¥
t . . . .und
logztp.TT
mi .Somit
gilt für
jedes j 7, inPj
-Pi
"Pin
-Pi
=pis
,⇐ (
*)
Angenommen der Code wäre nicht
präfix frei
, dann ex . i undj
miticj
, cloi ) = a. az . . . ami und ccojk bebz ...bmj
,wobei mi Emj ,
Dies
gilt
, da pehp.in . . auch mit mz Ems E. . . .erfüllt
ist .Weiterhin ist a. = be, aibz , ... . , ami = bmi und somit
gilt Ocpj
.Pi
=( a.
t.ie#Ei+bzmmiiIm.t
. ...)
la .tn#taznin:mt... :# )
< 2- mi = Juni
Widerspruch
zu L * ) , d.h. derCode von c ist