• Keine Ergebnisse gefunden

SVD mit vier Messgr¨oßen

Im Dokument Das Göttinger Heiserkeits-Diagramm (Seite 87-91)

7. Analyse des Datenraumes der akustischen Stimmg¨ utemaße 78

7.6. SVD mit vier Messgr¨oßen

Da es hier um die Entwicklung neuer, aussagekr¨aftiger Darstellungen der Stimmg¨ute gehen soll [79, 85, 86], ist der hohe Anteil der Grundperiodenl¨ange an der zweitwich-tigsten Hauptachse nicht w¨unschenswert, denn die Verschiedenheit der Grundperioden bei M¨annern und Frauen gestattet keine Aussage ¨uber den Grad der Stimmst¨orung.

Deshalb werden die Grundperiodenmaße im Folgenden weggelassen. Da die Jitter und Shimmermaße jeweils mit fast gleichen Beitr¨agen der Komponenten zu den Hauptachsen beitragen, reicht es aus, nur ein Jitter- und nur ein Shimmermaß zu betrachten. Gleiches gilt f¨ur die Korrelationsmaße: Hier wird im Folgenden nur noch der Mittelwert verwen-det, Minimum, Maximum und Varianz werden ausgelassen. Weiterhin wird wegen der oben besprochenen Eigenschaften nur noch das Maximum des GNE betrachtet.

normalisiertes Stimmguetemassnormalisiertes Stimmguetemass

1. Eigenvektor, Varianz 0.78 2. Eigenvektor, Varianz 0.14

1. Basisvektor, Varianz 0.67 2. Basisvektor, Varianz 0.25

MWC J2 S2 GNE

MWC J2 S2 GNE

MWC J2 S2 GNE

MWC J2 S2 GNE

normalisiertes Stimmguetemassnormalisiertes Stimmguetemass

Abbildung 7.3.:Oben: Die ersten beiden Hauptrichtungen; unten: Nach Rotation des Koordinatensystems.

Es bleiben also vier Maße, auf die erneut die SVD angewandt wird. Die Wahl von J2 (entspricht PPF) und S2 (entspricht EPF) als Repr¨asentanten der Jitter- und Shimmer-maße ist zun¨achst noch etwas willk¨urlich und wird sp¨ater genauer untersucht werden.

Die Hauptachsentransformation ergibt, dass der Datenraum im Wesentlichen zwei-dimensional ist: In der ersten Hauptrichtung liegen 78% und in der zweiten liegen 14%

der Varianz. In Abbildung 7.3 sind oben die ersten beiden Hauptvektoren abgebildet.

In Abbildung 7.4 sind die Datenpunkte aller pathologischen Sprecher im zweidimen-sionalen Unterraum dargestellt. Jeder Datenpunkt wird durch einen (bei dieser Vergr¨oße-rung nicht lesbaren) Bezeichner markiert. Auff¨allig ist die leicht abfallende Gerade, die die Datenpunkte nach unten begrenzt. Die Datenverteilung sieht wie ein leicht gedreh-tes Rechteck aus. Man zeigt leicht, dass sich durch eine Rotation des zweidimensionalen Unterraums um den Winkel

ϕ = arctanv2i

v1i

(7.9) wobeiv1i die i-te Komponente des ersten Hauptvektors undv2i die i-te Komponente des zweiten Hauptvektors ist, stets erreichen l¨asst, dass diei-te Komponente in der rotierten ersten Hauptrichtung verschwindet. Durch eine solche Rotation (25 Grad) entstehen die Basisvektoren in Abbildung 7.3 unten, bei denen die GNE-Komponente im ersten Basis-vektor verschwindet. Die BasisBasis-vektoren zeigen jetzt nicht mehr in die Hauptrichtungen, sind jedoch immer noch orthogonal. Da man bei der Multiplikation von drei Matrizen beliebig klammern darf, ist es gleichwertig, ob erst die Daten in den zweidimensiona-len Unterraum projiziert werden und dann die Rotation erfolgt, oder ob man gleich die Hauptrichtungsvektoren mit der Rotationsmatrix multipliziert.

Durch diese Rotation wird eine Trennung zwischen den Maßen erreicht: In der ersten Basisrichtung sind die Maße MWC, J2, S2 etwa gleich stark vertreten, in der zweiten Hauptrichtung bleibt nur der GNE ¨ubrig. Der zweidimensionale Unterraum der ersten beiden Hauptrichtungen wird deshalb von zwei orthogonalen Maßen aufgespannt: einer Linearkombination von MWC, J2, S2 und einer Lineartransformation des GNE. Diese zwei Maße sind die Grundlage des Heiserkeits-Diagramms. Bei diesem wird auch die erste Achse (die Irregularit¨atskomponente) aus dem Korrelationswert MWC, einem Jittermaß und einem Shimmermaß berechnet. Die zweite Achse ist auch eine Lineartransformation des GNE.

In Abbildung 7.5 sind in der oberen Abbildung die Messdaten von Normalstimmen (links unten) und Fl¨usterstimmen (rechts oben) zu sehen. Die beiden Gruppen sind sowohl in der horizontalen als auch in der vertikalen Richtung deutlich getrennt. Eine eindeutige Klassifikation ist m¨oglich.

In Abbildung 7.4 unten f¨allt auf, dass die Datenpunkte in der vertikalen Richtung nicht normalverteilt sind, sie h¨aufen sich im unteren Teil. Da diese Achse im Wesentlichen durch den GNE bestimmt wird, bedeutet das, dass der GNE nicht normalverteilt ist.

Die Grundlage der SVD sind aber normal- oder gleichverteilte Daten. Deshalb wurde der GNE so transformiert, dass die Daten ann¨ahernd gleichverteilt sind (log(1−GNE)).

Das Ergebnis f¨ur Normal- und Fl¨usterstimmen nach SVD (mit den Daten der patho-logischen Gruppe) und Rotation ist in Abbildung 7.5 unten zu sehen: Die Trennung in horizontaler Richtung hat sich nicht ver¨andert. Der Abstand zwischen den Gruppen in der Vertikalen hat sich jedoch stark verkleinert. Da die zu entwickelnde Stimmg¨utedar-stellung eine m¨oglichst klare Trennung zwischen normalen und pathologischen Stimmen erm¨oglichen soll, wird deshalb auf die Transformation des GNE verzichtet, obwohl die Werte dann nicht gleichverteilt sind.

-4 ec270573.w.nec270573.w.n ec27057a.w.n

ec27057a.w.n hm18087b.m.lhm18087b.m.lhm18087b.m.l

hm250461.m.l jg181058.w.mjg181058.w.mjg181058.w.m

jg181242.m.u ob11046a.w.Aob11046a.w.Aob11046a.w.A

oc150864.w.a ri150556.w.Ori150556.w.Ori150556.w.O

rl200441.w.O tg021119.m.btg021119.m.btg02111a.m.k tg02111a.m.k

bc05127a.w.a bd250956.m.Pbd250956.m.Pbd250956.m.P

bf090846.m.f bh15015a.m.obh250468.m.a bh15015a.m.o bh250468.m.abh250468.m.a bl13066a.m.Abl13066a.m.A bl13066a.m.A

bm020232.w.l

bp131066.w.abp13106a.w.Abp131066.w.a bp13106a.w.A

bw13054a.m.lbw13054a.m.lbw13054a.m.l bw210250.m.n

bw210250.m.nbw210250.m.nbw210250.m.n

bw250442.m.b

ch24042b.m.s ch24042b.m.s ch24042b.m.s

cs290861.w.n

du21054b.w.P du21054b.w.Pdu21054b.w.P

du21054b.w.P

em02047a.m.aem02047a.m.aem02047a.m.a er061163.w.a fj11084a.m.kfj11084a.m.kfj11084a.m.k fj11084b.m.e gd27086a.m.agd27086b.m.agd27086b.m.a gd27086b.m.a

gg051067.w.o hk250537.m.phk250537.m.phk250537.m.p

hl170636.w.l jg18124a.m.ujg18124a.m.ujg18124a.m.u

jh170350.m.l

kb060659.m.o kb060659.m.okb060659.m.o kb231244.m.Y

kj22065a.w.Akj22065a.w.Akj22065a.w.A kj22065b.w.A kj22065b.w.A

kk11014a.m.Akk11014a.m.Akk11014a.m.A kk11014a.m.A ky01105a.m.a ky01105a.m.aky01105a.m.a

ky01105b.m.a ob11046a.w.Aob11046a.w.Aob11046a.w.A

oc150864.w.a

sg191139.m.psg191139.m.p sg201148.m.f

sg201148.m.f tg02111b.m.ktg02111b.m.ktg02111b.m.k

tg02111c.m.k

wg03126b.w.ywg03126b.w.ywg03126b.w.y

wg160141.m.o wg160141.m.o wm250974.m.awm25097a.m.A wm250974.m.a wm25097a.m.A

Abbildung 7.4.:Oben: Datenpunkte im Koordinatensystem der ersten beiden Haupt-achsen; unten: nach Rotation des Koordinatensystems.

-2 0 2 4 6

dm110nadm110nbdm110nc

dm110ra

mr247namr247nc mr247nb

mr247ra

or123naor123ncor123nb

or123ra

or196na or196nb or196nc

or196ra

dm175ncmf165ncmf220nb mf247nb

dm110na dm110nbdm110nc

dm110ra

Abbildung 7.5.: Oben: Datenpunkte im Koordinatensystem der rotierten ersten beiden Hauptachsen. Normalstimmen liegen links unten,Fl¨usterstimmen rechts oben; unten:

Darstellung nach SVD mit log(1-GNE). Varianzen: 1. Koordinate 67%, 2. Koordinate 25%.

7.7. Korrelationen zwischen akustischen Stimmg¨

Im Dokument Das Göttinger Heiserkeits-Diagramm (Seite 87-91)