• Keine Ergebnisse gefunden

Akustische Messgr¨oßen zur Quantifizierung der Unregelm¨aßigkeit der

Im Dokument Das Göttinger Heiserkeits-Diagramm (Seite 32-36)

3. Computermethoden der akustischen Stimmanalyse 25

3.2. Akustische Messgr¨oßen zur Quantifizierung der Unregelm¨aßigkeit der

Bei den oszillierenden Stimmlippen handelt es sich um einen Schwingungsprozess, an dem lebendiges Gewebe beteiligt ist. Viele physiologische Parameter wie z.B. die Anspannung der Kehlkopfmuskulatur beeinflussen wichtige Kenngr¨oßen (Amplitude, Periodenl¨ange) des Schwingungsvorgangs. Diese physiologischen Parameter sind im Allgemeinen aber zeitlich nicht konstant. Beispielsweise ergibt sich der Muskeltonus aus der Summe der Spannungen der momentan kontrahierten Muskelfasern. Die einzelnen Muskelfasern wer-den jedoch in einem stochastischen Prozess durch ihre zugeh¨origen Neurone stets so zur Kontraktion angeregt, dass sich ein gew¨unschter mittlerer Spannungszustand einstellt.

Da es sich um eine ¨Uberlagerung vieler, aber eben nur endlich vieler, Einzelprozesse handelt stellt sich eine statistische Schwankung des Muskeltonus ein. Diese Schwankung

¨ubertr¨agt sich auf die charakteristischen Kenngr¨oßen wie Amplitude und Periodenl¨ange so dass sich zwei aufeinanderfolgende Schwingungszyklen weder in der Amplitude noch in der Periodenl¨ange exakt gleichen. Wenn diese Schwankungen fehlen, wie es bei manchen Sprachsynthesizern der Fall ist, so klingt die Sprache hart und unnat¨urlich. Anderer-seits treten bei normalen Stimmen nur relativ kleine Schwankungen auf. Die G¨ute einer Stimme h¨angt unter anderem mit dem Ausmaß der Perioden-, Amplituden- und Form-schwankungen des Zeitsignals von Periode zu Periode zusammen. Um diese Schwankun-gen zu quantifizieren, werden Maßzahlen f¨ur den Grad der SchwankunSchwankun-gen berechnet. Im Folgenden werden Verfahren zur Erfassung und Quantifizierung dieser Schwankungen beschrieben. Zur Beschreibung der Periodenl¨angenschwankungen hat sich der Terminus Jitter und zur Beschreibung der Amplitudenschwankung der Terminus Shimmer ein-geb¨urgert.

Folgende Arbeiten besch¨aftigen sich mit verschiedenen Aspekten der Messung von Jitter und Shimmer: [51, 71, 72, 104, 107, 116, 118–120, 138, 140, 144, 148, 150, 151].

3.2.1. Jitter und Shimmer

Es gibt keine Definition f¨ur den Begriff Jitter, die vorschreibt, wie dieser ermittelt wird.

Ein erster Anhaltspunkt f¨ur eine Definition ist etwa: die Breite der H¨aufigkeitsverteilung der Differenzen von je zwei aufeinanderfolgenden Periodenl¨angen. Der Jitter h¨angt von der Art der Grundperiodenbestimmung ab, wie Titze gezeigt hat [141]. Weiterhin wird der Jitter entweder auf die Periodenl¨ange bezogen und dann meist in Prozent angegeben, oder als sog. absoluter Jitter berechnet [20].

Der Jitter wurde schon 1961 von Lieberman [71] in fließender Sprache untersucht.

In einer weiteren Arbeit 1963 [72] untersucht er den Zusammenhang von Jitter und Stimmst¨orungen bei pathologischen Stimmen. Bemerkenswert ist die Methode, mit der Liebermann einige tausend Periodenl¨angen bestimmte: Oszillographenbilder des Stimm-signals wurden gefilmt und dann auf Mikrofilm gebracht. Unter einem Mikrofilmsicht-ger¨at wurden dann mit einem Lineal die Periodenl¨angen einzeln von Amplitudenma-ximum zu AmplitudenmaAmplitudenma-ximum ausgemessen. Als Maß f¨ur die Stimmg¨ute benutzte

Liebermann die Zahl der Periodenl¨angenunterschiede, die gr¨oßer als 0,5ms waren.

Als Shimmer werden die Schwankungen der Amplituden der einzelnen Grundperi-oden bezeichnet. Shimmer basiert deshalb ebenso wie Jitter auf dem Auffinden der ein-zelnen Grundperioden, in denen dann zum Beispiel jeweils die Energie berechnet oder das Maximum der Amplitude gesucht wird.

Da auch f¨ur diese Arbeit Methoden zur Periodenstatistik angewandt wurden, werden hier zun¨achst Arbeiten aus der Literatur, die sich mit Jitter und Shimmer besch¨aftigen, vorgestellt. Sie lassen sich in zwei Gruppen trennen: Die eine untersucht und entwickelt Methoden zur Bestimmung von Jitter und Shimmer, die andere wendet diese Methoden zur Stimmanalyse an. Neuere methodische Arbeiten: Schoentgen und de Guchteneere zur Bestimmung des Jitters aus dem akustischen Stimmsignal und dem Elektroglotto-gramm [118], Kroeger ¨uber den Einfluss der Vokaltrakt-Glottis-Kopplung auf Jitter und Shimmer [66], Titze und Winholtz ¨uber den Einfluss von Mikrofontyp und Mikrofon-positionierung [143, 150] sowie Titze ¨uber den Methodeneinfluss der Grundperiodenbe-stimmung [141].

Die letztgenannte Arbeit von Titze verwendet drei verschiedene Methoden, um die Grundperiode zu bestimmen: Bestimmung der Nulldurchg¨ange des tiefpassgefilterten Si-gnales mit linearer Interpolation, Peakpicking des Periodenmaximums mit Interpolation durch eine Parabel, Waveform-Matching mit parabolischer Interpolation des Maximums (entspricht dem ¨Ahnlichkeitsmodell von Medan et al. mit parabolischer Interpolation des Maximums des Skalarproduktes). Das Ergebnis der Arbeit ist, dass die Methoden zwar verschieden starke Werte f¨ur den Jitter liefern, das aber die Relationen zwischen dem Jitter verschiedener Stimmen bei den drei Methoden gleich bleiben. In der Praxis w¨ahlt man deshalb die robusteste Methode aus.

Arbeiten, die Jitter und Shimmer in klinischen Studien als Stimmg¨uteparameter einsetzen, sind: Kasuya et al. in [54] und [52], Banci et al. in [11], Laver et al. in [69], Peppard et al. in [102], Verstraete et al. in [148] und Plante et al. in [105]. Sowohl die Patientengruppen als auch die Zielsetzungen dieser Arbeiten sind unterschiedlich und sollen hier nicht n¨aher besprochen werden.

3.2.2. Perturbationsmaße

Seit Liebermann 1961 das erste Maß f¨ur die Periodenschwankungen oder Periodenpertur-bationen eingef¨uhrt hat, sind unter verschiedenen Namen Perturbationsmaße ver¨offent-licht worden, die jeweils den Jitter der akustischen Signale messen sollen. Pinto und Titze haben 1990 in [104] eine Arbeit zur Vereinheitlichung von Perturbationsmaßen vorgestellt, in der die Perturbationsmaße aus der Literatur auf mathematische Begriffe zur¨uckgef¨uhrt werden.

Im Allgemeinen wird mit den Perturbationsmaßen eine Abweichung der einzelnen Periodenl¨angen von einem lokalen Periodenl¨angenmittelwert gemessen und wiederum

¨

uber diese lokale Abweichung der Perioden gemittelt. Diese Maße sind zum Beispiel bei

Kasuya et al. [51] aufgef¨uhrt. Der Perturbation Quotient (PQ) ist wie folgt definiert:

Dabei ist K die Zahl der Perioden, ¨uber die gemittelt wird, wobei K ungerade ist, so dass es stets eine zentrale Periodenl¨ange gibt. N ist die Anzahl der Perioden, und u(n) steht nicht nur f¨ur die Periodenl¨angen, sondern kann auch bei der Bestimmung des Shimmers die Amplitude oder die Energie der einzelnen Perioden bedeuten. Deshalb wird zwischen einem Pitch Perturbation Quotient (PPQ) und einem Amplitude (bzw.

Energy) Perturbation Quotient APQ (EPQ) unterschieden.

Daneben wird der Perturbation Faktor (PF) (entsprechend PPF, APF und EPF) erw¨ahnt:

Hier wird ¨uber lokale normierte Abweichungen von nur zwei Perioden gemittelt. Dieses Perturbationsmaß ist im Gegensatz zu PQ sensitiv f¨ur einen Anstieg oder Abfall der Grundfrequenz z.B. aufgrund der Satzmelodie. In dieser Arbeit werden Perturbationen mit PF und PQ, K = {3,5,7,11,15} Perioden untersucht und folgende Abk¨urzungen verwendet:

Jittermaße

• Pitch Perturbation Factor, Gleichung 3.12, Abk¨urzung in dieser Arbeit: J2, Peri-odenl¨angenbestimmung mit dem Waveform-matching Verfahren und Interpolation des Maximums, Gleichung 3.10.

• Pitch Perturbation Quotient, Gleichung 3.11, Abk¨urzung J3 f¨ur K = 3, J5 f¨ur K = 5 usw., Periodenl¨angenbestimmung wie oben.

Shimmermaße

• Energy Perturbation Factor [3.12] (Abk¨urzung in dieser Arbeit: S2),

• Energy Perturbation Quotient [3.11] (Abk¨urzung S3 f¨ur K = 3, S5 f¨ur K = 5 usw).

3.2.3. Modelle des Jitters

1993 wurden von Kasuya et al. in [51] ein ARMA- Modell (autoregressive moving ave-rage) des Jitters und von Schoentgen und de Guchteneere in [116] ein autoregressives Modell (AR) benutzt, um Aussagen ¨uber die Statistik der Periodenl¨angensequenzen

zu erhalten. Kasuya et al. charakterisieren mit dem ARMA Modell das Spektrum der Periodensequenz und finden f¨ur gesunde und pathologische Sprecher verschiedene cha-rakteristische Modellparameter.

Schoentgen und de Guchteneere wollen durch ihr Modell die systematischen Pe-riodenl¨angenschwankungen eliminieren, um nur statistische Schwankungen zur Berech-nung des Perturbationsmaßes heranzuziehen. Sie stellen fest, dass sowohl zwischen m¨ann-lichen und weibm¨ann-lichen Sprechern als auch zwischen gesunden und kranken Stimmen die Ordnung des Modells verschieden hoch sein muß, um eine statistische Verteilung zu erreichen. Auch das Perturbationsmaß dieser statistischen Verteilung ist f¨ur die jeweili-gen Gruppen unterschiedlich. Beide Arbeiten benutzen leider nur wenige Stimmproben um, ihre Methoden zu testen, so dass die Vorteile dieser Methoden bei der klinischen Anwendung der Stimmanalyse nur schwer einzusch¨atzen sind.

Im Dokument Das Göttinger Heiserkeits-Diagramm (Seite 32-36)