• Keine Ergebnisse gefunden

Vor¨uberlegungen zur Messung

Im Dokument Das Göttinger Heiserkeits-Diagramm (Seite 114-123)

7. Analyse des Datenraumes der akustischen Stimmg¨ utemaße 78

8.1. Messungen bei realen Stimmen

8.1.1. Vor¨uberlegungen zur Messung

Um den Einfluss des Vokaltrakts auf Jitter und Shimmer an realen Stimmen zu messen, muss man sich zun¨achst einmal ¨uberlegen, wie und aus welchen Signalen man Jitter und Shimmer jeweils vor und hinter dem Vokaltrakt messen kann. Dabei ist man durch die Wahl praktikabler L¨osungen sehr beschr¨ankt. Ideal w¨are es, das akustische Signal am Ort der Glottis zu messen. Diese Art der Messung ist jedoch nicht zumutbar und mit vertretbarem Aufwand zu leisten. Jitter und Shimmer an der Glottis k¨onnten auch mit Hochgeschwindigkeitskameras gemessen werden. Diese Methode wird gegenw¨artig jedoch relativ selten angewandt, da Hochgeschwindigkeitskameras noch nicht als Stan-dardausr¨ustung vorhanden sind. Außerdem liefern die derzeitigen Systeme zeitlich und r¨aumlich zu geringe Aufl¨osungen, um Jitter und Shimmer zu messen. Ein weiterer Nach-teil der Hochgeschwindigkeitskameras ist, dass sie die Phonation behindern und selbst relativ laut sind, also St¨orger¨ausche verursachen. Prinzipiell w¨aren Jitter und Shim-mer auch mit der Photoglottographie (PGG) messbar. Hier ist zumindest die zeitliche Aufl¨osung nicht begrenzt und die r¨aumliche Aufl¨osung relativ hoch. Leider stand f¨ur diese Arbeit kein PGG zur Verf¨ugung. Deshalb wird hier auf die vierte M¨oglichkeit aus-gewichen: Messung von Jitter und Shimmer mit dem Elektroglottogramm (EGG). Das EGG muss wegen des relativ geringen Signal-Rauschabstandes tiefpassgefiltert werden.

Die Ableitung des EGG (DEGG) gibt Auskunft ¨uber die Geschwindigkeit der ¨Anderung der Stimmlippenkontaktfl¨ache. Diese ¨Anderung ist im Moment des Glottisschlusses am gr¨oßten, zu dem Moment also, an dem die h¨oheren Frequenzen angeregt werden. Es ist deshalb sinnvoll, eine Periodenl¨ange von einem Minimum des DEGG bis zum n¨achsten zu messen. Schoentgen r¨at bei der Differenzierung und Tiefpassfilterung des EGG’s ein Filter mit linearer Phase (also keine relativen Phasenverschiebungen bei verschiedenen Frequenzen) zu verwenden. Deshalb wurde hier ein Filter mit reeller ¨ Ubertragungsfunk-tion, einer GaußfunkUbertragungsfunk-tion, im Spektralbereich benutzt. Diese wurde differenziert, so dass die ¨Ubertragungsfunktion lautete:

Re(H(f)) = 0 (8.1)

Im(H(f)) = 2πf eln(2)

f2 f2 G

mit der im Folgenden als Grenzfrequenz bezeichneten FrequenzfG.

Das Ergebnis von Differenzierung und Tiefpassfilterung eines EGG ist beispielhaft in Abbildung 8.1 gezeigt. Die differenzierten und tiefpassgefilterte EGG zeigen ein sehr deutliches Minimum. Oben im Zeitsignal ist zu erkennen, dass der Zeitpunkt der Mi-nima mit dem Anregen der Formantschwingungen zusammenf¨allt. Neben den MiMi-nima in den DEGG ist auch ein schw¨acheres Maximum zu erkennen, dass bei der ¨Offnung der Stimmlippen auftritt. Aus dem Abstand dieser Extrema kann die Verschlusszeit und damit auch die ¨Offnungszeit gemessen werden.

Der Rauschanteil in den DEGG nimmt mit kleiner werdender Grenzfrequenz des Filters ab. W¨ahrend das Signal bei 5000Hz Grenzfrequenz noch relativ stark verrauscht ist, erscheint das Signal bei 2000Hz Grenzfrequenz vergleichsweise glatt.

Die Spektren in Abbildung 8.2 zeigen, dass das EGG St¨orfrequenzen um 8kHz und 16kHz enth¨alt, die bei einer Grenzfrequenz von 5000Hz noch deutlich sichtbar sind, die jedoch bei 2000Hz Grenzfrequenz weitgehend unterdr¨uckt werden. Im folgenden wird deshalb stets mit einer Grenzfrequenz von 2000Hz gearbeitet.

Trotz Tiefpassfilterung zeigen die Minima des DEGG zuweilen Doppelspitzen wie in Abbildung 8.3. Da diese Doppelpeaks ¨uber mehrere Perioden konsistent auftreten, kann es sich hierbei nicht um zuf¨alliges Rauschen handeln. Bei der Frequenz, die dem reziproken Zeitabstand der Doppelpeaks entspricht (ca. 3000Hz), ist im Zeitsignal ein Formant zu erkennen. Es ist außerdem bekannt, dass bei der Glottisschwingung eine Wanderwelle auf der Stimmlippenschleimhaut von unten nach oben l¨auft. Durch zwei Wellenberge dieser

”mucosal wave“ k¨onnte es beim Verschluss zu dem beobachteten Doppelpeak kommen. In der Literatur konnten bisher keine Angaben zu einem solchen Doppelpeak gefunden werden.

Die Doppelpeaks sind nicht nur theoretisch interessant, sondern sie erschweren auch die Bestimmung der Periodenl¨angen. Ohne solche Doppelpeaks w¨are Peakpicking ein gutes Verfahren zur Bestimmung der Periodenl¨ange, es erfasst genau den Zeitraum von einer Anregung des akustischen Signals bis zur n¨achsten. Die Doppelpeaks f¨uhren je-doch zu falschen Periodenl¨angen (Abbildung 8.4) oben. Mit einem iterativen Ansatz kann man jedoch trotzdem noch Nutzen aus den Maxima des DEGG ziehen: Zuerst

wird durch Peakpicking grob die Lage des Minimums bestimmt. Dann wird mit einem dem Waveform Matching sehr ¨ahnlichen Verfahren die genaue Periodenl¨ange bestimmt:

Es wird die Zeitdifferenz gesucht, bei der der Korrelationswert zwischen einem Zeitseg-ment mit 1ms L¨ange (zentriert um den aktuell gefundenen Peak) und einem zweiten 1ms langem Segment, das im Bereich der zu erwartenden Grundperiode vom aktuellen Peak entfernt liegt, maximal ist. Die Segmentl¨ange von 1ms hat sich als g¨unstig herausgestellt, da sie den zentralen Teil der Minima ¨uberdeckt. Die Breite der Peaks ist auch bei stark variierender Grundperiode relativ konstant, sie entspricht in etwa der reziproken Fre-quenzbandbreite des Filters. Mit dieser Methode wird eine sehr gute ¨Ubereinstimmung der Periodenl¨ange erreicht (Abbildung 8.4 Mitte und unten).

In der Abbildung 8.5 sind Energie und Periodel¨angen jeweils im EGG und vom Mi-krofonsignal in einem Bereich alternierender Periodenl¨angen eines Sprechers dargestellt.

Hier sieht man, dass die schnellen Wechsel von kurzer und langer Periodenl¨ange sowohl im EGG als auch im Mikrofonsignal gemessen werden k¨onnen. Das Gleiche gilt f¨ur die Energie. W¨ahrend jedoch der zeitliche Verlauf beim EGG relativ glatt ist, zeigen sich im Mikrofonsignal deutliche Schwankungen der mittleren Werte und der Differenzen der aufeinanderfolgenden Werte.

Um den iterativen Ansatz der Periodenl¨angenberechnung im EGG zu testen, wurden Jitterwerte einmal aus einer Periodenl¨angensequenz berechnet, die durch Peakpicking bestimmt wurden, und ein zweites Mal mit der oben angegebenen Methode (¨ahnlich dem Waveform Matching). Im oberen Teil der Abbildung 8.6 ist der Quotient der Jitter-werte die analysierten Segmente dargestellt. Es wurden jeweils 100 Periodenl¨angen zur Berechnung eines Jitterwertes herangezogen. Es ist zu erkennen, dass der Quotient im Großen und Ganzen in der N¨ahe von eins liegt. Die Methoden liefern also vergleichbaren Jitter. Bei manchen Segmenten steigt jedoch der Quotient auf große Werte an. Das be-deutet hohe Jitterwerte bei der Peakpicking-Methode. Diese hohen Werte stammen aus der fehlerhaften Periodenl¨angenbestimmung mit dem Peakpicking bei Doppelpeaks.

4.365 4.37 4.375 4.38 4.385 4.39 4.395

4.365 4.37 4.375 4.38 4.385 4.39 4.395

4.365 4.37 4.375 4.38 4.385 4.39 4.395

4.365 4.37 4.375 4.38 4.385 4.39 4.395

4.365 4.37 4.375 4.38 4.385 4.39 4.395

Zeit [s]

Abbildung 8.1.:Auswirkung von Differenziation und Tiefpassfilterung auf das EGG.

Von oben nach unten: Zeitsignal ([ε:]), EGG, differenzierte und tiefpassgefilterte EGGs:

5000Hz, 2000Hz und 1000Hz Grenzfrequenz, Gaußfilter. Der Abstand zwischen den Dop-pelminima bei bei 5000Hz Grenzfrequenz betr¨agt ca. 8 Sample entsprechend 6000Hz

Abbildung 8.2.:Spektren des EGG. Von oben nach unten: EGG, differenzierte und tiefpassgefilterte EGG’s: 5000Hz und 2000Hz Grenzfrequenz, Gaußfilter

-800 -600 -400 -200 0 200 400

65.66 65.662 65.664 65.666 65.668 65.67 65.672 65.674 65.676 65.678 65.68 65.682 Zeit [s]

-100 -90 -80 -70 -60 -50 -40 -30 -20

0 2000 4000 6000 8000 10000

[dB]

Frequenz [Hz]

-60 -40 -20 0 20 40

0 2000 4000 6000 8000 10000

[dB]

Frequenz [Hz]

Abbildung 8.3.:Von oben nach unten: Zeitsignal, Spektrum des Zeitsignals, Spektrum des differenzierten und tiefpassgefilterten EGGs bei 2000Hz Grenzfrequenz, Gaußfilter.

0.004 0.0045 0.005 0.0055 0.006

2260 2280 2300 2320 2340 2360 2380 2400 2420 2440

Periodenlaenge [s]

Nummer der Periode

Peakpicking im DEGG Wavematch auf DEGG Wavematch auf Mikrofonsignal

Abbildung 8.4.: Oben: Periodenl¨angenberechnung durch Peakpicking auf dem diffe-renzierten EGG (bei 2000Hz Grenzfrequenz, Gaußfilter). Mitte: Wavematching auf dem vorigen Signal mit fester Korrelationsfensterl¨ange von 1ms, Startpunkte zur Korrela-tionsberechnung sind die Peaks des DEGG. Referenzfenster ist um den Peak zentriert.

Unten: Wavematching auf dem Mikrofonsignal. Startpunkte zur Korrelationsberechnung sind die Peaks des DEGG. Von dem mittleren Verlauf wurden 0,5ms und von dem un-teren Verlauf 1ms zur Darstellung subtrahiert.

0.00289 0.0029 0.00291 0.00292 0.00293 0.00294 0.00295 0.00296 0.00297 0.00298

650 660 670 680 690 700 710 720 730 740

Periodenlaenge EGG [s]

0.00291 0.002915 0.00292 0.002925 0.00293 0.002935 0.00294 0.002945 0.00295 0.002955 0.00296

650 660 670 680 690 700 710 720 730 740

Periodenlaenge Mikro. [s]

3.2e+07 3.4e+07 3.6e+07 3.8e+07 4e+07 4.2e+07 4.4e+07 4.6e+07 4.8e+07

650 660 670 680 690 700 710 720 730 740

Energie EGG

2.6 2.8 3 3.2 3.4 3.6 3.8

650 660 670 680 690 700 710 720 730 740

Energie Mikro.

Nummer der Periode

Abbildung 8.5.:Alternierende Periodenl¨angen und Periodenenergien treten im Signal

0.5 1 1.5 2 2.5 3 3.5 4

0 200 400 600 800 1000 1200 1400 1600 1800

Jitter (Peakpicking) / Jitter (Waveform Matching)

Nummer des Analysefensters

Abbildung 8.6.: Quotient der Jitterwerte mit der Peakpicking Methode und mit der Waveform-Matching-Methode (beide am DEGG).

Im Dokument Das Göttinger Heiserkeits-Diagramm (Seite 114-123)