Akustische Phonetik
Uwe Reichel, Phil Hoole
IPS, LMU München
Die Bereiche des ‘signalphonetischen Bandes’
Aus Pompino-Marschall (1995), Abb. 2, S. 14
Phonetische Vorgänge
Inhalt
• Teil I: Allgemeine Akustik und Schwingungslehre – Schwingungen und Wellen
– M¨oglichkeiten der Schalldarstellung
• Teil II: Sprachschall – Quelle-Filter-Theorie
– Akustische Beschreibung einiger Lautklassen
Inhalt 1
Schwingungen und Wellen
Schall
• Ausbreitung von lokalen Druckschwankungen in Form einer Welle
• Druckschwankungen werden als Schwingung behandelt
Schwingung
• zeitlicher Verlauf einer Druckschwankung in einem festen Raumpunkt
• Kenngr¨oßen:
– Frequenz: Anzahl der Schwingungsdurchg¨ange (Perioden) pro Sekunde, in Hertz (Hz); Periodendauer = 1/Frequenz
– Amplitude: vertikaler Abstand zur Zeitachse; in Pascal (Pa, absolute Skala) oder Dezibel (dB, logarithmische Verh¨altnisskala)
– Phase: horizontale Verschiebung der Schwingung
Akustik Teil I: Allgemeine Akustik und Schwingungslehre 2
Eine schwingende Stimmgabel führt zu lokalen
Luftdruck-
schwankungen (Schalldruck), die sich fortpflanzen.
(aus Ladefoged, 1962, Fig. 1.2)
Abb. 1a
Bewegung der Luftmoleküle im Zuge der
fortschreitenden Welle
(aus Ladefoged, 1962, Fig. 1.3)
movement of sound waves t
i m e
Abb. 1b
0 pi 2pi
−1 0 1
Amplitude
0 0.2 0.4 0.6 0.8 1
−1 0 1
Amplitude
Zeit (s)
1Hz 2Hz
Oben:
Ein Umlaufen des Kreises von 0 bis 2π
entspricht einer Periode.
Unten:
Die Frequenz gibt an, wie oft der Einheitskreis in einer Sekunde
umlaufen wird, wieviele Perioden also in eine Sekunde pa
t das genal, bei 2 Hz zweimal, usf.
Frequenz:
Wieviele Perioden passen in eine Sekunde?
1Hz = einmal
2Hz = zweimal, usw.
Abb. 2
M¨ oglichkeiten der Schalldarstellung
1. Als Zeitsignal (Oszillogramm)
• Amplitude (Schalldruck) als Funktion der Zeit
• Ort fest
• vgl. Abbildung 2
2. Als Spektrum
• Amplitude als Funktion der Frequenz
• Ort und Zeitintervall fest
• Zerlegung komplexer Schwingungen in ihre Teilschwingungen (Sinoidalschwingungen)
• Fourieranalyse: Zeitsignal −→ Spektrum; Bestimmung der Amplituden (und Phasen) der enthaltenen Sinoidalschwingungen
• Grundfrequenz f0: gr¨oßter gemeinsamer Teiler (ggT) der enthaltenen Frequenzen
Akustik Teil I: Allgemeine Akustik und Schwingungslehre 5
0 0.25 0.5 0.75 1
−5
−4
−3
−2
−1 0 1 2 3 4 5
Amplitude
Zeit (s) Zeitsignal
0 2 4 6 8
0 1 2 3 4 5
Amplitude
Frequenz (Hz) Spektrum
Zeitsignal und Spektrum einer komplexen Schwingung (rot), als
Ergebnis der Addition von zwei Sinoidalschwingungen (blau, grün).
Die Grundfrequenz ist gleich der Frequenz der tiefsten Komponente
(genauer: gleich dem GGT der Komponenten)
.
Abb. 3
Abbildung 4: Spektren f¨ur die Laute [ia@]
Akustik Teil I: Allgemeine Akustik und Schwingungslehre 7
Quelle [ i ]
[ a ] Schwa
Frequenz (Hz) Frequenz (Hz)
Frequenz (Hz) Frequenz (Hz)
3. Als Spektrogramm (Sonagramm)
• Amplitude als Funktion von Frequenz und Zeit
• x-Achse: Zeit
• y-Achse: Frequenz
• Schw¨arzungsgrad: Amplitude
Abbildung 5: Breitbandsonagramm von [aeiou]. Horizontale Orientierungslinien in 1000-Hz- Schritten.
Akustik Teil I: Allgemeine Akustik und Schwingungslehre 8
a e i o
Zeit ===>
2000 4000 6000 Hz
Quelle-Filter-Theorie (Fant, 1960)
Sprachschall: Rohschall (Quelle), der durch einen nachgeschalteten Resonator (Filter) verformt wird
1. Quelle
• Schwingung der Stimmlippen: periodische Anregung
Abbildung 6: Oszillogramm und durch Glottisschl¨age erzeugtes periodisches Anregungssignal. Das Schließen der Stimmb¨ander (blaue Linien) markiert den Beginn einer Periode.
Akustik Teil II: Sprachschall 9
• Artikulatrische Enge (Frikative): Rauschen
Abbildung 7: Entstehung von Rauschen an Verengungen: Umschlagen der laminaren in eine turbulente Luftstr¨omung.
• Verschlusssprengung (Plosive): transiente Anregung (Impuls)
• Quellen kombinierbar: z.B. Glottis+Enge bei stimmhaften Frikativen
Akustik Teil II: Sprachschall 10
Verknüpfung von Quelle (a) und Filter (b) im Frequenzbereich:
Multiplikation des Rohschallspektrums mit der Übertragungsfunktion des Filters.
Ergebnis (c): Sprachschall
(n: Index über spektrale Anteile)
Abb. 51 aus Pompino-Marschall
2. Filter (Artikulationstrakt)
2. Filter (Artikulationstrakt)
• Verst¨arkung von Frequenzbereichen (Resonanzfrequenzen) des Quellsignals
Abbildung 8: Spektren f¨ur die Laute [ia@]. Rohschall (oben links) wird durch unterschiedliche Filter (charakterisiert durch ihre blau eingezeichnete Ubertragungsfunktion) verformt. Schwarze¨ vertikale Linien markieren die verst¨arkten Frequenzbereiche (Formanten).
Akustik Teil II: Sprachschall 11
Quelle [ i ]
[ a ] Schwa
Frequenz (Hz) Frequenz (Hz)
Frequenz (Hz) Frequenz (Hz)
Formanten:
markiert durch
schwarze
senkrechte
Linien
Formanten:
• Frequenzbereiche erh¨ohter Energie; abh¨angig von resonatorischen Eigenschaften des Artikulationstrakts
• Artikulationstrakt als Sequenz von akustisch definierten Resonatoren repr¨asentierbar:
Abbildung 9: Repr¨asentation des Vokals [i] als Sequenz von Resonatoren.
Akustik Teil II: Sprachschall 12
Artikulation des Vokals [i], schematisch als 5 ohrsystem dargestellt
Drei Resonatortypen:
1. Vorderrohr (c-d); einseitig geschlossenes Rohr 2. Hinterrohr (a-b); beidseitig geschlossenes Rohr
3. Helmholtzresonator (Hinterrohr (a-b) + Verengung (b-c));
“Körper+ “Hals”
Akustische Beschreibung einiger Lautklassen
Orientierung im Sonagramm
• vertikale Linien (Amplitudenmodulation): Glottisschl¨age
• schwarze Balken: Formanten; f¨ur die Charakteristik von Sprachlauten sind die ersten drei Formanten F1–F3 ausschlaggebend
Akustik Teil II: Sprachschall 15
Praat download: www.praat.org
Time (s)
1.4120 2.908
4000
Frequency (Hz)
Time (s)
Formant frequency (Hz)
1.4120 2.908
1000 2000 3000 4000
Hz
i a u
F2
F2
F2
F1
F1
F1
Als weitere Zusammenfassung:
F1 und F2 für die Eckvokale als Sonagrammdarstellung
Vokale: Ausgeprägte Formantstruktur
Plosive
Abbildung 13: Plosiv-Vokal-Sequenz [atada].
• Phasen:
– Pause; bei stimmhaften Plosiven mit Voice Bar gef¨ullt
– Verschlusssprengung (Burst): transiente Anregung; deutliche vertikale Linie ¨uber großen Frequenzbereich
– Aspiration (Rauschen, nur bei Fortis-Plosiven); stochastische Schw¨arzung
• Voice Bar: durch Gewebe abgestrahlte tieffrequente Anteile des Glottissignals, Balken im unteren Frequenzbereich bis ca. 500 Hz
Akustik Teil II: Sprachschall 17
2000 4000 6000 Hz
a t a d a
Plosive
Abbildung 13: Plosiv-Vokal-Sequenz [atada].
• Phasen:
– Pause; bei stimmhaften Plosiven mit Voice Bar gef¨ullt
– Verschlusssprengung (Burst): transiente Anregung; deutliche vertikale Linie ¨uber großen Frequenzbereich
– Aspiration (Rauschen, nur bei Fortis-Plosiven); stochastische Schw¨arzung
• Voice Bar: durch Gewebe abgestrahlte tieffrequente Anteile des Glottissignals, Balken im unteren Frequenzbereich bis ca. 500 Hz
Akustik Teil II: Sprachschall 17
2000 4000 6000 Hz
a t a d a
Plosive
Abbildung 13: Plosiv-Vokal-Sequenz [atada].
• Phasen:
– Pause; bei stimmhaften Plosiven mit Voice Bar gef¨ullt
– Verschlusssprengung (Burst): transiente Anregung; deutliche vertikale Linie ¨uber großen Frequenzbereich
– Aspiration (Rauschen, nur bei Fortis-Plosiven); stochastische Schw¨arzung
• Voice Bar: durch Gewebe abgestrahlte tieffrequente Anteile des Glottissignals, Balken im unteren Frequenzbereich bis ca. 500 Hz
Akustik Teil II: Sprachschall 17
2000 4000 6000 Hz
a t a d a
• Artikulationsstelle:
– u.a. ¨uber Formanttransitionen ermittelbar
– Formanttransition: zeitliche ¨Anderung der Formantfrequenzen an Laut¨uberg¨angen und in Diphtongen
– Beispiel: in Abbildung 13 liegt von den Plosiven aus gesehen der
Ausgangspunkt (Lokus) der Transitionen des zweiten Formanten jeweils bei etwa 1800 Hz
−→ alveolare Artikulationsstelle
Akustik Teil II: Sprachschall 18
Plosive
Abbildung 13: Plosiv-Vokal-Sequenz [atada].
• Phasen:
– Pause; bei stimmhaften Plosiven mit Voice Bar gef¨ullt
– Verschlusssprengung (Burst): transiente Anregung; deutliche vertikale Linie ¨uber großen Frequenzbereich
– Aspiration (Rauschen, nur bei Fortis-Plosiven); stochastische Schw¨arzung
• Voice Bar: durch Gewebe abgestrahlte tieffrequente Anteile des Glottissignals, Balken im unteren Frequenzbereich bis ca. 500 Hz
Akustik Teil II: Sprachschall 17
2000 4000 6000 Hz
a t a d a
Abb. 13. Transitionen
Frikative
Abbildung 14: Frikativ-Vokal-Sequenz [fasaSaCaxaha].
• Anregungssignal: Rauschen; stochastische Schw¨arzung
• Artikulationsstelle: Je weiter entfernt von Mund¨offnung die Konstriktion, desto l¨anger das Resonanzrohr −→ desto
– h¨oher die Gesamtenergie,
– tiefer der Energieschwerpunkt und
– strukturierter das Spektrum (velare und larngale Frikative weisen Formantstruktur auf).
Akustik Teil II: Sprachschall 19
2000 4000 6000 Hz
f a s a ʃ a ç a x a h a
Nasale
• durch oralen Verschluss geschlossene Mundh¨ohle entzieht dem Signal Energie im Bereich ihrer Resonanzen −→ Antiformanten (“Energieeinbr¨uche” im Spektrum)
Trills
• niederfrequente Amplitudenschwankungen, die die Glottisschl¨age ¨uberlagern;
vertikale “Riffelung”
Laterale, Approximanten
• Formantstruktur, niedriger erster Formant
Akustik Teil II: Sprachschall 20
Abbildung 15: Sequenz [laranaja].
Akustik Teil II: Sprachschall 21
l a r a n a j a
2000 4000 6000 Hz