Rohrmodelle für Vokale
Jonathan Harrington, IPDS, Kiel Mai 2003
Herunterladen:
http://www.ipds.uni-kiel.de/jmh/SS03/AC/rohr.pdf
Die Stelle der geringsten Verengung
Wie Konsonanten haben Vokale eine gewisse 'Artikulationsstelle' oder Stelle der geringsten Verengung, die:
• zwischen dem Glottis und hartem Gaumen gebildet wird
• einen bedeutenden Einfluss auf das akustische Signal ausübt Stelle der
geringsten Verengung [i]
[A]
Allgemeines Drei-Rohrmodell für Vokale
Wegen der Verengungsstelle wird der Mundraum in drei Räume aufgeteilt, die mit drei Röhren entsprecherender Länge modelliert werden können
Diese Modelle entsprechen der Länge und Querschnittsfläche vom jeweiligen Rohr
Verengungsrohr
Vorderrohr Hinterrohr L cm
a cm2
a cm2
L cm
Beitrag der Röhre zur Akustik der Vokale
[i]
Alle Röhre tragen zur Akustik/Formanten bei, diese Merkmale jedoch am meisten (in dieser Reihenfolge):
1. Verengungsstelle [u]
2. Rohrlänge
[y]
[] 3. Verengungsbreite
Kaum akustische Unterschiede wegen:
Der Biegung vom Vokaltrakt
≈
Variationen in der Breite hinter oder vor der maximalen Verengung
≈
Resonanz in einem einheitlichen Rohr: Wellenlänge
Jede Frequenz erzeugt Luftdruckveränderungen, die sich in regelmässigen Abstanden wiederholen
Entfernung Luftdruck
Max.
Atmos.
Min
Entfernung
Max. Min.
LuftdruckMax.
λ
Wellenlänge (λ cm) = räumlicher Abstand zwischen Perioden λ
Beziehung zur Frequenz (f)
λ (cm) = c (cm/s) / f (Hz) f = c / λ
(c ist die Schallgeschwindigkeit, 35000 cm/s)
Bedingungen für Resonanz in einem einheitlichen Rohr
• Am gechlossenen Ende: Luftdruckmaximum
• Am offenen Ende: Atmosphärischer Luftdruck
17.5 cm λ = 4 x 17.5 = 70 cm λ/4
λ
Die erste Resonanzfrequenz = F1 = c / λ = 35000/70 = 500 Hz
Zweite Resonanz
λ λ = 4 x 17.5/3 = 23.3 cm
17.5 cm
3λ/4 F2 = c / λ = 35000/23.3 = 1500 Hz
Allgemeine Formel
c = Schallgeschwindigkeit, 35000 cm/s L = Rohrlänge
n = Formantnummer
1 L n
2 4 F
nc
−
=
HzFormant.tcl
5 . 3 17 4
35000
F
2=
= 1500 HzJe grösser L (also je länger das Rohr), umso grösser der
Nenner, daher umso kleiner Fn (umso niedriger die Formanten) Einfluss von Längenunterschieden
1. Rohrlänge: Lippenrundung
Durch Lippenrundung wird hautpsächlich der Vorderrohr länger
F2 (Hz) böten
Göthe böten Dösen
böten Dösen
Göthe Dösen
Göthe degengeben
beten Degen beten geben Degen geben
beten
2400 2000 1600
360340320300280
F1(Hz)
Ein Sprecher (M)
• Kaum eine F1-Änderung, da F1 meistens von den Verengungs- und Hinterröhren abhängt (die bei Lippenrundung kaum geändert werden)
• Senkung von F2 und F3 Akustische Folgen
[e]
[O]
2. Rohrlänge: männlich/weiblich
Die bedeutenden Unterschiede sind in der Pharynxlänge also im Hinterrohr (kürzer in Frauen)
• Erhöhung der Formanten von vorderen und offenen Vokalen
• Wenige Auswirkungen auf hintere Vokale Akustische Folgen
i:
o:
a:
3000 2000 1000
900700500300
F2 (Hz)
F1(Hz)
a:
i: o: männlich
weiblich [i:] bieten
[o:] baten [a:] baten
Änderungen der Schallgeschwindigkeit (c)
1 L n
2 4 F
nc
−
=
Hz Je höher/niedriger der Zähler, umso höher/niedriger FnMy name is Yelda
Normal 2 kHz
Einatmung von Heliox
(c ist höher) 2 kHz
Einatmung
von Schwefel- Hexafluorid (c ist niedriger)
2 kHz
Beispiele: John Ohala, Phonetics Laboratory San Francisco
Perturbation Theorie
Formanten berechnen für ein einheitliches Rohr gedrückt
Wie ändern sich die Formanten?
Nodes und Antinodes
Die Formantänderung hängen von der Verteilung im einheitlichen Rohr von Nodes und Antinodes ab.
Antinode (A) = ein atmosphärischer Luftdruck
Node (N) = ein
Luftdruckmaximum oder -minimum
Auswirkung einer Verengung an
dieser Stelle
Formantsenkung Formanterhöhung
Die Verteilung von Nodes (N) und Antinodes (A)
Lippen Glottis
Luftdruck Erster Formant (F1 = 500 Hz)
A Zweiter Formant (F2 = 1500 Hz)N A N
A N
Max.
Atmos.
Min.
Dritter Formant (F3 = 2500 Hz)
A N A N A N
Offene Vokale und F1-Erhöhung
Offene Vokale wie [a A] werden erzeugt durch:
• Eine Verengung in der Pharynx
• Eine breitere Mundöffnung
[a] [i] Pharynx
Velum
Harter G. A N
Breiter daher F1 Erhöhung
Enger daher F1- Erhöhung
Lippen Pharynx Glottis
F1 = 500 Hz Akustische Folgen
Hohe vordere Vokale und F2-Erhöhung
Rohrmodell für [i]
A N A N
F2-Erhöhung wegen N-Verengung
Harter Gaumen
ca. 11 cm
Lippen Glottis
A N
A N A N
F3-Senkung wegen A- Verengung
Daher für [i]: F2 hoch und sehr nach an F3
Hohe hintere Vokale und F2-Senkung
Modell für [u]
ca. 6 cm
A N
A N A N
Weicher Gaumen
Glottis Lippen
F2-Senkung wegen A- Verengung
A N A N
F3-Erhöhung wegen N- Verengung
Daher für [u]: F2 niedrig und weit weg von einem hohen F3
Vokalverteilung in den Sprachen der Welt
Liljencrants & Lindblom, 1972, Adaptive Dispersion Theory (ADT), Language.
Sprachen bevorzugen Vokale, die für den Hörer maximal unterschiedlich sind.
Daher haben Sprachen mit wenigen Vokalphonemen fast immer [i u a], weil sie in dem F1 x F2 Raum maximal verteilt sind
hoch F2 niedrig
niedrig i u
F1
hoch a
ADT und Lippenrundung
ADT erklärt auch weshalb Sprachen ungerundete vordere und gerundete hintere Vokale bevorzugen
y µ
O F
i u
a
hoch F2 niedrig
e o
niedrig F1 hoch
Vokalröhre, Nomogramme, und die Quantal- Theorie
Jonathan Harrington IPDS, Kiel, Mai 2003
Herunterladen:
http://www.ipds.uni-kiel.de/jmh/SS03/AC/rohr.pdf
Allgemeines Drei-Rohr Modell für Vokale (ohne Lippenrohr)
Lippen Glottis
Festgelegte Parameter
Vorderrohr Hinterrohr
Lvg = 2 cm
Verengungsrohr
Verengungsrohr-Länge Lvg = 2 cm
Ah = 4 cm2
Hinterrohr-Querschnittsfläche = 4 cm2 L = 16.5 cm
Vokaltraktlänge, L = 16.5 cm
Avg = 0.1 cm2
Verengungsrohr-Querschnittsfläche Avg = 0.1 cm2
Allgemeines Drei-Rohr Modell für Vokale
Veränderliche Parameter
Die Länge vom Hinterrohr Lh
Die Länge vom Vorderrohr, Lv wird dementsprechend geändert, sodass die Gesamtlänge vom Vokaltrakt, L, bei 16.5 cm konstant bleibt
L = 16.5 cm
2 cm [i]
Lv = 4.5 cm Lh = 10 cm
2 cm [u]
Lv = 10.5 cm Lh = 4 cm
Formantberechnung in einem Dreirohrmodell
Glottis Lippen
Die Formantwerte können aus der Zusammensetzung von drei
Rohrensystemen modelliert werden, angenommen dass, der Ein- und Ausgang zum Verengungsrohr klein ist
1. Hinterrohr wird modelliert als ein Rohr an beiden Enden geschlossen
2. Hinter- und Verengungsrohr zusammen werden als Helmholtzresonator modelliert
(Physiker: Hermann von Helmholtz)
3. Vorderrohr wird modelliert als ein Rohr hinten geschlossen, vorne offen
1. Hinterrohr
Formanten in einem Rohr, beide Enden geschlossen
Lh Hz 2
h nc F
n=
Zum Beispiel für F2 im Hinterrohr für Lh = 13 cm
Hz 13 2692
x 2
35000 x
h 2 2
F = ≈
Nomogramm vom Hinterrohr
Nomogramm: Eine Abbildung, in der gleichzeitig mehrere Skalen gezeigt wird
1 3 5 7 9 11 13 15
010003000Frequenz(Hz) Lv = 1.5 cm Lh = 13 cm
L=16.5 cm
Lvg=2 cm
2692 Hz
F2h ≈ 2692 Hz
13.5 10.5 7.5 5.5 3.5 1.5 0
Lv: Vorderrohrlänge (cm)
5000
Lh: Hinterrohlänge (cm)
Nomogramm vom Hinterrohr (fortgesetzt)
Damit wir die Bewirkung der Hinterrohrlänge auf die Formanten feststellen können, wird F1-F3 für das Hinterrohr für alle
möglichen Lh-Werte berechnet
Lv: Vorderrohrlänge (cm)
1 3 5 7 9 11 13 15
010003000
F1h F2h F3h
Frequenz(Hz)
Hinterrohrformanten
2692 Hz
13.5 10.5 7.5 5.5 3.5 1.5 0
5000
Lh: Hinterrohlänge (cm)
2. Helmholtzresonator
Ah = 4 cm2 Lv = 2 cm Lh (variabl)
Av = 0.1 cm2
Lv Hz Ah x
Lh x Av 2π
F
HELM= c
(π =3.141593..)
Hz 220
2 Hz x
4 x 8
1 . 0 π
x 2
35000
F
HELM= ≈
zB für Lh = 8 cm
Nomogramm vom Hinterrohr und Helmholtzresonator
Lv (cm)
13.5 11.5 9.5 7.5 5.5 3.5 1.5 0 0
220 Hz
Frequenz (Hz) F1h
F2h
F3h
010002000300040005000
FHELM
Lh (cm)
1 2 3 4 5 6 7 8 9 11 13 15
3. Vorderrohr
Rohr hinten geschlossen, vorne offen:
Hz 1 Lv
n 2
4 v c
F
n−
=
Hz 1346
Hz 5
. 1 6 2
4
35000 v
F
1≈
−
=
zB wenn Lv = 6.5 cm
Nomogramm: Alle Röhre
Lv (cm)
13.5 11.5 9.5 7.5 5.5 3.5 1.5 0 0
F1v F2v F3v
F1h F2h F3h
FHELM
50004000
Frequenz (Hz)
300020001000
Lh (cm)
0
1 2 3 4 5 6 7 8 9 11 13 15
Die Formanten in einem Drei-Rohr-System lassen sich aus den unteren n Formanten von allen Röhren erstellen
Formanten in einem Dreirohrsystem
13.5 11.5 9.5 7.5 5.5 3.5 1.5 0 0
Lh = 11 cm
3.5 2 cm cm
Was sind F1-F5 für dieses 3-Rohr-System?
Lv (cm)
5000
X F1 (=FHELM) = 336 Hz
X F2 (=F1h) = 1591 Hz
X F3 (=F1v) = 2500 Hz
X F4 (=F2h) = 3182 Hz
X F5 (=F3h) = 4773 Hz
40003000200010000
1 2 3 4 5 6 7 8 9 11 13 15
Lh (cm)
Nomogramm: Drei-Rohr-System
Drei-Rohr-System Individuelle Röhre
1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
010002000300040005000Frequenz (Hz)
F1 F2 F3 Lv (cm)
Lh (cm)
Quantal-Theorie der gesprochenenSprache
(K. Stevens, MIT. Siehe Journal of Phonetics, 1989)
1. Die Beziehung zwischen Produktion und Akustik der Sprache ist nicht-lineär.
2. Die Nicht-Linearität hat Quantalgebiete zur Folge.
(Quantalgebiet: grosse artikulatorische Änderung, kaum eine akustische Änderung).
3. Sprachen bevorzugen Laute aus unterschiedlichen Quantalgebieten.
1. Nicht-Linearität
Akustik
Produktion Nicht-lineär
x Lineär
Die Änderung von x und y sind im Verhältnis zueinander
y
2. Nicht-Linearität und Quantalgebiete
Q: Innerhalb eines Q-Gebiets
verursachen grosse artikulatorische Änderungen kaum eine akustische Änderung
Artikulation: Verengungsgrad Approximant
Frikativ
Plosiv Akustik:
Lautstärke
T (Transition): eine kleine artikulatorische Änderung verursacht eine bedeutende akustische Änderung
T
Q Q
Nicht-Linearität hat Quantal-Gebiete zur Folge
3. Bevorzugte Laute
Sprachen bevorzugen Laute aus unterschiedlichen Q-gebieten
Approximant
Frikativ
Plosiv
√
√
√ X
Akustik
Vorteilhaft für den Sprecher
Der Sprecher muss nicht innerhalb eines Q-Gebietes auf eine präzise Weise sprechen, weil hier artikulatorische Änderungen kaum
akustische Änderungen zur Folge haben
Laute aus unterschiedlichen Q-Gebieten sind akustisch recht distinktiv (zB Approximant vs. Frikativ vs Plosiv).
Vorteilhaft für den Hörer
1. Vokale und Nicht-Linearität
Die Beziehung zwischen Artikulation und Akustik der Vokale ist nicht-lineär, weil:
Kontinuierliche Änderung in den Rohrlängen manchmal eine geringe, manchmal eine starke Änderung der Formanten zur Folge haben
1 3 5 7 9 11 13 15 13.5 10.5 6.5 4.5 2.5 0.5 0
Frequenz
F1 F2 F3
Lh (cm) Lv (cm)
gering stark
2. Q-Gebiete in Vokalen
Quantalgebiete gibt es an Stellen, wo die Assoziation zwischen Röhren und Formanten wechselt
1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
0100020003000
F1 = F1 Vorderrohr F1 = F1 HELM
F2 = F2 Vorderrohr F2 = F2 Hinterrohr
Wegen dieser Wechselung haben in diesen Bereichen
unterschiedliche Vokaltraktgestaltung fast die selben Formantwerte (und sind daher Q-Gebiete)
1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
F1 F2 F3 Lv (cm)
Lh (cm)
3. Q-Gebiete und bevorzugte Vokale
Die Häufigkeit von [i] und [u] in den Sprachen der Welt kann durch die Q-Theorie erklärt werden:
Lv (cm) 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
1 3 5 7 9 11
u i
F3 F2 F1
Lh (cm) 13 15