Rohrmodelle für Vokale
Jonathan Harrington, IPDS, Kiel Mai 2003
Herunterladen:
http://www.ipds.uni-kiel.de/jmh/SS03/AC/rohr.pdf
Die Stelle der geringsten Verengung
Wie Konsonanten haben Vokale eine gewisse 'Artikulationsstelle' oder Stelle der geringsten Verengung, die:
• zwischen dem Glottis und hartem Gaumen gebildet wird
• einen bedeutenden Einfluss auf das akustische Signal ausübt Stelle der
geringsten Verengung [i]
[]
Allgemeines Drei-Rohrmodell für Vokale
Wegen der Verengungsstelle wird der Mundraum in drei Räume aufgeteilt, die mit drei Röhren entsprecherender Länge modelliert werden können
Diese Modelle entsprechen der Länge und Querschnittsfläche vom jeweiligen Rohr
Verengungsrohr
Vorderrohr Hinterrohr L cm
a cm2
L cm
Beitrag der Röhre zur Akustik der Vokale
Alle Röhre tragen zur Akustik/Formanten bei, diese Merkmale jedoch am meisten (in dieser Reihenfolge):
1. Verengungsstelle [u]
[i]
2. Rohrlänge
[y]
[]
3. Verengungsbreite
Kaum akustische Unterschiede wegen:
Der Biegung vom Vokaltrakt
Variationen in der Breite hinter oder vor der maximalen Verengung
Resonanz in einem einheitlichen Rohr: Wellenlänge
Jede Frequenz erzeugt Luftdruckveränderungen, die sich in regelmässigen Abstanden wiederholen
Entfernung Luftdruck
Max.
Atmos.
Min
Entfernung
Max. Min.
LuftdruckMax.
Wellenlänge (cm) = räumlicher Abstand zwischen Perioden
(cm) = c (cm/s) / f (Hz)
Beziehung zur Frequenz (f)
f = c /
(c ist die Schallgeschwindigkeit, 35000 cm/s)
17.5 cm
= 4 x 17.5 = 70 cm
/4
Die erste Resonanzfrequenz = F1 = c / = 35000/70 = 500 Hz
Bedingungen für Resonanz in einem einheitlichen Rohr
• Am gechlossenen Ende: Luftdruckmaximum
• Am offenen Ende: Atmosphärischer Luftdruck
= 4 x 17.5/3 = 23.3 cm
F2 = c / = 35000/23.3 = 1500 Hz Zweite Resonanz
/4
17.5 cm
Allgemeine Formel
c = Schallgeschwindigkeit, 35000 cm/s L = Rohrlänge
n = Formantnummer
5 . 3 17 4
35000
F
2
= 1500 Hz1 L n
2 4 F
nc
HzFormant.tcl
Je grösser L (also je länger das Rohr), umso grösser der
Nenner, daher umso kleiner Fn (umso niedriger die Formanten) Einfluss von Längenunterschieden
1. Rohrlänge: Lippenrundung
Durch Lippenrundung wird hautpsächlich der Vorderrohr länger
F2 (Hz) böten
Göthe böten Dösen
böten Dösen
Göthe Dösen
Göthe degengeben
beten Degen beten geben Degen geben
beten
2400 2000 1600
360340320300280
F1 (Hz)
Ein Sprecher (M)
• Kaum eine F1-Änderung, da F1 meistens von den Verengungs- und Hinterröhren abhängt (die bei Lippenrundung kaum geändert werden)
• Senkung von F2 und F3 Akustische Folgen
[e]
[]
2. Rohrlänge: männlich/weiblich
Die bedeutenden Unterschiede sind in der Pharynxlänge also im Hinterrohr (kürzer in Frauen)
• Erhöhung der Formanten von vorderen und offenen Vokalen
• Wenige Auswirkungen auf hintere Vokale
i:
o:
a:
3000 2000 1000
900700500300
F2 (Hz)
F1 (Hz)
a:
i: o: männlich
weiblich [i:] bieten
[o:] baten [a:] baten Akustische Folgen
Änderungen der Schallgeschwindigkeit ( c)
1 L n
2 4 F
nc
Hz Je höher/niedriger der Zähler, umso höher/niedriger FnNormal
Einatmung von Heliox (c ist höher)
Einatmung von Schwefel- Hexafluorid (c ist niedriger)
My name is Yelda
Beispiele: John Ohala, Phonetics Laboratory San Francisco
2 kHz
2 kHz
2 kHz
Perturbation Theorie
Wie ändern sich die Formanten?
gedrückt
Formanten berechnen für ein einheitliches Rohr
Die Formantänderung hängen von der Verteilung im einheitlichen Rohr von Nodes und Antinodes ab.
Node (N) = ein
Luftdruckmaximum oder -minimum
Antinode (A) = ein atmosphärischer Luftdruck
Formanterhöhung Formantsenkung Auswirkung einer
Verengung an dieser Stelle
Nodes und Antinodes
A
A
N N
A N
A
A
N
N
N
A
Die Verteilung von Nodes (N) und Antinodes (A)
Erster Formant (F1 = 500 Hz)
Zweiter Formant (F2 = 1500 Hz)
Dritter Formant (F3 = 2500 Hz) Glottis Lippen
Luftdruck
Max.
Atmos.
Min.
Offene Vokale und F1-Erhöhung
Offene Vokale wie [a ]
werden erzeugt durch:
• Eine Verengung in der Pharynx
• Eine breitere Mundöffnung
[a] [] Pharynx
Velum
Harter G. A N
Breiter daher F1 Erhöhung
Enger daher F1- Erhöhung
Lippen Pharynx Glottis
F1 = 500 Hz Akustische Folgen
Hohe vordere Vokale und F2-Erhöhung
A N A N
A N A N A N
Harter Gaumen
Lippen Glottis
Rohrmodell für [i]
F2-Erhöhung wegen N-Verengung
F3-Senkung wegen A- Verengung
ca. 11 cm
Hohe hintere Vokale und F2-Senkung
A
A
N
N A N
A
A
N
N
Weicher Gaumen
Lippen Glottis
Modell für [u]
F2-Senkung wegen A- Verengung
F3-Erhöhung wegen N- Verengung
Daher für [u]: F2 niedrig und weit weg von einem hohen F3
ca. 6 cm
Vokalverteilung in den Sprachen der Welt
Liljencrants & Lindblom, 1972, Adaptive Dispersion Theory (ADT), Language.
Sprachen bevorzugen Vokale, die für den Hörer maximal unterschiedlich sind.
Daher haben Sprachen mit wenigen Vokalphonemen fast immer [i u a], weil sie in dem F1 x F2 Raum maximal verteilt sind
i u
F1 niedrig
hoch F2 niedrig
y
ADT und Lippenrundung
ADT erklärt auch weshalb Sprachen ungerundete vordere und gerundete hintere Vokale bevorzugen
i u
a F1
niedrig
hoch
hoch F2 niedrig
e o
Vokalröhre, Nomogramme, und die Quantal- Theorie
Jonathan Harrington IPDS, Kiel, Mai 2003
Herunterladen:
http://www.ipds.uni-kiel.de/jmh/SS03/AC/rohr.pdf
Allgemeines Drei-Rohr Modell für Vokale (ohne Lippenrohr)
Lippen Glottis
Festgelegte Parameter
Vorderrohr Hinterrohr
Lvg = 2 cm
Verengungsrohr
Verengungsrohr-Länge Lvg = 2 cm
Ah = 4 cm2
Hinterrohr-Querschnittsfläche = 4 cm2 L = 16.5 cm
Vokaltraktlänge, L = 16.5 cm
Avg = 0.1 cm2
Verengungsrohr-Querschnittsfläche Avg = 0.1 cm2
Allgemeines Drei-Rohr Modell für Vokale
Veränderliche Parameter
Die Länge vom Hinterrohr Lh
Die Länge vom Vorderrohr, Lv wird dementsprechend geändert, sodass die Gesamtlänge vom Vokaltrakt, L, bei 16.5 cm konstant bleibt
2 cm
Lh = 10 cm L = 16.5 cm
Lv = 4.5 cm
2 cm
[i]
[u]
1. Hinterrohr wird modelliert als ein Rohr an beiden Enden geschlossen
2. Hinter- und Verengungsrohr zusammen werden als Helmholtzresonator modelliert
(Physiker: Hermann von Helmholtz)
3. Vorderrohr wird modelliert als ein Rohr hinten geschlossen, vorne offen
Die Formantwerte können aus der Zusammensetzung von drei
Rohrensystemen modelliert werden, angenommen dass, der Ein- und Ausgang zum Verengungsrohr klein ist
Formantberechnung in einem Dreirohrmodell
Lippen Glottis
1. Hinterrohr
Formanten in einem Rohr, beide Enden geschlossen
Lh Hz 2
h nc F
n
Zum Beispiel für F2 im Hinterrohr für Lh = 13 cm
Hz 13 2692
x 2
35000 x
h 2 2
F
Nomogramm vom Hinterrohr
1 3 5 7 9 11 13 15 13.5 10.5 7.5 5.5 3.5 1.5 0
0100030005000
Lv: Vorderrohrlänge (cm)
Lh: Hinterrohlänge (cm)
Frequenz (Hz)
Nomogramm: Eine Abbildung, in der gleichzeitig mehrere Skalen gezeigt wird
Lv = 1.5 cm Lh = 13 cm
L=16.5 cm
Lvg=2 cm
2692 Hz
F2h 2692 Hz
Damit wir die Bewirkung der Hinterrohrlänge auf die Formanten feststellen können, wird F1-F3 für das Hinterrohr für alle
möglichen Lh-Werte berechnet
1 3 5 7 9 11 13 15 13.5 10.5 7.5 5.5 3.5 1.5 0
0100030005000
Lv: Vorderrohrlänge (cm)
F1h F2h F3h
Frequenz (Hz)
Hinterrohrformanten
2692 Hz
Nomogramm vom Hinterrohr (fortgesetzt)
2. Helmholtzresonator
Lv = 2 cm Ah = 4 cm2
Av = 0.1 cm2
Lh (variabl)
Lv Hz Ah x
Lh x Av 2π
F
HELM c
( =3.141593..)
Hz 220
2 Hz x
4 x 8
1 . 0 π
x 2
35000
F
HELM
zB für Lh = 8 cm
Nomogramm vom Hinterrohr und Helmholtzresonator
220 Hz
Frequenz (Hz)
F1h F2h
F3h
1 2 3 4 5 6 7 8 9 11 13 15 13.5 11.5 9.5 7.5 5.5 3.5 1.5 0 0
010002000300040005000
Lv (cm)
Lh (cm) FHELM
3. Vorderrohr
Hz 1 Lv
n 2
4 v c
F
n
Rohr hinten geschlossen, vorne offen:
Hz 1346
Hz 5
. 1 6 2
4
35000 v
F
1
zB wenn Lv = 6.5 cm
Nomogramm: Alle Röhre
1 2 3 4 5 6 7 8 9 11 13 15
13.5 11.5 9.5 7.5 5.5 3.5 1.5 0 0
010002000300040005000
Lv (cm)
Lh (cm) Frequenz (Hz)
F1v F2v F3v
F1h F2h F3h
FHELM
Die Formanten in einem Drei-Rohr-System lassen sich aus den unteren
1 2 3 4 5 6 7 8 9 11 13 15 13.5 11.5 9.5 7.5 5.5 3.5 1.5 0 0
010002000300040005000
Formanten in einem Dreirohrsystem
X F1 (=FHELM) = 188 Hz
Lh = 11 cm
3.5 2 cm cm
Was sind F1-F5 für dieses 3-Rohr-System?
X F2 (=F1h) = 1591 Hz Lv (cm)
Lh (cm)
X F3 (=F1v) = 2500 Hz
X F4 (=F2h) = 3182 Hz
X F5 (=F3h) = 4773 Hz
1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
010002000300040005000
Nomogramm: Drei-Rohr-System
Lv (cm)
Lh (cm)
Frequenz (Hz)
Individuelle Röhre Drei-Rohr-System
F1 F2 F3
Quantal-Theorie der gesprochenenSprache
1. Die Beziehung zwischen Produktion und Akustik der Sprache ist nicht-lineär.
2. Die Nicht-Linearität hat Quantalgebiete zur Folge.
3. Sprachen bevorzugen Laute aus unterschiedlichen Quantalgebieten.
(Quantalgebiet: grosse artikulatorische Änderung, kaum eine akustische Änderung).
(K. Stevens, MIT. Siehe Journal of Phonetics, 1989)
1. Nicht-Linearität
Akustik
Produktion Nicht-lineär
x Lineär
Die Änderung von x und y sind im Verhältnis zueinander
y
2. Nicht-Linearität und Quantalgebiete
Q: Innerhalb eines Q-Gebiets
verursachen grosse artikulatorische Änderungen kaum eine akustische Änderung
Artikulation: Verengungsgrad Approximant
Frikativ
Plosiv Akustik:
Lautstärke
T (Transition): eine kleine artikulatorische Änderung verursacht eine bedeutende akustische Änderung
T
Q Q
Nicht-Linearität hat Quantal-Gebiete zur Folge
3. Bevorzugte Laute
Sprachen bevorzugen Laute aus unterschiedlichen Q-gebieten
Laute aus unterschiedlichen Q-Gebieten sind akustisch recht distinktiv (zB Approximant vs. Frikativ vs Plosiv).
Vorteilhaft für den Hörer
Approximant
Frikativ
Plosiv
Akustik
Vorteilhaft für den Sprecher
Der Sprecher muss nicht innerhalb eines Q-Gebietes auf eine präzise Weise sprechen, weil hier artikulatorische Änderungen kaum
akustische Änderungen zur Folge haben
X
1. Vokale und Nicht-Linearität
Die Beziehung zwischen Artikulation und Akustik der Vokale ist nicht-lineär, weil:
Kontinuierliche Änderung in den Rohrlängen manchmal eine geringe, manchmal eine starke Änderung der Formanten zur Folge haben
1 3 5 7 9 11 13 15 13.5 10.5 6.5 4.5 2.5 0.5 0
Frequenz
F1 F2 F3
Lh (cm) Lv (cm)
gering stark
2. Q-Gebiete in Vokalen
Quantalgebiete gibt es an Stellen, wo die Assoziation zwischen Röhren und Formanten wechselt
1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
0100020003000
F2 = F2 Vorderrohr F2 = F2 Hinterrohr
1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
F1 F2 F3 Lv (cm)
Lh (cm)
Wegen dieser Wechselung haben in diesen Bereichen
unterschiedliche Vokaltraktgestaltung fast die selben Formantwerte (und sind daher Q-Gebiete)
3. Q-Gebiete und bevorzugte Vokale
Die Häufigkeit von [i] und [u] in den Sprachen der Welt kann durch die Q-Theorie erklärt werden:
1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
F1 F2 F3 Lv (cm)
Lh (cm)
u i