Rohrmodelle für Vokale

(1)

Rohrmodelle für Vokale

Jonathan Harrington, IPDS, Kiel Mai 2003

Herunterladen:

http://www.ipds.uni-kiel.de/jmh/SS03/AC/rohr.pdf

(2)

Die Stelle der geringsten Verengung

Wie Konsonanten haben Vokale eine gewisse 'Artikulationsstelle' oder Stelle der geringsten Verengung, die:

• zwischen dem Glottis und hartem Gaumen gebildet wird

• einen bedeutenden Einfluss auf das akustische Signal ausübt Stelle der

geringsten Verengung [i]

[]

(3)

Allgemeines Drei-Rohrmodell für Vokale

Wegen der Verengungsstelle wird der Mundraum in drei Räume aufgeteilt, die mit drei Röhren entsprecherender Länge modelliert werden können

Diese Modelle entsprechen der Länge und Querschnittsfläche vom jeweiligen Rohr

Verengungsrohr

Vorderrohr Hinterrohr L cm

a cm²

L cm

(4)

Beitrag der Röhre zur Akustik der Vokale

Alle Röhre tragen zur Akustik/Formanten bei, diese Merkmale jedoch am meisten (in dieser Reihenfolge):

1. Verengungsstelle [u]

[i]

2. Rohrlänge

[y]

[]

3. Verengungsbreite

(5)

Kaum akustische Unterschiede wegen:

Der Biegung vom Vokaltrakt

Variationen in der Breite hinter oder vor der maximalen Verengung



(6)

Resonanz in einem einheitlichen Rohr: Wellenlänge

Jede Frequenz erzeugt Luftdruckveränderungen, die sich in regelmässigen Abstanden wiederholen

Entfernung Luftdruck

Max.

Atmos.

Min

Entfernung

Max. Min.

LuftdruckMax.



Wellenlänge (cm) = räumlicher Abstand zwischen Perioden



(7)

(cm) = c (cm/s) / f (Hz)

Beziehung zur Frequenz (f)

f = c /

(c ist die Schallgeschwindigkeit, 35000 cm/s)

(8)

17.5 cm 

 = 4 x 17.5 = 70 cm

/4

Die erste Resonanzfrequenz = F1 = c / = 35000/70 = 500 Hz

Bedingungen für Resonanz in einem einheitlichen Rohr

• Am gechlossenen Ende: Luftdruckmaximum

• Am offenen Ende: Atmosphärischer Luftdruck

(9)

  = 4 x 17.5/3 = 23.3 cm

F2 = c / = 35000/23.3 = 1500 Hz Zweite Resonanz

/4

17.5 cm

(10)

Allgemeine Formel

c = Schallgeschwindigkeit, 35000 cm/s L = Rohrlänge

n = Formantnummer

5 . 3 17 4

35000

F

₂



_{= 1500 Hz}

1 L n

2 4 F

_n

c





_Hz

Formant.tcl

Je grösser L (also je länger das Rohr), umso grösser der

Nenner, daher umso kleiner F_n (umso niedriger die Formanten) Einfluss von Längenunterschieden

(11)

1. Rohrlänge: Lippenrundung

Durch Lippenrundung wird hautpsächlich der Vorderrohr länger

F2 (Hz) böten

Göthe böten Dösen

böten Dösen

Göthe Dösen

Göthe degengeben

beten Degen beten geben Degen geben

beten

2400 2000 1600

360340320300280

F1 (Hz)

Ein Sprecher (M)

• Kaum eine F1-Änderung, da F1 meistens von den Verengungs- und Hinterröhren abhängt (die bei Lippenrundung kaum geändert werden)

• Senkung von F2 und F3 Akustische Folgen

[e]

[]

(12)

2. Rohrlänge: männlich/weiblich

Die bedeutenden Unterschiede sind in der Pharynxlänge also im Hinterrohr (kürzer in Frauen)

• Erhöhung der Formanten von vorderen und offenen Vokalen

• Wenige Auswirkungen auf hintere Vokale

i:

o:

a:

3000 2000 1000

900700500300

F2 (Hz)

F1 (Hz)

a:

i: o: männlich

weiblich [i:] bieten

[o:] baten [a:] baten Akustische Folgen

(13)

Änderungen der Schallgeschwindigkeit ( c)

1 L n

2 4 F

_n

c





_Hz Je höher/niedriger der Zähler, umso höher/niedriger Fn

(14)

Normal

Einatmung von Heliox (c ist höher)

Einatmung von Schwefel- Hexafluorid (c ist niedriger)

My name is Yelda

Beispiele: John Ohala, Phonetics Laboratory San Francisco

2 kHz

(15)

Perturbation Theorie

Wie ändern sich die Formanten?

gedrückt

Formanten berechnen für ein einheitliches Rohr

(16)

Die Formantänderung hängen von der Verteilung im einheitlichen Rohr von Nodes und Antinodes ab.

Node (N) = ein

Luftdruckmaximum oder -minimum

Antinode (A) = ein atmosphärischer Luftdruck

Formanterhöhung Formantsenkung Auswirkung einer

Verengung an dieser Stelle

Nodes und Antinodes

(17)

A

N N

A N

A

N

A

Die Verteilung von Nodes (N) und Antinodes (A)

Erster Formant (F1 = 500 Hz)

Zweiter Formant (F2 = 1500 Hz)

Dritter Formant (F3 = 2500 Hz) Glottis Lippen

Luftdruck

Max.

Atmos.

Min.

(18)

Offene Vokale und F1-Erhöhung

Offene Vokale wie [a ]

werden erzeugt durch:

• Eine Verengung in der Pharynx

• Eine breitere Mundöffnung

[a] [] ^Pharynx

Velum

Harter G. A N

Breiter daher F1 Erhöhung

Enger daher F1- Erhöhung

Lippen Pharynx Glottis

F1 = 500 Hz Akustische Folgen

(19)

Hohe vordere Vokale und F2-Erhöhung

A N A N

A N A N A N

Harter Gaumen

Lippen Glottis

Rohrmodell für [i]

F2-Erhöhung wegen N-Verengung

F3-Senkung wegen A- Verengung

ca. 11 cm

(20)

Hohe hintere Vokale und F2-Senkung

A

N

N A N

A

N

Weicher Gaumen

Lippen Glottis

Modell für [u]

F2-Senkung wegen A- Verengung

F3-Erhöhung wegen N- Verengung

Daher für [u]: F2 niedrig und weit weg von einem hohen F3

ca. 6 cm

(21)

Vokalverteilung in den Sprachen der Welt

Liljencrants & Lindblom, 1972, Adaptive Dispersion Theory (ADT), Language.

Sprachen bevorzugen Vokale, die für den Hörer maximal unterschiedlich sind.

Daher haben Sprachen mit wenigen Vokalphonemen fast immer [i u a], weil sie in dem F1 x F2 Raum maximal verteilt sind

i u

F1 niedrig

hoch F2 niedrig

(22)

y 

 

ADT und Lippenrundung

ADT erklärt auch weshalb Sprachen ungerundete vordere und gerundete hintere Vokale bevorzugen

i u

a F1

niedrig

hoch

hoch F2 niedrig

e o

(23)

Vokalröhre, Nomogramme, und die Quantal- Theorie

Jonathan Harrington IPDS, Kiel, Mai 2003

Herunterladen:

http://www.ipds.uni-kiel.de/jmh/SS03/AC/rohr.pdf

(24)

Allgemeines Drei-Rohr Modell für Vokale (ohne Lippenrohr)

Lippen Glottis

Festgelegte Parameter

Vorderrohr Hinterrohr

Lvg = 2 cm

Verengungsrohr

Verengungsrohr-Länge Lvg = 2 cm

Ah = 4 cm²

Hinterrohr-Querschnittsfläche = 4 cm² L = 16.5 cm

Vokaltraktlänge, L = 16.5 cm

Avg = 0.1 cm²

Verengungsrohr-Querschnittsfläche Avg = 0.1 cm²

(25)

Allgemeines Drei-Rohr Modell für Vokale

Veränderliche Parameter

Die Länge vom Hinterrohr Lh

Die Länge vom Vorderrohr, Lv wird dementsprechend geändert, sodass die Gesamtlänge vom Vokaltrakt, L, bei 16.5 cm konstant bleibt

2 cm

Lh = 10 cm L = 16.5 cm

Lv = 4.5 cm

2 cm

[i]

[u]

(26)

1. Hinterrohr wird modelliert als ein Rohr an beiden Enden geschlossen

2. Hinter- und Verengungsrohr zusammen werden als Helmholtzresonator modelliert

(Physiker: Hermann von Helmholtz)

3. Vorderrohr wird modelliert als ein Rohr hinten geschlossen, vorne offen

Die Formantwerte können aus der Zusammensetzung von drei

Rohrensystemen modelliert werden, angenommen dass, der Ein- und Ausgang zum Verengungsrohr klein ist

Formantberechnung in einem Dreirohrmodell

Lippen Glottis

(27)

1. Hinterrohr

Formanten in einem Rohr, beide Enden geschlossen

Lh Hz 2

h nc F

_n



Zum Beispiel für F2 im Hinterrohr für Lh = 13 cm

Hz 13 2692

x 2

35000 x

h 2 2

F  

(28)

Nomogramm vom Hinterrohr

1 3 5 7 9 11 13 15 13.5 10.5 7.5 5.5 3.5 1.5 0

0100030005000

Lv: Vorderrohrlänge (cm)

Lh: Hinterrohlänge (cm)

Frequenz (Hz)

Nomogramm: Eine Abbildung, in der gleichzeitig mehrere Skalen gezeigt wird

Lv = 1.5 cm Lh = 13 cm

L=16.5 cm

Lvg=2 cm

2692 Hz

F2h 2692 Hz

(29)

Damit wir die Bewirkung der Hinterrohrlänge auf die Formanten feststellen können, wird F1-F3 für das Hinterrohr für alle

möglichen Lh-Werte berechnet

1 3 5 7 9 11 13 15 13.5 10.5 7.5 5.5 3.5 1.5 0

0100030005000

Lv: Vorderrohrlänge (cm)

F1h F2h F3h

Frequenz (Hz)

Hinterrohrformanten

2692 Hz

Nomogramm vom Hinterrohr (fortgesetzt)

(30)

2. Helmholtzresonator

Lv = 2 cm Ah = 4 cm²

Av = 0.1 cm²

Lh (variabl)

Lv Hz Ah x

Lh x Av 2π

F

_HELM

 c

( =3.141593..)

Hz 220

2 Hz x

4 x 8

1 . 0 π

x 2

35000

F

_HELM

 

zB für Lh = 8 cm

(31)

Nomogramm vom Hinterrohr und Helmholtzresonator

220 Hz

Frequenz (Hz)

F1h F2h

F3h

1 2 3 4 5 6 7 8 9 11 13 15 13.5 11.5 9.5 7.5 5.5 3.5 1.5 0 0

010002000300040005000

Lv (cm)

Lh (cm) FHELM

(32)

3. Vorderrohr

Hz 1 Lv

n 2

4 v c

F

_n





Rohr hinten geschlossen, vorne offen:

Hz 1346

Hz 5

. 1 6 2

4 35000 v

F

₁







zB wenn Lv = 6.5 cm

(33)

Nomogramm: Alle Röhre

1 2 3 4 5 6 7 8 9 11 13 15

13.5 11.5 9.5 7.5 5.5 3.5 1.5 0 0

010002000300040005000

Lv (cm)

Lh (cm) Frequenz (Hz)

F1v F2v F3v

F1h F2h F3h

F^HELM

Die Formanten in einem Drei-Rohr-System lassen sich aus den unteren

(34)

1 2 3 4 5 6 7 8 9 11 13 15 13.5 11.5 9.5 7.5 5.5 3.5 1.5 0 0

010002000300040005000

Formanten in einem Dreirohrsystem

X F1 (=FHELM) = 188 Hz

Lh = 11 cm

3.5 2 cm cm

Was sind F1-F5 für dieses 3-Rohr-System?

X F2 (=F1h) = 1591 Hz Lv (cm)

Lh (cm)

X F3 (=F1v) = 2500 Hz

X F4 (=F2h) = 3182 Hz

X F5 (=F3h) = 4773 Hz

(35)

1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0

010002000300040005000

Nomogramm: Drei-Rohr-System

Lv (cm)

Lh (cm)

Frequenz (Hz)

Individuelle Röhre Drei-Rohr-System

F1 F2 F3

(36)

Quantal-Theorie der gesprochenenSprache

1. Die Beziehung zwischen Produktion und Akustik der Sprache ist nicht-lineär.

2. Die Nicht-Linearität hat Quantalgebiete zur Folge.

3. Sprachen bevorzugen Laute aus unterschiedlichen Quantalgebieten.

(Quantalgebiet: grosse artikulatorische Änderung, kaum eine akustische Änderung).

(K. Stevens, MIT. Siehe Journal of Phonetics, 1989)

(37)

1. Nicht-Linearität

Akustik

Produktion Nicht-lineär

x Lineär

Die Änderung von x und y sind im Verhältnis zueinander

y

(38)

2. Nicht-Linearität und Quantalgebiete

Q: Innerhalb eines Q-Gebiets

verursachen grosse artikulatorische Änderungen kaum eine akustische Änderung

Artikulation: Verengungsgrad Approximant

Frikativ

Plosiv Akustik:

Lautstärke

T (Transition): eine kleine artikulatorische Änderung verursacht eine bedeutende akustische Änderung

T

Q Q

Nicht-Linearität hat Quantal-Gebiete zur Folge

(39)

3. Bevorzugte Laute

Sprachen bevorzugen Laute aus unterschiedlichen Q-gebieten

Laute aus unterschiedlichen Q-Gebieten sind akustisch recht distinktiv (zB Approximant vs. Frikativ vs Plosiv).

Vorteilhaft für den Hörer

Approximant

Frikativ

Plosiv

Akustik

Vorteilhaft für den Sprecher

Der Sprecher muss nicht innerhalb eines Q-Gebietes auf eine präzise Weise sprechen, weil hier artikulatorische Änderungen kaum

akustische Änderungen zur Folge haben



 X

(40)

1. Vokale und Nicht-Linearität

Die Beziehung zwischen Artikulation und Akustik der Vokale ist nicht-lineär, weil:

Kontinuierliche Änderung in den Rohrlängen manchmal eine geringe, manchmal eine starke Änderung der Formanten zur Folge haben

1 3 5 7 9 11 13 15 13.5 10.5 6.5 4.5 2.5 0.5 0

Frequenz

F1 F2 F3

Lh (cm) Lv (cm)

gering stark

(41)

2. Q-Gebiete in Vokalen

Quantalgebiete gibt es an Stellen, wo die Assoziation zwischen Röhren und Formanten wechselt

1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0

0100020003000

F2 = F2 Vorderrohr F2 = F2 Hinterrohr

(42)

1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0

F1 F2 F3 Lv (cm)

Lh (cm)

Wegen dieser Wechselung haben in diesen Bereichen

unterschiedliche Vokaltraktgestaltung fast die selben Formantwerte (und sind daher Q-Gebiete)

(43)

3. Q-Gebiete und bevorzugte Vokale

Die Häufigkeit von [i] und [u] in den Sprachen der Welt kann durch die Q-Theorie erklärt werden:

1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0

F1 F2 F3 Lv (cm)

Lh (cm)

u i