Die extrinsische und intrinsische Vokalnormalisierung
Welche Beweise gibt es, dass Vokal-Normalisierung extrinsisch ist?
Hauptseminar: Phonetische Modelle des Spracherwerbs Dozent: Prof. Dr. Jonathan Harrington
Referentin: Veronika Neumeyer
Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München
Problematik im Alltag
„cat“ gesprochen von einer Frau und einem Mann
im Sonagramm unterschiedliche Formantfrequenzen
Warum wird das Wort trotzdem richtig identifiziert???
Problematik in der Phonetik
Vokale gesprochen von Frauen, Männern und Kindern
unterschiedliche
Frequenzen bei F1 und F2
Wie werden die Vokale trotzdem richtig
identifiziert???
ÜBERBLICK
Grundfrage
Begriffserklärungen
Experimente
Überblick
Experimente mit Kontext
Experimente mit F0
Experimente mit Algorithmen
Vergleich verschiedener Vokal-Normalisations- Methoden
Fazit
Grundfrage
Welche Beweise gibt es, dass Vokal-Normalisierung
extrinsisch ist?
Begriffserklärung
„Normalisierung“
Einordnung eines Vokals in eine bei dem Hörer bereits angelegte Vokalnorm
→ Herausfiltern von Variationen aufgrund von anatomischen Unterschieden von
Sprechern
Problem: Ausmaß der Unterschiede zwischen Sprechern abhängig von der Vokalkategorie
Begriffserklärung
„intrinsisch“
ausreichende Information zur
Vokalidentifikation im spektralen Muster des Vokals
z.B. das Verhältnis der Formanten zueinander
sprecherunabhängige Strategie - außer dem Vokal selbst wir keine Information benötigt
Begriffserklärung
„extrinsisch“
Basis für die Identifikation unklarer Vokale:
Informationen über die Größe, Alter und Geschlecht des Sprechers in der
laufenden Aussage
sprecherabhängige Strategie - außer dem Vokal wird noch weitere Information
benötigt
Begriffserklärung
„extrinsisch“
Analyse der durchschnittlichen Formantwerte eines Sprechers
Hörer legt intern Kategorien von Vokalen dieses Sprechers an
Festlegung der Grenzen des Referenzbereiches durch die „point vowels“ /a,i,u/
Vokale des Sprechers werden in die Kategorien eingeordnet
Experimente
1. Experimente mit Kontext 2. Experimente mit F0
3. Experimente mit Algorithmen
Experimente mit Kontext
Ladefoged & Broadbent (1957)
Wahrnehmung des synthetisierten Testworts abhängig von der
vorausgehenden synthetisierten Phrase
F1 in der vorausgehenden Phrase nach unten verschoben → /bIt/ → /bεt/
F1 in der vorausgehenden Phrase nach oben verschoben → /bæt/ → /bεt/
Experimente mit Kontext
Dechovitz (1977)
Mann und Junge sprechen mit der selben Betonung, Geschwindigkeit und
Grundfrequenz
unterschiedliche Formantfrequenzen
/bVt/-Silbe eines Mannes in einen Satz eines 9-jährigen Jungen eingefügt
Vokalwahrnehmung verändert sich
Experimente mit Kontext
Assmann, Nearey &Hogan (1982)
Liste von /CVC/-Silben
Mixed-Speaker-Test: Sprecher wechselt
Blocked-Speaker-Test: ein Sprecher
Blocked-Speaker-Test: weniger Fehler bei der Vokalidentifikation
Experimente mit Kontext
Creelman (1957)
Mixed-Speaker-Test: Fehlerfreiheit bei der Worterkennung bei Lärm geringer
Summerfield &Haggard (1973)
Mixed-Speaker-Test: Reaktionszeit bei der Worterkennung länger
Experimente mit Kontext
Verbrugge et al. (1976)
im Mixed-Speaker-Test werden Silben präsentiert
geringe Fehlerrate
→Vermutung, dass die Silbe genug Information enthält
Trotzdem: Ergebnisse beim Blocked- Speaker-Test besser
Experimente mit F0
Johnson:
Hörer verwendet F0 als Schlüssel zur Identität des Sprechers
an F0 kann der Hörer ungefähr anschätzen wie groß der Vokaltrakt des Sprechers ist
Abschätzung hilfreich für die Erstellung des
„Frame of Reference“
Experimente mit F0
Lehiste & Meltzer (1973)
Vokalwahrnehmung schlecht wenn F0 eines Kindes mit den Formantfrequenzen eines
Mannes vorgespielt wird
umgekehrt noch schlechter
Gottfried & Chew (1986)
Vokalwahrnehmung schlecht, wenn F0 von
Experimente mit F0
Was passiert bei geflüsterten Lauten ohne F0?
Eklund & Traunmüller (1997)
Vokalwahrnehmungsexperiment
Fehlerrate bei stimmhaften Vokalen: 4,5%
Fehlerrate bei geflüsterten Vokalen: 12%
Experimente mit F0
Fujisaki & Kawashima (1968)
Grundfrequenz beeinflusst Vokalidentität wenn Formantfrequenzen fixiert sind
Experimente mit Algorithmen
Experimente von Gerstman (1968), Lobanov (1971) und Nearey (1978) basieren auf:
Fn‘ = ( Fn – a ) / b
Fn = Wert des Formant Nummer n
Fn‘ = normalisierter Wert des selben Formanten
Experimente mit Algorithmen
Gerstman (1968)
a ist Minimum von Fn
b ist Intervall von Fn
Lobanov (1971)
Normalverteilung
a ist Mittlewert
Experimente mit Algorithmen
Nearey (1978)
Fn‘ = log ( Fn ) – a
a = sprecherabhängige Konstante
a = Mittel des Logarithmus von F1 und des Logarithmus von F2 aller Vokale eines
Sprechers
Experimente mit Algorithmen
Miller (1989)
dreidimensionaler Normalisationsraum Dn ( n = 1,2,3 )
Dn = log10 ( Fn ) – log10 ( Fn-1 ); ( n = 2,3 )
D1 = log10 ( F1 ) – log10 ( SR )
SR = „sensorische Referenz“
SR = k ( GMf0 / k)
Experimente mit Algorithmen Analyse
Disner (1980)
Vergleich von extrinsischen Normalisationsmethoden mit Vokaldaten aus 6 Sprachen
am effektivsten:
Nearey (1977)
vor allem bei dänisch und holländisch
Syrdal (1984)
Analyse von 8 Normalisationsmethoden
Vergleich von Vokal-
Normalisations-Methoden
Adank, Smits, van Hout (2004)
3 Kriterien
wie effektiv wird:
phonemische Information konserviert
Information über den regionalen Hintergrund und soziologische Information konserviert
anatomische und physiologische Variationen
Vergleich von Vokal-
Normalisations-Methoden
80 weibliche und 80 männliche
professionelle holländische Sprecher
Einteilung nach Geschlecht und Herkunftsregion
Produktion der neun holländische Vokale /αaεIiouүy/
jeweils 2x
Kontext: /sVs/
Vergleich von Vokal-
Normalisations-Methoden
Sprachmaterial aus „soziologischem Interview“
Vielzahl von Aufgaben
Trägersatz mit Silbe in Interview 2x wiederholt
unterschiedliche Aufnahmebedingungen
z.T. in einem leeren Klassenzimmer
Vergleich von Vokal-
Normalisations-Methoden
Vergleich von Vokal-
Normalisations-Methoden
Ergebnis:
am besten:
LOBANOV
NEAREY1
GERSTMAN
die drei schlechtesten waren intrinsische Methoden
Vergleich von Vokal-
Normalisations-Methoden
Fazit der Studie:
Vokal-extrinsisch besser wie Vokal-intrinsisch
Formant-intrinsisch besser wie Formant- extrinsisch
beste Lösung:
Vokal-extrinisch, Formant-intrinsisch
Fazit
nicht eindeutig, ob Vokal-Normalisierung extrinsisch oder intrinsisch ist
es gibt Beweise für extrinische und für intrinsische Theorien
Fazit vieler Studien ist, dass wahrscheinlich beides eine Rolle spielt