Form und Funktion prosodischer Grenzen
in deutscher Spontansprache
Modul H2
Benno Peters - IPDS Kiel 15. Mai 2008
Einleitung
• Zwei DFG-Projekte:
– Lautmuster deutscher Spontansprache – Prosodische Phrasierung in deutscher
Spontansprache
• Empirische Untersuchungen zur internen
phonetischen Struktur prosodischer Phrasen und zu deren Delimitation
• Die phonetische Form der syntagmatischen Gliederung in prosodische Phrasen ist durch zwei phonetische Mechanismen bestimmt:
– phonetische Kohäsion im Inneren von Phrasen – phonetische Separierung zwischen
prosodischen Phrasen
• Kohäsive Merkmale (interne Struktur)
– globale melodische Muster (Hutmuster, Downstep/Deklination)
– Kontinuität von Phonation, Register Sprechgeschwindigkeit
• Separierende Merkmale (Delimitation)
– melodische Brüche / starke melodische Bewegungen
– Pausen/Atmen – F0-Reset
– segmentelle Längung
– Änderung von Phonationstyp Sprechgeschwindigkeit, Register
• Prosodische Grenzen in natürlichen Gesprächen sind in drei funktionalen Zusammenhängen beobachtbar
– im Inneren von Redebeiträgen als Ausdruck der inhaltlich und syntaktisch motivierten
Gliederung von Äußerungen
– am Ende von Redebeiträgen, oft mit einer auf die Sprecher-Hörer-Interaktion ausgerichteten phonetischen Struktur
– bei unflüssiger Sprechweise entstehen oft starke prosodische Einschnitte, die Planungsvorgänge seitens des Sprechers widerspiegeln
Grundfragen der Untersuchung
• Welche phonetischen Merkmale finden sich an prosodischen Grenzen?
• Können phonetische Klassen prosodischer Grenzen herausgearbeitet werden?
• Können diese phonetischen Klassen mit funktionalen Klassen assoziiert werden?
Grundfragen der Untersuchung
• Welche Rolle spielen phonetische
Merkmale an prosodischen Grenzen bei der Einschätzung des Gesprächsfortgangs durch Hörer?
• Gibt es eine Korrelation zwischen der
Stärke der phonetischen Separierung und inhaltlich-pragmatischen Strukturen?
(z.B. starke Separierung am Ende
inhaltlicher Blöcke oder am Ende von Redebeiträgen)
Grundfragen der Untersuchung
• Es werden also Bezüge hergestellt zwischen
– der phonetischen Struktur von Produktionsdaten
– der inhaltlich-pragmatischen Struktur der Produktionsdaten
– der Wahrnehmung und funktionalen Einordnung durch Hörer
Ziel
Klassifikationssystem für Phrasen-
grenzen unterschiedlicher phonetischer Ausprägung, das eine Form-Funktions- Beziehung widerspiegelt
Methoden I - Die Datenbasis
• Terminabsprachen des Kiel Corpus
(11 Dialogsitzungen mit 22 Sprechern, 2,5 Stunden, 25.000 Wörter)
• Video-Task (6 Dialoge mit 12 Sprechern, 1,5 Stunden, 13.500 Wörter)
Methoden I
Video-Task oder das Daily Soap Szenario
• Vorteile
– hohe akustische Qualität, Kanaltrennung
– VP realisieren nicht, dass das Ziel des Versuchs die Sprachdatenerhebung ist
– keine Eingriffe durch Versuchsleiter in die Dialoge – Alltagssprache mit großer Natürlichkeit, komplexe
Interaktion
• Nachteil
– wenig Kontrolle über linguistische Strukturen in den Daten
Methoden I
Video-Task oder das Daily Soap Szenario
• Hörbeispiel 1
• Hörbeispiel 2
• Hörbeispiel 3
Methoden II
Phonetische Analyse der Produktionsdaten
Methoden II
Phonetische Analyse der Produktionsdaten
• Was kann labelbasiert analysiert werden?
– Melodische Muster (KIM/PROLAB) – F0-Reset an prosodischen Grenzen
– Pausen/Atmungsphasen und deren Dauer
– Segmentdauern an Phrasengrenzen werden mit Segmentdauern in phrasenfinalen Reinem
verglichen
Methoden II
Phonetische Analyse der Produktionsdaten
• Ableitung phonetischer Merkmalsbündel für jede etikettierte prosodische Grenze im
Korpus
• Beispiel: 2._P250_+R_L3
– 2. = stark fallende melodische Bewegung – P250 = Pause von 250ms
– +R = F0-Reset
– L3 = Längungsstufe des phrasenfinalen Reims
Methoden III
Funktionale Zuordnung phonetischer Merkmale
• Grundfrage: Wie komme ich von der
formalen Beschreibung der phonetischen Merkmale zu einer funktionalen
Zuordnung?
• Zwei sich ergänzende Verfahren:
– funktionale Interpretation der Korpusdaten – Perzeptionsexperimente
Methoden III
Interpretation der Produktionsdaten
• Steht die prosodische Grenze am Ende eines inhaltlichen Abschnitts oder innerhalb eines inhaltlichen Abschnitts?
Methoden III
Perzeptionsexperimente
• Nachbildung der phonetischen Variabilität über Resynthesen
• Funktionale Bewertungen durch naive Hörer
• Kontextfreie Präsentation soll Effekte des phonetischen Signalisierungssystems
„freilegen“
Methoden III
Perzeptionsexperimente
• Übertragung der im Korpus beobachteten phonetischen Merkmale in Stimuli für
Perzeptionsexperimente
• Ausgangssatz:
„Das ist ja nun nicht so angenehm.“
• Zwei Parameter gehen in die Resynthesen ein:
– melodische Bewegung am Phrasenende – Längung am Phrasenende
Methoden III
Perzeptionsexperimente
Methoden III
Perzeptionsexperimente
• Welche Fragen sollen den
Versuchspersonen gestellt werden?
– Sprecherwechsel
– Wird der Sprecher nach der Äußerung noch weiter sprechen?
– Sprechflüssigkeit
– Hört sich die Äußerung zögerlich an?
Methoden III
Perzeptionsexperimente
• Welche Fragen sollen den
Versuchspersonen gestellt werden?
– Sprecherwechsel
– Wird der Sprecher nach der Äußerung noch weiter sprechen?
– Sprechflüssigkeit
– Hört sich die Äußerung zögerlich an?
Methoden III
Perzeptionsexperimente
• Wie können die Urteile der VP erhoben werden?
– forced choice?
– Antwortskalen?
• Equal Appearing Interval Scale (Thurston 1929)
• Visual Analogue Scale (Maxwell 1978)
Methoden III
Perzeptionsexperimente
0 1 2 3 4 5 6
0 1 2 3 4 5 6
Hört sich die Äußerung zögerlich an?
Ja Nein
Wird der Sprecher nach dem Satz noch weitersprechen?
Ja Nein
Methoden IV
Zusammenfassung
• Datenerhebung
• Labelbasierte phonetische/akustische Korpusanalyse
• Interpretation einer großen Anzahl von Redebeiträgen
• Perzeptionsexperimente
• Enges Netzwerk in der Konzeption der
Arbeitsschritte und in der Interpretation der gesamten Ergebnisse
Exkurs Sprechflussstörungen
Der Entstehung von Sprechflussstörungen
liegen unterschiedliche Ursachen zugrunde.
Folgende Probleme können zu einer unflüssigen Sprechweise führen:
● Phonetische Versprecher: Während des
Sprechens kann es zu Lautvertauschungen, Fehlartikulationen und anderen
artikulatorischen Problemen kommen.
Exkurs Sprechflussstörungen
● Syntaktische Versprecher: Ein bereits zum Teil ausgesprochener Satz enthält
agrammatische Strukturen oder lässt sich nicht sinnvoll ohne eine Verletzung
grammatischer Regeln fortsetzen.
Exkurs Sprechflussstörungen
● Inhaltliche Versprecher: Ein Wort, das nicht der Intention des Sprechers entspricht, wird versehentlich ganz oder zum Teil
ausgesprochen und eine Korrektur wird notwendig. In diese Kategorie fallen auch die sog. Freudschen Versprecher (Freud 1901/1971).
Exkurs Sprechflussstörungen
● Wortfindungsprobleme: Ein Wort, das
eigentlich bekannt ist, kann nicht rechtzeitig aus dem Gedächtnis abgerufen werden.
● Syntaktische Planungsprobleme: Eine korrekte syntaktische Fortsetzung kann nicht so schnell geplant werden, dass die derzeitige Äußerung flüssig fortgesetzt werden kann.
Ergebnisse I
Labelbasierte Korpusanalyse
• In 93% aller analysierten turninternen
Phrasengrenzen konnte mindestens eines der folgenden Merkmale automatisch extrahiert werden
– phrasenfinale Längung (66,2%) – F0-Reset (63%)
– Pause oder Atmen (38,3%)
– stark fallende oder starke steigende melodische Bewegung (36% stark fallend, 2% stark
steigend)
Ergebnisse I
Labelbasierte Korpusanalyse
• In mehr als 55% aller Fälle treten zwei oder mehr Merkmale gemeinsam auf.
• Die häufigsten Kombinationen sind:
– Längung + F0-Reset
– Längung + Pause + F0-Reset
– Längung + Pause + starke tonale Bewegung
Ergebnisse I
Labelbasierte Korpusanalyse
• Turnfinale prosodische Grenzen zeigen zu 63,8%
stark fallende melodische Bewegungen und zu 10,3% stark steigende Konturen
• Phrasenfinale Längung tritt in 74,3% der Fälle auf (turnintern: 66,2%)
• Hauptunterschied zwischen turnintern und turnfinal liegt im Parameter melodische
Bewegung. Aber: auch turnintern viele stark fallende Konturen
Ergebnisse II Interpretation
• Vergleich der phonetischen Merkmale an turninternen Grenzen im Inneren und am Ende inhaltlicher Blöcke
– Pausen
• innerhalb: 26,6%
• am Ende: 68,8%
– Starke tonale Bewegungen
• innerhalb: 20%
• am Ende: 75%
Ergebnisse II Interpretation
• Das Auftreten von Längung und F0-Reset unterscheidet sich kaum zwischen
prosodischen Grenzen innerhalb und am Ende inhaltlicher Blöcke
– Längung: 80% vs. 73,4%
– F0-Reset: 66,7% vs. 75%
Ergebnisse II Interpretation
• Ergebnis: In den Korpusdaten gibt es einen Zusammenhang zwischen phonetischer und inhaltlicher Kohäsion.
• Prototypische prosodische Grenzen im Inneren inhaltlicher Blöcke haben als
separierende Merkmale finale Längung und F0-Reset. Prototypische Grenzen am Ende inhaltlicher Blöcke weisen zusätzlich noch eine Pause und eine starke tonale Bewegung auf.
Ergebnisse II Interpretation
• Damit gleicht die typische prosodische
Grenze am Ende inhaltlicher Blöcke in ihrer phonetischen Struktur der turnfinalen
prosodischen Grenze.
Ergebnisse III
Perzeptionstests
Ergebnisse III
Perzeptionstests
Ergebnisse III Perzeptionstests
Turnübergabeerwartung
0 1 2 3 4 5 6
-8ht -4ht -0ht +4ht +8ht
Faktor 0 Faktor 1,4 Faktor 1,8 Faktor 2,2
Ergebnisse III Perzeptionstests
Wahrgenommene Sprechflüssigkeit
0 1 2 3 4 5 6
-8ht -4ht -0ht +4ht +8ht
Faktor 0 Faktor 1,4 Faktor 1,8 Faktor 2,2
Ergebnisse III Perzeptionstests
• Deutliche funktionale Bindung der Kontur für die Signalisierung von Turnübergaben
• Kaum funktionale Bindung der Dauerstruktur in diesem Bereich
• Aber: große Sensibilität der VP für Dauerstruktur
• Segmentelle Längungen werden mit
unflüssiger Sprechweise assoziiert. D.h. es gibt eine funktionale Bindung von Längung bei der Signalisierung von Sprechflussstörungen
Zusammenfassung
• Große Variabilität
• Starke Überschneidungen in der
phonetischen Form der funktionalen Klassen
• Keine 1:1-Beziehungen von Form und Funktion
• Aber: funktionale Bindung der melodischen Muster sowohl in Bezug auf inhaltliche
Gliederung, als auch hinsichtlich der damit eng verbundenen Dialogsteuerung.
Zusammenfassung
• Es können prototypische phonetische Realisierungen für die verschiedenen Funktionen herausgearbeitet werden
• Das phonetische System funktioniert immer in Ergänzug durch syntaktische und
inhaltliche Informationen
• Erweitertetes Konzept der Merkmalsbündelung
Klassifikationssysteme
• Erstellung eines funktional orientierten Klassifiktionssystems auf der Basis von
prototypischen phonetischen Strukturen für die Bereiche
• turninterne prosodische Grenzen
• turnfinale prosodische Grenzen
• prosodische Grenzen in unflüssiger Sprache
Dem phonetischen Signalisierungssystem liegt kein striktes 1:1-Verhältnis zwischen Form und Funktion zugrunde.
Die Ergebnisse deuten eher auf eine
unterstützende Funktion der phonetischen
Komponente hin, die erst in Kombination mit syntaktischen und semantischen Strukturen zu eindeutigen interaktionalen
Funktionalisierungen führt.
Turninterne prosodische Grenzen
Ausblick
Turnfinale prosodische Grenzen