• Keine Ergebnisse gefunden

Emotionen in Sprache

N/A
N/A
Protected

Academic year: 2021

Aktie "Emotionen in Sprache"

Copied!
21
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Hauptseminar: Phonetic and technological aspects of speaker characteristics Wintersemester 2007/08

Dozent: Prof. Dr. Harrington Referentin: Sarah Stolze

Emotionen in Sprache

(2)

Inhalt:

1) Grundfrequenz als Parameter für Sprechererkennung

1.1) Beeinflussung der Grundfrequenz durch technische Faktoren 1.2) Beeinflussung der Grundfrequenz durch physiologische Faktoren 1.3) Beeinflussung der Grundfrequenz durch psychologische Faktoren 2) Stress

2.1) Realer vs. Simulierter Stress

„Hindenburg Disaster“

2.2) F0 real vs. Reproduziert

2.3) Level des empfundenen Stresses

3) Zusammenfassung

(3)

1) Grundfrequenz als Parameter für Sprechererkennung

- Abhängig von der Anatomie des Kehlkopfes

 Geringe Veränderung innerhalb eines Sprechers

- robust bei Telefonübertragung

(4)

1.1 Beeinflussung der

Grundfrequenz durch technische Faktoren

 Schnelligkeit beim Abspielen von Sprachmaterial

 Sampling Rate

 Verhältnis modal zu falsetto (m) 2:1

 Sprecher ausschließen, jedoch sehr ungenau

(5)

1.2 Beeinflussung der Grundfrequenz durch

physiologische Faktoren

Alter

Veränderungen geschehen langsam, älteres Material kann verwendet werden

Rauchen

Kann die Einschätzung des Alters erschweren

Alkohol

 F0 steigt

(6)

1.3 Beeinflussung der Grundfrequenz durch

psychologische Faktoren

Emotionen Neutral

- Langsame Veränderung von F0

- Kontinuierliche Verlaufsform

- Gut definierte Struktur der Vokale

- Konsonanten unpräzise artikuliert

- Kurze Pausen

(7)

F0 Verlauf verschiedener Emotionen

Figur (1): Fundamental frequency (F0) contours of selected control clustersas spoken by voice B in different situations in the scenario. Numbers refer to the control clusters.

(8)

1.3 Beeinflussung der Grundfrequenz durch

psychologische Faktoren

Ärger

- höhere F0 als bei neutraler Äußerung

- 1 bis 2 Silben zeigen eine Spitze, sonst kontinuierlicher, glatter Verlauf

- Höhere F0 Reichweite als bei neutral

- Hoher F1, da Mund weit geöffnet

- Klarer Verschluss bei Konsonanten

(9)

1.3 Beeinflussung der Grundfrequenz durch

psychologische Faktoren

Sorge

- Flacher Verlauf der Kontur

- F0 tiefer als bei neutral

- Weniger Betonung als bei neutral

- Unregelmäßigkeiten in der Stimmgebung (flüstern)

- Lange Dauer der Äußerung lange Vokale,

Konsonantenverschlüsse und Pausen

(10)

1.3 Beeinflussung der Grundfrequenz durch

psychologische Faktoren

Angst

- Schnelle Veränderung der Kontur

- F0 niedriger als bei Ärger

- Kann dem neutralen Muster ähneln, jedoch mit hohen Spitzen

- unregelmäßige Stimme

- Längere Dauer als bei Ärger und neutral

- Präzise Artikuliert

(11)

2) Stress

 Was bedeutet Stress  Emotionen (Angst, Ärger, Sorge)

2.1) Realer vs. Simulierter Stress

2.2) Level des empfundenen Stresses

(12)

2.1) Realer vs. Simulierter Stress

„Hindenburg Disaster“

Real Vorher:

Glatter F0-Verlauf

Kontinuierlicher Ab- und Aufwärtsverlauf von F0

Nachher:

Konturverlauf verändert sich abrupt

Durchschnittlicher F0-Wert ist höher

größere F0 Spanne

„zittern“ bei 0,6s und 0,8s

 Kontrollverlust der

Muskulatur+ unregelmäßiges

Atmen

(13)

Originalaufnahme des Radiosprechers

Aus: Williams, Stevens (1972)

Fig.2: Radio announcer speaking before (top) and after (middle and bottom) the crash of the HINDENBURG. Narrow- band.

(14)

2.1) Realer vs. Simulierter Stress

„Hindenburg Disaster“

Simuliert vorher

• Weniger „Bewegung“ als in der Originalaufnahme

• Der Verlauf ist ähnlich glatt

nachher

 F0 steigt

 Ab- und

Aufwärtsbewegungen sind stärker ausgeprägt

 „zittern“ und die

ungleichmäßige Kontur

ist ähnlich dem Original

(15)

Simulierte Aufnahme

Aus: Williams, Stevens (1972)

Fig. 3: Voice C simulating announcement of

Hindenburg crash before (top) and after (middle and bottom) the disaster. Narrow-band.

F0 (Hz) F0 Range (Hz) Original

Vorher 166 124-196

Nachher 196 152-260

Simuliert

Vorher 138 117-168

Nachher 222 117-280

(16)

2.2) F0 real vs. reproduziert

Criminal`s mean F0 (in Hz)

Suspect`s mean F0 Incriminating Text Reproduction of Incr.

Text Spontaneous Speech

1 164 - 147

2 155 133 -

3 115 115 -

4 172 140 143

5 175 176 158

6 206 142 115

7 178 - 200

8 178 140 -

9 152 - 164

10 107 101 -

(17)

2.3) Level des empfundenen Stresses

 F0 steigt

 Die Sprache wird weniger fließend

 Vokalintensität steigt

 Der Sprachfluss nimmt zu

 Die Zahl der Bursts nimmt ab

(18)

Stimmveränderung in Abhängigkeit von Stress

Aus: Hollien (1990)

Fig. 4: Model of the most common shifts in the voice and speech of a person who is responding to psychological stress. SFF is speaking

fundamental frequency, NF is nonfluencies, VI is vocal intensity, and SB refers to the number of speech bursts per unit of time.

(19)

3) „Zusammenfassung“

 Keine Möglichkeit den genauen emotionalen Zustand einer Person zu ermitteln, eher

Richtwerte, Tendenzen.

 Referenzmaterial sollte dem zu

untersuchenden Material so ähnlich wie

möglich sein.

(20)

Literatur

Williams, Carl E., Stevens, Kenneth N.(1972 `Emotions and Speech: Some Acoustical Correlates`, Biometric Technology Today, 52 (4), 1238-1250)

Jessen, M. (1997) `Phonetic manifestations of cognitive and physical stress in trained and untrained police officers`, Forensic Linguistics, The International Journal of Speech Language and the Law, 4 (1), 125-147

Hollien, H. F. (1990) `The Acoustics of Crime: the new science of forensic phonetics`, Plenum Press, New York, chapter 12 and 13, p. 255-289

Braun, A. (1995) `Fundamental Frequency – How Speaker-Specific is it?`, Studies in Forensic Phonetics, 64,9-23

Gfroerer, S., Wagner, I. (1995) `Fundamental Frequency in Forensic Speech Samples`, Studies in Forensic Phonetics, 64, 41-48

Homayounpour, M. M., Goldman, J. Ph. (1995) `Machine vs. Human Speaker

Verification` Studies in Forensic Phonetics, 64, 109-120

(21)

Danke für die Aufmerksamkeit

Abbildung

Fig. 3: Voice C simulating announcement of
Fig. 4: Model of the most  common shifts in the voice  and speech of a person who  is responding to psychological  stress

Referenzen

ÄHNLICHE DOKUMENTE

 eine  fallende  Kontur  (phonologisch)  wird  auf   unterschiedliche  phone>sche  Weisen  realisiert...  Cambridge  University

Kontrast zwischen mittleren und späten Gipfel in englisch Kontrast zwischen mittleren und späten Gipfel in englisch Mittel: L+H*. This company has never employed anyone

Der  kategoriale  Unterschied  kann  durch  ein  ImitaRonsexperiment   empirisch  nachgewiesen  werden 1.. Synchronisierunterschiede  zwischen  Dialekten  und

In Kontexten ohne tonale Abstoßung und ohne folgende Wortgrenzen wird auch H laut einiger Studien stabil mit dem Konsonant nach der primär betonten Silbe des akzentuierten

Der  kategoriale  Unterschied  kann  durch  ein  ImitaRonsexperiment   empirisch  nachgewiesen

Perzep=ve Normalisierung für anatomische Einflüsse auf f0 Hörer perzipieren lexikalische Töne nicht auf eine absolute Weise sondern im Verhältnis zum Sprecher-f0-Mi6elwert..

Dies deutet darauf hin, dass es zwei phonologische Kategorien gibt: misel vs spät (eventuell L+H* vs L*+H). SemanRk und Synchronisierung:

Ein Keil aus Stahl (Skizze), der an seiner linken Seite fest eingespannt ist, soll mit einer bestimmten Frequenz schwin- gen, wenn die Grundmode angeregt wird. Finden Sie mit dem