• Keine Ergebnisse gefunden

Was sind einige der effektivsten Formen der Stimmverstellung?

N/A
N/A
Protected

Academic year: 2021

Aktie "Was sind einige der effektivsten Formen der Stimmverstellung?"

Copied!
32
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Was sind einige der effektivsten Formen der

Stimmverstellung?

LMU München – WiSe 2007/ 08

Hauptseminar: Forensische Phonetik

Dozent: Prof. Dr. Jonathan Harrington

Referentin: Aysen Demir

Datum: 08.01.2008

(2)

1. Effekte von Stimmverstellung auf

spektrografische Sprecheridentifizierung

Sprecher und Spektrogramme

40 erwachsene, männliche Sprecher (Durchschnittsalter: 27,3Jahre)

2 Sitzungen für Aufnahmen: - Reihe von 4 Sätzen für 1.Sitzung - andere Reihe von 3Sätzen für

2.Sitzung

9 Schlüsselwörter in diesen Sätzen: it, is, on, you, and, the, I, to, me

6 verschiedene Arten der Stimmverstellung:

1.normal, 2.alt, 3.heiser, 4.hypernasal, 5.extrem langsam, 6.freie Wahl

Sprachaufnahmen in schalldichtem Raum

Breitband – Spektrogramme (Frequenzbereich 80-8000Hz)

(3)

1. Effekte von Stimmverstellung auf

spektrografische Sprecheridentifizierung

(4)

1. Effekte von Stimmverstellung auf

spektrografische Sprecheridentifizierung

Aufbau des Experiments

4 unabhängig arbeitende spektrografische Untersucher

(2 Sprachwissenschaftler + 2 Sprachpathologen) erhielten ca. 4 Wochen Training (10-15h/Woche)

Identifikations- Diskriminationsaufgaben

30 Sprecher willkürlich in Sprechergruppe 1 + 2 aufgeteilt

Ausstattung der Untersucher mit 15bekannten („Referenz-“) Spektrogrammen (unverstellte Schlüsselwörter aus 2.Sitzung)

Repräsentation v.15unbekannten („matching“) Spektrogrammen (verstellte/ unverstellte Schlüsselwörter aus 1.Sitzung)

7 verschiedene Arten v. „matching tasks“:

1.unverstellt-unverstellt, 2.alt-unverstellt, 3.heiser-unverstellt,

4.hypernasal-unverstellt, 5.extrem langsam-unverstellt, 6.freie Wahl-

unverstellt, 7.willkürlich gewählte Verstellung-unverstellt

(5)

1. Effekte von Stimmverstellung auf

spektrografische Sprecheridentifizierung

Aufbau des Experiments

Nur 11 v.15 unbekannten Spektrogrammen passten zu gegebenen 15 bekannten Spektrogrammen (4 „non-matches“ in jeder Aufgabe des Experiments)

Einschätzung und Bewertung folgender Faktoren:

Entscheidungssicherheit auf 5 Pkt.- Skala (1: „sehr unsicher“, 5: „sehr sicher)

Schwierigkeitsgrad der 7 Aufgabenarten auf 7Pkt.- Skala (1: „nicht sehr schwer“, 7: „sehr schwer“)

Nützlichkeit der 9 Stimulus- Wörter für Identifikation der Sprecher auf 7Pkt.- Skala

(1: „nicht sehr nützlich“, 7: „sehr nützlich“)

(6)

1. Effekte von Stimmverstellung auf

spektrografische Sprecheridentifizierung

Ergebnisse

Aufgaben- und Untersucherunterschiede

Tabelle 1: Durchschnitt korrekter Identifikationen v. jeder Stimmverstellung

Zeigt, dass unverstellte Stimme signifikant höhere, korrekte Prozentzahlen hat als die anderen Verstellungen

Nasale und langsame Sprechweise die am wenigsten effektiven Verstellungen, während freie Wahl am effektivsten

Tabelle 1

(7)

1. Effekte von Stimmverstellung auf

spektrografische Sprecheridentifizierung

Ergebnisse

 Aufgaben- und Untersucherunterschiede

Tabelle 2: Durchschnitt korrekter Identifikationen v. jedem Untersucher

AI signifikant besser als die übrigen Untersucher

Anderen drei Untersucher unterscheiden sich nicht bedeutsam voneinander

Tabelle 2

(8)

1. Effekte von Stimmverstellung auf

spektrografische Sprecheridentifizierung

Ergebnisse

Aufgaben- und Untersucherunterschiede

Tabelle 3: Durchschnitt korrekter Identifikationen v. jeder Stimmverstellung mit Entscheidungssicherheit v. 3, 4 und 5

Ausschluss v. Entscheidungen mit geringer Sicherheitseinschätzung veränderte Wert der gesamten Entscheidungen nicht merklich

Selbe Muster v. Unterschieden wie bei gesamten Entscheidungen der Untersucher

Unverstellte Stimme hat signifikant höheren Durchschnitt v. korrekten Identifikationen

Nasal und langsame Sprechweise am uneffektivsten, während freie Wahl am effektivsten

Tabelle 3

(9)

1. Effekte von Stimmverstellung auf

spektrografische Sprecheridentifizierung

Ergebnisse

Sprecherunterschiede

6 Stimmverstellungen, die verstellte Sprache beinhalteten wurden

zusammengelegt, um Durchschnittswert v. korrekten Identifikationen für alle 30Sprecher zu erhalten

Ermittlung, ob Sprecherunterschiede hauptsächlich mit Einfachheit der Stimmverstellung oder mit gesamter Sprechererkennbarkeit

zusammenhängen: Vergleich des Sprecherdurchschnitts für vereinte verstellte und unverstellte Stimmen

Bestimmte Sprecher schwieriger identifizierbar in verstellten und

unverstellten Sprechweisen

(10)

1. Effekte von Stimmverstellung auf

spektrografische Sprecheridentifizierung

Ergebnisse

Fehlerartverteilung

In Identifikations- Diskriminationsaufgaben für Sprecheridentifizierung 3Arten von Fehlern möglich:

1. Fehler ID: Verstellung existierte, aber Untersucher wählte falsche (falsche Identifizierung)

2. Fehler EL: Verstellung existierte, aber Untersucher erkannte sie nicht ( falsche Eliminierung)

3. Fehler INC: Verstellung existierte nicht, aber Untersucher wählte sie (falsche Einbeziehung)

Untersuchung der Fehlerartverteilung durch Analyse der

Wechselwirkungen zw. Verstellungsart, Fehlerart und Untersucher:

Wechselwirkung v. Verstellung + Fehlerart: Verteilung der Fehlerarten abhängig v. bestimmten Verstellungen

Wechselwirkung v. Fehlerart + Untersucher: Fehlerartverteilung gemäß der Tätigkeit eines bestimmten Untersuchers variierte

-> Untersucher hatten „charakteristische“ Arten Fehler zu machen

(11)

1. Effekte von Stimmverstellung auf

spektrografische Sprecheridentifizierung

Ergebnisse

Wahrgenommene Schwierigkeit der Stimmverstellung

Tabelle4: Durchschnitt der empfundenen Stimmverstellungsschwierigkeit

Untersucher fanden bestimmte Verstellungen schwieriger

Unverstellte Stimme am einfachsten

Nasal wurde unter verstellten Stimmen am leichtesten empfunden

Freie Wahl, willkürlich gewählte Verstellung und heiser am schwierigsten -> diese Ergebnisse bestätigen Ergebnisse aus Tab.1:

je schwieriger Untersucher Verstellungen empfanden, desto niedriger war ihre Leistung in Identifikation dieser Verstellungen

Tabelle 4

(12)

1. Effekte von Stimmverstellung auf

spektrografische Sprecheridentifizierung

Ergebnisse

Empfundene Nützlichkeit der Schlüsselwörter für Sprecheridentifikation

Tabelle5: Durchschnitt der empfundenen Nützlichkeit jedes Stimulus- Wortes

Untersucher empfanden bestimmte Wörter nützlicher als andere für Sprecheridentifikation

Offensichtlich, dass Stimulus- Wörter, die nasale Phoneme enthalten

(z.B. me, on, and), für ziemlich nützlich für Sprecheridentifikation gehalten wurden

Tabelle 5

(13)

1. Effekte von Stimmverstellung auf

spektrografische Sprecheridentifizierung

Diskussion

Verringerung in Sprecheridentifizierung reichte v. 14,17%(langsam) bis 35%(freie Wahl) zeigt, dass spektrografische Sprecheridentifizierung durch Versuche die Stimme zu verstellen beeinflusst wird

Interessant, dass nur Ausführung eines Untersuchers sich bedeutsam v.

dem der anderen unterschied -> Übung der Untersucher relativ gleich;

Untersucher AI besaß vermutlich vor Übungsprogramm ähnliche Sprachanalysefähigkeiten

Fehlen bedeutsamer Wechselwirkung zw. Verstellung und Untersucher

zeigt Einheitlichkeit der Übungsprozeduren für alle Verstellungen und

Untersucher

(14)

1. Effekte von Stimmverstellung auf

spektrografische Sprecheridentifizierung

Diskussion

Bestimmte Stimmverstellungen weniger effektiv als andere

nasal eine der uneffektivsten Verstellungen

Energiespektrum während nasaler Phonation stark sprecherabhängig

Koartikulierte Nasalspektra liefern verlässlichere Hinweise für

Identifizierung als Nasalspektra allein -> mag empfundene Nützlichkeit v.

nasalen Schlüsselwörtern erklären

langsam: relative Unwirksamkeit dieser Verstellung

Relativ unveränderte spektrale Hinweise

Vokal- und Wortdauern merklich erhöht -> direkte Beziehung zw.

Durchführung der Sprecheridentifizierung und der Dauer des

Hinweismaterials hatten möglicherweise vereinfachenden Einfluss

alt und heiser: geringer Durchschnittswert richtiger Identifikationen

Signifikanter Wechsel in relativer Anzahl und Verteilung der „glottal zeros“

und „masking“- Effekte von der hohen Geräuschenergie

(15)

1. Effekte von Stimmverstellung auf

spektrografische Sprecheridentifizierung

Diskussion

Willkürlich gewählte und freie Wahl v. Verstellung:

Merkliche Verschlechterung der Sprecheridentifizierbarkeit durch mehrere verschiedene Verstellungen innerhalb einer Versuchsaufgabe

Große Entscheidungsschwierigkeiten der Untersucher, welche Hinweise zu ignorieren und welche zu berücksichtigen sind

Interessant, dass Schwierigkeit verschiedener Verstellungen ziemlich realistisch empfunden wurden

bestärkende Bedeutung der hohen Wechselwirkung zw. Einschätzung der Verstellungsschwierigkeit und den falschen Identifikationen

Urteil, dass bestimmte Schlüsselwörter nützlicher waren als andere für Sprecheridentifizierung, hat wichtige Bedeutung

falls bestimmte Wörter tatsächlich wirksame Hinweise für

spektrografische Sprecheridentifizierung sind, könnten diese Wörter in

Polizeiinterviews hervorgelockt werden

(16)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Sprecher und Stimulus Materialien

40 erwachsene, männliche Sprecher (Durchschnittsalter: 27,3Jahre)

2 Sitzungen für Aufnahmen: - Reihe von 4 Sätzen für 1.Sitzung

- andere Reihe v. 3 Sätzen für 2.Sitzung

9 Schlüsselwörter in diesen Sätzen: it, is, on, you, and, the, I, to, me

6 verschiedene Arten der Stimmverstellung:

1.normal, 2.alt, 3.heiser, 4.hypernasal, 5.extrem langsam, 6. frei Wahl

Aufnahmen in schalldichtem Raum

Aufgenommene Sätze auf folgende Art angeordnet, um 480 Paardiskriminationsversuche herzustellen:

1.Glied des Stimulus- Paares unverstellter Satz aus 2.Sitzung

2.Glied verstellter/ unverstellter Satz aus 1.Sitzung

(17)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Sprecher und Stimulus Materialien

Jeder Sprecher durch 12unverstellte Sätze aus 2.Situng repräsentiert, die 2 mal mit jeden 6Sprechweisen aus 1.Sitzung paarweise angeordnet wurden

Hälfte der Stimuluspaare v. selben Sprechern („matches“) und andere Hälfte v. 2 verschiedenen Sprechern produziert („nonmatches“)

Alle Sprechweisen gleichermaßen in match- und nonmatch- Versuchen repräsentiert

Insg. 480 Satzpaare (40Sprecher* 6Sprechweisen* 1match* 1nonmatch)

120 Stimuluspaare v.10 willkürlich gewählten Sprechern für Übung verwendet

Restl. 360 Satzpaare dann willkürlich 3 Tonbändern für eigentliches

Experiment zugewiesen

(18)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Übungsprozeduren

2 Hörergruppen wurden trainiert für Sprecherdiskriminationsaufgaben:

Naive Gruppe v. Studenten

Anspruchsvolle Gruppe v. 3 Doktoranten und Professoren der Sprech- und Hörwissenschaften

Übung beinhaltete 120 Paardiskriminationsversuche

2 Sätze pro Stimuluspaar 1,5s voneinander getrennt und gefolgt v. 7s Antwortintervall

Hörer mussten entscheiden, ob 2 Sätze ähnlich genug waren, um v. selben Sprecher produziert worden zu sein oder Gegenteil

Gleich-/ Unterschiedlich – Urteile jedes Versuchs auf Antwortbögen festgehalten

Hörer mussten Entscheidungszuversicht auf 5Pkt.- Skala einschätzen

(1: „sehr unsicher“ , 5: „sehr sicher“)

(19)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Experimentsablauf

Bestand aus 360 Paardiskriminationsaufgaben

Experimentelle Hören in 3 aufeinanderfolgenden, tägl. 45min.- Sitzungen mit 120 Satzpaaren pro Sitzung durchgeführt

Stimuluspaare über Kopfhörer (Telephonics TDH-39 in an MX-41/AR cushion) präsentiert

Jeder Hörer arbeitete unabhängig und schätzte seine Sicherheit ein

2 Tage darauf musste anspruchsvolle Gruppe Stimuluspaare 1-40 auf 2.experimentellem Tonband wiederholen, um zu einigen

Messungsverlässlichkeiten v. „Test- Retest“ zu gelangen

(20)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Ergebnisse

„Test- Retest“- Reliabilität

Tabelle 6: „Test- Retest“- Übereinstimmungen für anspruchsvolle Gruppe, die 40 Stimuluspaare wiederholt beantwortet haben

Durchschnittswert der Übereinstimmung für die 6 Hörer: 82,5%

Tabelle 6

(21)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Ergebnisse

Verteilungseffekte

Tabelle 7: Durchschnittswerte korrekter Entscheidungen für jede Sprechweise und Hörergruppe

Unverstellte Sprechweise signifikant höhere Werte als andere Sprechweisen

Für naive Hörer nasal und frei Verstellung effektivsten Verstellungen

Für anspruchsvolle Hörergruppe nur nasal bedeutsam effektiver als bestimmte andere Verstellungen

Tabelle 7

(22)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Ergebnisse

Verteilungseffekte

Tabelle 8: Durchschnittswerte korrekter Entscheidungen für jede Sprechweise und Hörergruppe mit Sicherheitsrate v. 3, 4 und 5

Naive Hörer: unverstellte Sprechweise höhere Werte als alle anderen und nasal und freie Verstellung effektivste Verstellung

Anspruchsvolle Hörer: unverstellte Sprechweise bedeutsam höhere Werte als nasal, langsam und freie Verstellung

Tabelle 8

(23)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Ergebnisse

Verteilungseffekte

Ausschluss der Entscheidungen mit geringer

Sicherheitseinschätzungsrate würde nicht zu bedeutsam höheren

korrekten Werten führen

(24)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Ergebnisse

Fehlerartverteilung

Bei Diskriminationsversuchen 2 Fehlerarten möglich:

1. falsche Identifizierung: Hörer entscheidet, dass beide „samples“ zum selben Sprecher gehören, obwohl sie v. 2 verschiedenen sind

2. falsche Eliminierung: Hörer entscheidet, dass „samples“ zu 2

verschiedenen Sprechern gehören, obwohl sie vom selben Sprecher

produziert wurden

(25)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Ergebnisse

Fehlerartverteilung

Tabelle 9: Prozentzahlen falscher Identifikationen und falscher

Eliminierungen für jede Sprechweise, Übungs- und Experimentaufgaben beider Hörergruppen

Unverstellte Sprechweise hat höhere Prozentzahl an falschen Identifikationen als verstellten Sprechweisen

-> Hörer antworteten bei verstellten Sprechweisen vorsichtiger, d.h. sie wollten Sprecher nicht falsch identifizieren, wenn einer der Sätze verstellt war

-> wurde dadurch bestärkt, dass verstellte Sprechweisen im Experiment

geringere falsche Identifikationen aufwiesen als in den Übungen

(26)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Ergebnisse

Fehlerartverteilung

Tabelle 9

Tabelle 9

(27)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Ergebnisse

Fehlerartverteilung

Tabelle 10: Prozentzahlen falscher Identifikationen und falscher

Eliminierungen für jede Sprechweise, Übungs- und Experimentaufgaben beider Hörergruppen mit Sicherheitseinschätzungen v. 3, 4 und 5

Zeigt, dass Befunde aus Tabelle 9 zu selbem Grad bestehen bleiben, wenn falsche Entscheidungen mit geringer Sicherheitseinschätzung ausgeschlossen werden

Langsame Sprechweise für beide Gruppen und nasale Verstellung für anspruchsvolle Gruppe zeigen größere Prozentzahlen v. falschen Identifikationen als falsche Eliminierungen

Anspruchsvolle Gruppe zeigte große Zunahme v. falschen Identifikationen

v. unverstellter Sprechweise nach der Übung im eigentlichen Experiment

(28)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Ergebnisse

Fehlerartverteilung

Tabelle 10

Tabelle 10

(29)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Ergebnisse

Sicherheitseinschätzungen

Unverstellte Sprechweise bedeutsam höhere Sicherheitseinschätzung (ca.4,5) als alle anderen Sprechweisen außer langsame Sprechweise

Verstellte Sprechweise (3,3- 3,8) unterschied sich nicht merklich

Durchschnitte der Sicherheitseinschätzungen und der korrekten Werte der anspruchsvollen Gruppe wurden verglichen

-> es existierte schwache – mäßige Tendenz dafür, dass die

Sprechweisen, die höheren Durchschnitt an Sicherheitseinschätzungen

hatten, auch höhere korrekte Werte zeigten

(30)

2.Effekte von Stimmverstellungen auf die Sprecheridentifizierung durch Hören

Diskussion

Verringerung in Sprecheridentifizierung reichte v. 22,0%(langsam) bis 32,9%(nasal) für die naive Gruppe und für die anspruchsvolle Gruppe von 11,3%(heiser) bis 20,3%(nasal)

Während alle Paardiskriminationsaufgaben mit verstellter Sprechweise die Sprecheridentifikation beeinträchtigten, waren bestimmte

Verstellungen effektiver als andere

Nasale Verstellung am effektivsten in dieser Höruntersuchung, wohingegen sie in vorherigen spektrografischen Untersuchung am uneffektivsten war

Freie Verstellung in beiden Untersuchungen (Spektrogramme+ Hören)

lieferte Ergebnis einer sehr effektiven Verstellung

(31)

Quellen

 Reich, A., Moll, K., Curtis, J. (1976). Effects of selected vocal

disguises upon spectrographic speaker identification, Journal of the Acoustical Society of America, 60, 919-925.

 Reich, A. R. and Duke, J. (1979). Effects of selected vocal disguises

upon speaker identification by listening. Journal of the Acoustical

Society of America, 66, 1023-1028.

(32)

Danke für die Aufmerksamkeit

Referenzen

ÄHNLICHE DOKUMENTE

Man müsste jetzt noch beweisen, dass für drei (unabhängige) Richtungen im Raum beliebige Verzerrungsmaßstäbe vorgegeben werden können (sogenannter Satz von P OHLKE , vgl. H OHENBERG

Individuelle Aspekte spielen für das Funktionieren des Teams schließlich nicht nur bei den Teammitgliedern eine Rolle, sondern auch bei der Teamleitung: Die vier Teampha- sen

Anwendungsgebiete: Bei akuten, unkomplizierten Entzündungen der Nasennebenhöhlen (akute, unkomplizierte Rhinosinusitis). Gegenanzeigen: Nicht einnehmen bei Magen- und

Und weil eine gemalte Rose eben nicht süß duftet, sondern nach Leinöl und Terpentin riecht, weil die Kunst es also ohnehin nicht mit der Natur aufnehmen kann, versucht Schumacher

Bekannt ist, dass hyp- oxische Tumorareale resisten- ter gegenüber einer Therapie sind und auch eine höhere ge- netische Instabilität aufweisen.. Diese Faktoren können zu einer

h. eine private Vereinigung frei von jedweder politischen Einflußnahme durch offizielle Stellen wie Regie- rungen usw.), die sich zum Ziel gesetzt hat, Entwicklungshilfe auf

Diese Fettverbrennung über einen langen Zeitraum zu trainieren, dafür ist der lange Lauf so wichtig. Deshalb fehlt er in keinem Programm

Die Ozean-Reanalysen erlauben eine Bestimmung der Zunahme des Energiegehalts im Ozean (Oceanic Heat Con- tent, OHC) – eine zentrale Größe in der Klimaforschung, denn durch