Praxisbeispiel
Tina John
Sprachdatenbanken
Was sind Sprachdatenbanken?
Sammlung von Sprechdaten Hierzu können gehören:
Zeitsignale (digital): akustische, artikulatorische Aus dem Zeitsignal abgeleitete Signale z.Bsp.
spektrale Daten
Etikettierungen der Signale: Verknüpfung von Signalteilen an Symbole
Aufbau & Funktion von Sprachdatenbanken
Erstellung Abfrage Analyse
Digitale Zeitsignale akustisch,
artikulatorisch
Etikettieren
Verknüpfung mit Symbolen
Signalverarbeitung
abgeleitete Signale
(z.B. spektrale Daten) Eine Liste ausgewählter Symbole mit Zeiten
Abfrage
Die Signale davon
Abfrage
SignaleEtikettierung
Graphik
Statistik
Weitere
Signalverarbeitung p << 0.001
1. Sprachdatenbank Erstellung
EMU: Hierarchisches Etikettieren
1. Sprachdatenbank Erstellung
Signalverarbeitung: EMU-tkassp
z.B. alle wav-Dateien einer Sprachdatenbank
2. Sprachdatenbank Abfrage
EMU z.B. Alle Vokale in
Wortinitialen Silben und deren ersten 2 Formanten zum
zeitlichen Mittelpunkt finden
xx x
x x
x
3. Sprachdatenbank Analyse
R Programmiersprache + EMU Funktionen in R
z.B. F1 x F2 Verteilung von [I a U] in einer Sprachendatenbank
I I
I
I I I
I I I
I I I
I
I I
I
I
I I
I I
I I I
I I
I I
I I
I I
II I
I I I I
I I
I I
I I
I I
I
I I
I
I I
II I
I I I I
I I
I I
I I
I I
I I I I I
I
I
I I
I
I I
I I
I I
I
I I I
I
I
I
I I
I I
II I
I I
I I
I I
I I
I I
I
I I
I
I II
I I
I I I I I I
I I
I I
I
I I
I I I I
I I
I
I I
I
I I
I I
I
I I I
I I
I I
I I
I I
I I I
I I
I
II I
I
I I
I
I I
I I
I I I
I I
I
I I
I
I
I I
I I
I I I
I
I I
I I I
I I
I I I I
I
I I I I
I I I
I I I
I
I I
I I
I
I I I
I I
I I I
I
I I I
I I
I I I I
I I
I I I I I I I
I I
I I I
I
I
I II I
I I I
I
I I
I I I
I II
I
I I I I
I I I
I I
I
I I I
I I I
I I
I
I I I
I
I I
I I
I I
I I
I
I I
I I I I I
I II
I I
I
I I I I
I I
I
I
I I
I I
I I
I
I
I
I I
I
I
I
I I
I I I
I I
I
I I I
I I
I
A A
A A
A A A
A A A
A A
A A
A
A
A A A
A A
A A A
A
A AA
A
A A A A
A A
A A
A A
A A A
A A A A
A A
A A
A
A A A A
A A
A A
A A A
A A
A AA A A
A A
A AA A
A
A A
A
A A
A A
A A
A A A
A
A A
A A A A A
AA A
A A
A A
A
A A
A A A
A A
A
A A A A
A A A AA A
AA
A AA A
A
A A
A A
U U U
UU U U U UUUU
U
U U U
U U
U U U U
U UU
U
2500 2000 1500 1000
700600500400300200
F2 (Hz)
F1 (Hz)
Erstellung Abfrage Analyse
Digitale Zeitsignale akustisch,
artikulatorisch
Etikettieren
Verknüpfung mit Symbolen
Signalverarbeitung
abgeleitete Signale
(z.B. spektrale Daten) Eine Liste ausgewählter Symbole mit Zeiten
Abfrage
Die Signale davon
Abfrage
SignaleEtikettierung
Graphik
Statistik
Weitere
Signalverarbeitung p << 0.001
Aufbau & Funktion von Sprachdatenbanken
Praxisbeispiel (Segmentlistenpaper Aufgabe 8.)
Erzeugen Sie in R eine Segmentliste der Frikative /f v s z/. Verwenden Sie logische
Vektoren um (a) die durchschnittliche Dauer der stimmlosen Frikativen /f s/ (zusammen) und (b) die durchschnittliche Dauer der stimmhaften Frikativen /v z/ (zusammen) zu
berechnen.
Phonetische Fragestellung:
Gibt es einen Dauerunterschied zwischen
stimmhaften und stimmlosen vorderen Frikativen?
Zu verwendende Sprachdatenbank:
andoslq03: enthält stimmhafte und stimmlose vordere Frikative /f v s z/
Relevante Äußerungen der Datenbank:
alle
Gibt es einen Dauer - unterschied
zwischen stimmhaften und stimmlosen vorderen Frikativen?
andoslq03;
alle Äußerungen
die Frikative aus der Datenbank:
fvsz = emu.query(„andolsq03“,“*“,“Phoneme = f | v | s | z“) Trennung der stimmhaften von den stimmlosen Frikativen:
Wir brauchen:
fvsz.labs = label(fvsz)
fs = fvsz[fvsz.labs %in% c(“f”,”s”), ] vz = fvsz[fvsz.labs %in% c(“v”,”z”), ] Durchschnittlichen Dauern
fs.meandauer = mean(mudur(fs)) vz.meandauer = mean(mudur(vz))
fs.meandauer und vz.meandauer vergleichen