Aufbau & Funktion von Sprachdatenbanken

(1)

Praxisbeispiel

Tina John

(2)

Sprachdatenbanken

Was sind Sprachdatenbanken?

Sammlung von Sprechdaten Hierzu können gehören:

Zeitsignale (digital): akustische, artikulatorische Aus dem Zeitsignal abgeleitete Signale z.Bsp.

spektrale Daten

Etikettierungen der Signale: Verknüpfung von Signalteilen an Symbole

(3)

Aufbau & Funktion von Sprachdatenbanken

Erstellung Abfrage Analyse

Digitale Zeitsignale akustisch,

artikulatorisch

Etikettieren

Verknüpfung mit Symbolen

Signalverarbeitung

abgeleitete Signale

(z.B. spektrale Daten) Eine Liste ausgewählter Symbole mit Zeiten

Abfrage

Die Signale davon

Abfrage

SignaleEtikettierung

Graphik

Statistik

Weitere

Signalverarbeitung p << 0.001

(4)

1. Sprachdatenbank Erstellung

EMU: Hierarchisches Etikettieren

(5)

1. Sprachdatenbank Erstellung

Signalverarbeitung: EMU-tkassp

z.B. alle wav-Dateien einer Sprachdatenbank

(6)

2. Sprachdatenbank Abfrage

EMU z.B. Alle Vokale in

Wortinitialen Silben und deren ersten 2 Formanten zum

zeitlichen Mittelpunkt finden

xx x

x x

x

(7)

3. Sprachdatenbank Analyse

R Programmiersprache + EMU Funktionen in R

z.B. F1 x F2 Verteilung von [I a U] in einer Sprachendatenbank

I I

I

I I I

I

I I

I

I I

I I I

I I

II I

I I I I

I I

I

I I

I

I I

II I

I I I I

I I

I I I I I

I

I I

I

I I

I

I I I

I

I I

II I

I I

I

I I

I

I II

I I

I I I I I I

I I

I

I I

I I I I

I I

I

I I

I

I I

I

I I I

I I

I I I

I I

I

II I

I

I I

I

I I

I I I

I I

I

I I

I

I I

I I I

I

I I

I I I

I I

I I I I

I

I I I I

I I I

I

I I

I

I I I

I I

I I I

I

I I I

I I

I I I I

I I

I I I I I I I

I I

I I I

I

I II I

I I I

I

I I

I I I

I II

I

I I I I

I I I

I I

I

I I I

I I

I

I I I

I

I I

I

I I

I I I I I

I II

I I

I

I I I I

I I

I

I I

I

I I

I

I I

I I I

I I

I

I I I

I I

I

A A

A A A

A A

A

A A A

A A

A A A

A

A AA

A

A A A A

A A

A A A

A A A A

A A

A

A A A A

A A

A A A

A A

A AA A A

A A

A AA A

A

A A

A

A A

A A A

A

A A

A A A A A

AA A

A A

A

A A

A A A

A A

A

A A A A

A A A AA A

AA

A AA A

A

A A

U U U

UU U U U UUUU

U

U U U

U U

U U U U

U UU

U

2500 2000 1500 1000

700600500400300200

F2 (Hz)

F1 (Hz)

(8)

Erstellung Abfrage Analyse

Digitale Zeitsignale akustisch,

artikulatorisch

Etikettieren

Verknüpfung mit Symbolen

Signalverarbeitung

abgeleitete Signale

(z.B. spektrale Daten) Eine Liste ausgewählter Symbole mit Zeiten

Abfrage

Die Signale davon

Abfrage

SignaleEtikettierung

Graphik

Statistik

Weitere

Signalverarbeitung p << 0.001

Aufbau & Funktion von Sprachdatenbanken

(9)

Praxisbeispiel (Segmentlistenpaper Aufgabe 8.)

Erzeugen Sie in R eine Segmentliste der Frikative /f v s z/. Verwenden Sie logische

Vektoren um (a) die durchschnittliche Dauer der stimmlosen Frikativen /f s/ (zusammen) und (b) die durchschnittliche Dauer der stimmhaften Frikativen /v z/ (zusammen) zu

berechnen.

Phonetische Fragestellung:

Gibt es einen Dauerunterschied zwischen

stimmhaften und stimmlosen vorderen Frikativen?

Zu verwendende Sprachdatenbank:

andoslq03: enthält stimmhafte und stimmlose vordere Frikative /f v s z/

Relevante Äußerungen der Datenbank:

alle

(10)

Gibt es einen Dauer - unterschied

zwischen stimmhaften und stimmlosen vorderen Frikativen?

andoslq03;

alle Äußerungen

die Frikative aus der Datenbank:

fvsz = emu.query(„andolsq03“,“*“,“Phoneme = f | v | s | z“) Trennung der stimmhaften von den stimmlosen Frikativen:

Wir brauchen:

fvsz.labs = label(fvsz)

fs = fvsz[fvsz.labs %in% c(“f”,”s”), ] vz = fvsz[fvsz.labs %in% c(“v”,”z”), ] Durchschnittlichen Dauern

fs.meandauer = mean(mudur(fs)) vz.meandauer = mean(mudur(vz))

fs.meandauer und vz.meandauer vergleichen