• Keine Ergebnisse gefunden

Abfragen aus einer Sprachdatenbank

N/A
N/A
Protected

Academic year: 2021

Aktie "Abfragen aus einer Sprachdatenbank"

Copied!
28
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Abfragen aus einer Sprachdatenbank

Jonathan Harrington

(2)

Aufbau & Funktion von Sprachdatenbanken

Erstellung Abfrage Analyse

Digitale Zeitsignale akustisch,

artikulatorisch

Etikettieren

Verknüpfung mit Symbolen

Signalverarbeitung

abgeleitete Signale (z.B. spektrale Daten)

Eine

Segmentliste

Abfrage

Die Signale davon

Abfrage

S ig n al e E ti ke tt ie ru n g

Praat, EMU EMU R

(3)

Der Kern einer Abfrage

Welche Ebene? Welche Einheiten?

Phonetik u:

(Alle ‘u:’ Einheiten der Phonetik Ebene)

Wort Duden

(Alle ‘Duden’ Einheiten der Wort Ebene)

=

=

(4)

Welche Ebene? Welche Einheiten?

Phonetic u:

Findet

Nicht nur in dieser Äußerung sondern in der gesamten Sprachdatenbank...

=

(5)

Das Ergebnis einer Abfrage ist eine Segmentliste

Etikettierung Startzeit Endzeit Äußerung

(6)

Beziehung:

Segmentliste

und Signale

(7)

Wie wird eine Abfrage durchgeführt?

Database operations -> Query database

(8)

* wav bedeutet: alle Äußerungen mit dieser Extension abfragen

*01* lab wäre: alle

Äußerungen mit Extension .lab abfragen, die 01 in der

Dateiname enthalten

Alle "i:" Einheiten der Phonetic-Ebene

(9)

Das Ergebnis ist eine Segmentliste

Als Text-Datei speichern: File -> Save, dann n.txt,

in eigene Dateien (n ist ein beliebiger Name).

(10)

Die Text-Datei

(11)

starten

R.lnk

> library(emu)

> read.emusegs("H:/n.txt")

angenommen, die Text-Datei ist n.txt und befindet sich in eigene Dateien

Read 6 items Read 2 records

segment list from database: timetable query was: Phonetic = i

labels start end utts 1 i: 3605.31 3742.19 HPTE003 2 i: 4505.50 4565.19 HPTE003

Verbindung zur R-Programmiersprache

(12)

Oder die Abfrage direkt in R mit der emu.query() Funktion durchführen

emu.query("timetable", "*", "Phonetic=i:")

Welche

Sprachdatenbank?

Welche Äußerungen?

Welche Abfrage?

Siehe S. 8

(13)
(14)

1. Query database

2. Graphical query

(15)

Beziehung zwischen Graphical Query und

Etikettierungen

(16)

Phonetic u:

(Alle ‘u:’ Einheiten der Phonetic Ebene)

(17)

* wav bedeutet: alle Äußerungen mit dieser Extension abfragen

*01* lab wäre: alle

Äußerungen mit Extension .lab abfragen, die 01 in der

Dateiname enthalten

(18)

Ergebnis: Segmentliste

save (Dateiname

aussuchen)

(19)

Aufgabe

Eine Textdatei aller ‘Duden’ Einheiten der Word-Ebene speichern

Ergebnis

(20)

Weitere Abfragen

1.1 Kernfragen

1. Abfragen aus einer Ebene

1.2 Reihenfolge (NB aus einer Ebene) [u:] Einheiten der Phonetik Ebene

[u:] und [i:] Einheiten der Phonetik Ebene

Einfach: Mehrere Einheiten:

Einheiten außer irgendwelchen Einheiten

Alle Einheiten außer Duden und Diele der Wort Ebene /b/ Phoneme vor /i:/ Phonemen (also /b/ in /bi:/)

‚Duden‘ der Word Ebene gefolgt von ‚ist‘ der Word Ebene (also Reihenfolgen von ‚Duden ist‘)

2. Abfragen aus mehreren Ebenen /u:/ Phoneme in starken Silben

/u:/ und /i:/ Phoneme vor /g/ Phoneme in

starken Silben

(21)

Mehrere Einheiten

Alle Einheiten außer

einer/mehreren Einheiten

1.1 Kernfragen

(22)

/g i:/ Phoneme

1.2 Reihenfolge (NB aus einer Ebene)

(23)

H-Phonetic Einheiten in /d/ Phonemen in L-Einheiten der Type Ebene

2. Abfragen aus mehreren Ebenen

(24)

H-Phonetic Einheiten in /d/ Phonemen in L-Einheiten der Type Ebene

Ergebnis

(25)

H Einheiten in /d/ Phonemen in Wörtern von Type L

(26)

Phoneme Einheiten

/d/ Phoneme in Wörtern von Type L,die H Phonetic

Einheiten dominieren

(27)

/d/ Phoneme in Wörtern von Type L, die H Phonetic Einheiten

dominieren

(28)

Fragen: siehe

http://www.phonetik.uni-muenchen.de/~jmh/

Lehre > Seminar EMU R > Query Übung

Referenzen

ÄHNLICHE DOKUMENTE

wicklung und werden deshalb hier zusammengefaßt.. Am unteren Kor weisen alle 19 flußbewässerten Dörfer, teilweise erst Ergebnis des modernen Siedlungsausbaus, eine

Obwohl in der nördlich anschließenden Sarhadd-Höhenstufe über 2000 m in den Sommerweidegebieten der 1966 noch 20 411 Zelte starken Qaschqä'i-Nomaden seit Befriedung

Fähigkeiten / Fertigkeiten FüU > Fach Interesse / Selbstvertrauen FüU > Fach Überfachliche Kompetenzen FüU > Fach Geschlechtergerechtigkeit FüU > Fach..

Aufgabe 5: Für eine Bewässerungsanlage soll ein oben offener Kanal mit dreieckigem Querschnitt aus zwei gleich breiten Betonfertigplatten der Breite L gebaut

Quelle: Formatvorlage (2008) Flussdiagramme und geometrische Grafiken erstellt man am besten in Powerpoint und.. importiert sie dann als ppt-Objekt oder

(b) Die Harmonischen werden im Spektrum erscheinen, wenn das Fenster (die Zeitauflösung) größer als die Periodendauer

Alle L% Einheiten der Intonational-Ebene, die mehr als zwei Einheiten der Intermediate Ebene enthalten!. Intonational = L% & Num(Intonational, Intermediate)

Hat man zwei Kreise oder einen Kreis und eine Gerade, die einander ber¨ uhren, dann gilt das auch f¨ ur deren Bilder unter einer Inversion, wobei diese Bilder Kreise oder Geraden