• Keine Ergebnisse gefunden

Parametrisierung von SpektraJonathan HarringtonEnergie-SummenSpektrale MomemteSpektrale Neigung

N/A
N/A
Protected

Academic year: 2021

Aktie "Parametrisierung von SpektraJonathan HarringtonEnergie-SummenSpektrale MomemteSpektrale Neigung"

Copied!
11
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Parametrisierung von Spektra

Jonathan Harrington

Energie-Summen Spektrale Momemte Spektrale Neigung

(2)

Das Ziel ist allen 3 Fällen ist, ein Spektrum, das sehr viele (z.B. 64, 256, 512..) Werte enthält, auf ein paar Parameter zu reduzieren.

Und zwar auf eine solche Weise, dass verschiedene phonetische Lautklassen voneinander differenziert werden können.

(3)

# Segmentliste von 3 Vokalen

v.s = emu.query("florian", "*", "phonetic=i:|u:|a:")

# Label-Vektor v.l = label(v.s)

# Spektrale Trackdatei v.dft =

# Spektra zum zeitlichen Mittelpunkt sp =

# Abbildung aller Spektra 0-3 kHz kodiert nach Vokal-Kategorie Spektra mit Default-Weren, berechnen,

Sprachdatenbank florian

Spektra mit Default-Weren, berechnen, Sprachdatenbank florian

emu.track(v.s, "dft")

dcut(v.dft, .5, prop=T)

plot(sp[,0:3000], v.l, xlab="Frequenz (Hz)", ylab="Intensitaet (dB)")

(4)

1. Energie-Mittelwert 1. Energie-Mittelwert

2 Frequenz-Bereichen, in denen sich die Vokale unterschieden.

zB

2200-3000 Hz noch eine?

(5)

dB Mittelwert 2200-3000 Hz vom ersten Segment?

mittel =

plot(sp[1,2200:3000]) abline(h = mittel)

Eine Funktion, fun auf alle Segmente einer

spektralen Matrix m andwenden fapply(m, fun) dB-Mittelwert 2200-3000 Hz aller Segmente?

fapply(): eine Funktion anwenden auf Spektra fapply(): eine Funktion anwenden auf Spektra

mean(sp[1,2200:3000])

a = fapply(sp[,2200:3000], mean)

dB-Mittelwert aller Segmente vom anderen gewählten Frequenzbereich?

b =

Ellipse-Abbildung in diesem Raum beide = cbind(a, b)

eplot(beide, v.l, dopoints=T)

(6)

m1: erstes spektrales Moment (spektrales Gewichtsschwerpunkt) m1: erstes spektrales Moment (spektrales Gewichtsschwerpunkt)

Je mehr sich die Energie in höheren Frequenzen konzentriert, umso höher m1 (in Hz gemessen).

(a) m1 ist ca. 2000 Hz (die Energie ist in den Frequenzen gleich verteilt)

m1 gleich/höher/tiefer im Vgl. zu (a)?

(b)

(c) (d)

m1 wird nicht von der dB- Skalierung beeinflusst

(b): m1 wie für (a) (a)

(7)

Je verteilter die Energie im Spektrum, umso höher m2 (in Hz2) m2: zweites spektrales Moment (spektrale Varianz)

m2: zweites spektrales Moment (spektrale Varianz)

(a)

(c)

(d)

(f) (e) m2 wird nicht von

der dB-Skalierung beeinflusst

(b): m2 wie für (a)

m1 von c-f im Vgl. zu (a)?

m2 von (c, d) > (a) m2 von (e) im Vgl. zu (c)?

m2 von (f) im Vgl. zu (d)?

(8)

hoch tief

tief hoch

m2

m1 Spektrale Momente einschätzen

Spektrale Momente einschätzen

(9)

Die spektralen Momente im Bereich 0-3000 Hz vom ersten Segment?

p = moments( sp[1,0:3000], minval=T )

p = fapply(sp[,0:3000], Ellipse-Abbildung im Raum m1 x m2

Spektrale Momente in Emu-R Spektrale Momente in Emu-R

eplot(p[,1:2], v.l, dopoints=T)

moments, minval=T) Die spektralen Momente im Bereich 0-3000 Hz aller Segmente?

(10)

Lineare Neigung 1500-3000 Hz Lineare Neigung 1500-3000 Hz

a:

i:

u:

positiv, flach, oder negativ?

flach +

-

(11)

Lineare Neigung 1500-3000 Hz Lineare Neigung 1500-3000 Hz Vom ersten Segment

lm(sp[1,1500:3000] ~ trackfreq(sp[1,1500:3000]))$coef Funktion, um die lineare Neigung zu berechnen:

spec = function(specdaten) {

lm(specdaten ~ trackfreq(specdaten))$coef }

Funktion auf alle Segmente anwenden erg = fapply(sp[,1500:3000], spec)

Boxplot der Neigungen als Funktion der Vokal-Kategorie boxplot(erg[,2] ~ v.l)

Referenzen

ÄHNLICHE DOKUMENTE

Idee: Für das Beleuchtungsmodell soll die Oberflächennormale moduliert werden, was eigentlich nur durch eine Veränderung der Geometrie möglich

// disable texture mapping and automatic texture coordinategeneration glDisable( GL_TEXTURE_CUBE_MAP );. glDisable(

Die Klassifikation der möglichen wahrnehmbaren Sprachlaute, die von den Vokalorganen erzeugt werden können.. Dazu benötigen wir

Alle Dokumente sowie die Abbildung von dieser Vorlesung hier

(b) Die Harmonischen werden im Spektrum erscheinen, wenn das Fenster (die Zeitauflösung) größer als die Periodendauer

 Über 75 Prozent der Süsswasser-Reserven der Erde sind in den Eismassen gespeichert..  Von dieser enormen Menge wiederum liegen etwa 99 Prozent in der Antarktis und in

In der Schweiz wird auf rund 260 000 ha beziehungsweise auf einem Viertel der landwirtschaftlichen Nutzfläche Ackerbau betrieben. Die Ackerkulturen sind für die Lebensmittel-

Ich möchte indes hervorheben, dass das unveränderte a nicht etwa Eigentümlichkeit dieser weiblichen Caritativendung äl ist, sondern dass die jüdische Überlieferung die Endung