HLSYN: Software für die parametrische Synthese der SpracheJonathan HarringtonArt. ParameterInterpretationTypische WerteAgGlottalverengung0 (Schließung), 4 mm

(1)

HLSYN: Software für die parametrische Synthese der Sprache

Jonathan Harrington

Art. Parameter Interpretation Typische Werte

Ag Glottalverengung 0 (Schließung), 4 mm² (Normales Sprechen) Al Lippenverengung 0 (Schließung) 100 mm² (Normales Sprechen) Ab Zungenrückenverengung 0 (Schließung) 100 mm² (Normales Sprechen)

An Velumverengung 0 (oral), 30 mm² (nasal)

ue Geschwindigkeit der

Ausdehnung vom Vokaltrakt hinter der Schließung. Hat nur eine Wirkung, wenn der Vokaltrakt durch Al oder Ab geschlossen ist. Dieses Parameter wird

verwendet, wenn die Stimmhaftigkeit während der Schließung erhalten bleiben soll.

0 (keine Vergrößerung); 150 cm³/s (Stimmhaftigkeit im Verschluss)

Akustische Parameter: Grundfrequenz, Formanten f0, f1-f4

Alle Werte x 10, daher um eine Grundfrequenz von 100 Hz zu synthetisieren, muss 1000 eingegeben werden.

11 Synthese von Vokalen

[a] Monoton 150 Hz. Parameter in /home/jmh/HLSYN/basic/11.hld

F1 = 420 F2 = 900, F3=2200 Hz, []

F1=270, F2=2800, F3=3200 Hz, [i] ?

(2)

Es gibt immer eine lineare Interpolation zwischen den fettgedruckten Werten, zB hat der eingekreiste Lippenschließung-Parameter diese Interpretation:

21

Lippenschließung

Parameter in /home/jmh/HLSYN/basic/21.hld, 21.wav

23 Wie 21 und mit Stimmhaftigkeit im Verschluss

Eine Vergrößerung des Vokaltrakts während des Verschlusses um ca. 150 cm³/s Parameter in /home/jmh/HLSYN/basic/23.hld, 23.wav

31 Wie 23 und mit Formant-Transitionen fur /aba/

0 100 200 300 400 500 600 700

04080

Dauer (ms)

Al

(3)

31b wie 31 aber stimmloser /apa/

Parameter in /home/jmh/HLSYN/basic/31b.hld, 31b.wav

31d wie 31b aber mit einer größeren Intensität während der Aspiration Parameter in /home/jmh/HLSYN/basic/31d.hld, 31d.wav

41 /ama/: wie 31 aber mit gesenktem Velum

(4)

Zwei-formant Synthese: [da] (siehe Abbildung unten).

Parameter in /home/jmh/HLSYN/formant/da.hld, da.wav

(5)

 100 ms Stille: Selbes Verzeichnis, 100.wav

 Prototypischer /ga/: ga.hld, ga.wav

Aufgaben

1. Synthese von /ada/, /aga/ /ana/, /aa/, /aa/ (siehe 24, 33, 34, 41, 42; für Frikative 35)

2. Eine wav Datei erstellen mit 20 randomisierten Stimuli aus einem F2-Kontinuum (siehe oben) Experiment

Siehe Ohala, J. (1990) The phonetics and phonology of aspects of assimilation. Laboratory Phonology I. 258-275. Cambridge University Press: Cambridge. S3 2.21

Siehe vor allem Seiten 262-265.

(6)

(a) Synthese von /aba ada aga/. Die Synthese von aba.wav ist bereits fertig (/home/jmh/HLSYN/basic/aba.hld) und hat diese Dauerwerte (siehe unten).

V1 /a/: 135 ms (25-160 ms)

V1b Transition: 40 ms (160-200 ms)

/b/ Verschluss: 100 ms (200-300 ms)

bV1 Transition: 40 ms (300-340 ms)

V2 /a/: 135 ms (340-475 ms)

Die selben Dauerwerte und andere Parameter (außer natürlich al/ab und die Formanttransitionen) sollten für /ada/ und /aga/ erhalten bleiben.

(b) Mit Praat daraus /ab/ /ad/ /ag/ ableiten mit einer Verschlussdauer von 50 ms (also zwischen 0 und 250 ms). Das Signal immer zu einem Mindestwert im Signal schneiden, damit bei der Verbindung keine Diskontinuitäten vorkommen (siehe unten)

Zeitpunkt des letzten Signal-Tiefpunkts vor 0.25 finden (hier 0.249175 ms – siehe unten)

(7)

Signal neu auswählen zwischen 0 und diesen Wert:

Dann als ab.wav speichern.

Das gleiche aber jetzt mit 10 ms weniger Verschlussdauer (also zwischen 0 und 240 ms) und dann das gleiche aber mit 20 ms weniger Verschlussdauer (also zwischen 0 und 230 ms). Diese Dateien als ab10.wav und ab20.wav speichern.

Das gleiche für /ad/ und /ag/ (also ad.wav, ad10.wav, ad20.wav, usw.).

(c) Dann dasselbe aber für /ba/, /da/, /ga/. ba.wav hat Dauern zwischen 250 ms und 500 ms;

ba10.wav zwichen 260 ms und 500 ms; ba20.wav zwischen 270 ms und 500 ms.

(d) In Praat

/ab ad ag/ mit /ba da ga/ jeweils kombinieren (9 Kombinationen); Verschlussdauer = 100 ms /ab10 ad10 ag10/ mit /ba10 da10 ga10/ jeweils kombinieren (9 Kombinationen);

Verschlussdauer = 80 ms

(8)

/ab20 ad20 ag20/ mit /ba20 da20 ga20/ jeweils kombinieren (9 Kombinationen);

Verschlussdauer = 60 ms. Bei den Kombinationen immer aufpassen, dass keine Diskontinuitäten auftreten!

Mit Diskontinuität Diskontinuität schneiden

Diskontinuität weggeschnitten

(9)

(e) Für alle 27 Stimuli die Zeitsignale umdrehen (in Praat: Modify, Reverse).

(f) Daraus entstehen insgesamt 54 Stimuli. Eine wav Datei vorbereiten, die diese 54

randomisierten Stimuli enthält, mit einem zeitlichen Abstand zwischen den Stimuli von ca. 1 Sekunde.

(g) Ein Perzeptionstest durchführen mit vielleicht 10-15 Versuchspersonen. Die

Versuchspersonen müssen wie in Ohala (S 263) für jeden Stimulus eins von drei Antworten ankreuzen, je nach der Artikulationsstelle. zB für /ab-da/ oder /ad-ba/ müssen sie zwischen 3 Antworten wählen:

ABA ADA ETWAS ANDERS

Die Fragestellung:

wird die Wahrnehmung der Artikulationssstelle hauptsächlich von C2 beeinflusst?