HLSYN: Software für die parametrische Synthese der Sprache
Jonathan Harrington
Art. Parameter Interpretation Typische Werte
Ag Glottalverengung 0 (Schließung), 4 mm2 (Normales Sprechen) Al Lippenverengung 0 (Schließung) 100 mm2 (Normales Sprechen) Ab Zungenrückenverengung 0 (Schließung) 100 mm2 (Normales Sprechen)
An Velumverengung 0 (oral), 30 mm2 (nasal)
ue Geschwindigkeit der
Ausdehnung vom Vokaltrakt hinter der Schließung. Hat nur eine Wirkung, wenn der Vokaltrakt durch Al oder Ab geschlossen ist. Dieses Parameter wird
verwendet, wenn die Stimmhaftigkeit während der Schließung erhalten bleiben soll.
0 (keine Vergrößerung); 150 cm3/s (Stimmhaftigkeit im Verschluss)
Akustische Parameter: Grundfrequenz, Formanten f0, f1-f4
Alle Werte x 10, daher um eine Grundfrequenz von 100 Hz zu synthetisieren, muss 1000 eingegeben werden.
11 Synthese von Vokalen
[a] Monoton 150 Hz. Parameter in /home/jmh/HLSYN/basic/11.hld
F1 = 420 F2 = 900, F3=2200 Hz, []
F1=270, F2=2800, F3=3200 Hz, [i] ?
Es gibt immer eine lineare Interpolation zwischen den fettgedruckten Werten, zB hat der eingekreiste Lippenschließung-Parameter diese Interpretation:
21
Lippenschließung
Parameter in /home/jmh/HLSYN/basic/21.hld, 21.wav
23 Wie 21 und mit Stimmhaftigkeit im Verschluss
Eine Vergrößerung des Vokaltrakts während des Verschlusses um ca. 150 cm3/s Parameter in /home/jmh/HLSYN/basic/23.hld, 23.wav
31 Wie 23 und mit Formant-Transitionen fur /aba/
Parameter in /home/jmh/HLSYN/basic/31.hld, 31.wav
0 100 200 300 400 500 600 700
04080
Dauer (ms)
Al
31b wie 31 aber stimmloser /apa/
Parameter in /home/jmh/HLSYN/basic/31b.hld, 31b.wav
31d wie 31b aber mit einer größeren Intensität während der Aspiration Parameter in /home/jmh/HLSYN/basic/31d.hld, 31d.wav
41 /ama/: wie 31 aber mit gesenktem Velum
Parameter in /home/jmh/HLSYN/basic/41.hld, 41.wav
Zwei-formant Synthese: [da] (siehe Abbildung unten).
Parameter in /home/jmh/HLSYN/formant/da.hld, da.wav
100 ms Stille: Selbes Verzeichnis, 100.wav
Prototypischer /ga/: ga.hld, ga.wav
Aufgaben
1. Synthese von /ada/, /aga/ /ana/, /aa/, /aa/ (siehe 24, 33, 34, 41, 42; für Frikative 35)
2. Eine wav Datei erstellen mit 20 randomisierten Stimuli aus einem F2-Kontinuum (siehe oben) Experiment
Siehe Ohala, J. (1990) The phonetics and phonology of aspects of assimilation. Laboratory Phonology I. 258-275. Cambridge University Press: Cambridge. S3 2.21
Siehe vor allem Seiten 262-265.
(a) Synthese von /aba ada aga/. Die Synthese von aba.wav ist bereits fertig (/home/jmh/HLSYN/basic/aba.hld) und hat diese Dauerwerte (siehe unten).
V1 /a/: 135 ms (25-160 ms)
V1b Transition: 40 ms (160-200 ms)
/b/ Verschluss: 100 ms (200-300 ms)
bV1 Transition: 40 ms (300-340 ms)
V2 /a/: 135 ms (340-475 ms)
Die selben Dauerwerte und andere Parameter (außer natürlich al/ab und die Formanttransitionen) sollten für /ada/ und /aga/ erhalten bleiben.
(b) Mit Praat daraus /ab/ /ad/ /ag/ ableiten mit einer Verschlussdauer von 50 ms (also zwischen 0 und 250 ms). Das Signal immer zu einem Mindestwert im Signal schneiden, damit bei der Verbindung keine Diskontinuitäten vorkommen (siehe unten)
Zeitpunkt des letzten Signal-Tiefpunkts vor 0.25 finden (hier 0.249175 ms – siehe unten)
Signal neu auswählen zwischen 0 und diesen Wert:
Dann als ab.wav speichern.
Das gleiche aber jetzt mit 10 ms weniger Verschlussdauer (also zwischen 0 und 240 ms) und dann das gleiche aber mit 20 ms weniger Verschlussdauer (also zwischen 0 und 230 ms). Diese Dateien als ab10.wav und ab20.wav speichern.
Das gleiche für /ad/ und /ag/ (also ad.wav, ad10.wav, ad20.wav, usw.).
(c) Dann dasselbe aber für /ba/, /da/, /ga/. ba.wav hat Dauern zwischen 250 ms und 500 ms;
ba10.wav zwichen 260 ms und 500 ms; ba20.wav zwischen 270 ms und 500 ms.
(d) In Praat
/ab ad ag/ mit /ba da ga/ jeweils kombinieren (9 Kombinationen); Verschlussdauer = 100 ms /ab10 ad10 ag10/ mit /ba10 da10 ga10/ jeweils kombinieren (9 Kombinationen);
Verschlussdauer = 80 ms
/ab20 ad20 ag20/ mit /ba20 da20 ga20/ jeweils kombinieren (9 Kombinationen);
Verschlussdauer = 60 ms. Bei den Kombinationen immer aufpassen, dass keine Diskontinuitäten auftreten!
Mit Diskontinuität Diskontinuität schneiden
Diskontinuität weggeschnitten
(e) Für alle 27 Stimuli die Zeitsignale umdrehen (in Praat: Modify, Reverse).
(f) Daraus entstehen insgesamt 54 Stimuli. Eine wav Datei vorbereiten, die diese 54
randomisierten Stimuli enthält, mit einem zeitlichen Abstand zwischen den Stimuli von ca. 1 Sekunde.
(g) Ein Perzeptionstest durchführen mit vielleicht 10-15 Versuchspersonen. Die
Versuchspersonen müssen wie in Ohala (S 263) für jeden Stimulus eins von drei Antworten ankreuzen, je nach der Artikulationsstelle. zB für /ab-da/ oder /ad-ba/ müssen sie zwischen 3 Antworten wählen:
ABA ADA ETWAS ANDERS
Die Fragestellung:
wird die Wahrnehmung der Artikulationssstelle hauptsächlich von C2 beeinflusst?