• Keine Ergebnisse gefunden

Prosodie, Syntax und Lexik als Kriterien zur Segmentierung

3.3 Segmentierung gesprochener Sprache

3.3.2 Segmentierungs- und Kategorisierungsvorschlag

3.3.2.1 Prosodie, Syntax und Lexik als Kriterien zur Segmentierung

3.3.2.1 Prosodie, Syntax und Lexik als Kriterien zur Segmentierung

Ausgangspunkt der Segmentierung ist die Auffassung von Gesprächen als Zu-sammenspiel mehrerer Turns (Redebeiträge; vgl. Kapitel 3.2.2.1. und 3.2.3.). Der Begriff des Turns geht auf Sacks/Schegloff/Jefferson (1974) zurück, die in ihrer Publikation „A Simplest Systematics for the Organization of Turn Taking for Conversation“ Überlegungen zur Konstitution einzelner Redebeiträge anstellen und Regularitäten des Turn-Taking (des Wechsels von Redebeiträgen bzw. der Verteilung des Rederechts) beschreiben. Ein Turn kann auf zweierlei Arten be-grenzt werden: erstens, indem der Sprecher bzw. die Sprecherin durch eine/n Gesprächspartner/in unterbrochen wird, sodass er bzw. sie die Äußerung ab-brechen muss.164 Die zweite Möglichkeit der Begrenzung eines Turns besteht im Abschluss eines Redebeitrags durch seine prosodische Gestaltung. Wird der Turn eines Sprechers/einer Sprecherin nicht unterbrochen und besteht er aus mindestens einem Tonhöhenakzent (Nukleus-, Primär- bzw. Fokusakzent)165 und einem kohäsiven Intonationsverlauf, kann der Äußerungsabschnitt als eine vollständige Intonationsphrase166 angesehen werden. Phonetisch realisiert wird dieser Primärakzent weniger durch Lautstärke, als vielmehr durch den Intona-tionsverlauf und eine größere Dauer der Silbe. Bergmann (2013) fasst dies wie folgt zusammen:

Tonhöhenbewegungen auf akzentuierten Silben sowie Tonhöhensprünge (nach oben oder unten) zu akzentuierten Silben kennzeichnen Akzente auf der Satzebene; sie werden als Tonhöhenakzente (engl. pitch accent) bezeichnet. (Bergmann 2013: 81; Hervorhebung im Original)

|| 164 Dann entsteht eine Anakoluthform (zur näheren Beschreibung siehe unten). An dieser

Stelle sei bereits darauf hingewiesen, dass der Terminus Anakoluth als skriptizistisch geprägter Begriff in der Linguistik mittlerweile als problematisch angesehen wird. Näheres zu dieser begrifflichen Kritik findet sich z.B. bei Hennig (2006: 160166).

165 Vgl. die Definition bei Selting et al. (2009: 370): „Eine Intonationsphrase enthält obligato-risch mindestens eine akzentuierte Silbe, d.h. eine Silbe, die durch eine Intonationsbewegung und/oder Lautstärke und/oder Länge phonetisch hervorgehoben wird und die semantische Bedeutung der Äußerung maßgeblich bestimmt. Dieser semantisch-pragmatisch relevanteste Tonhöhenakzent wird hier Fokusakzent genannt.“

166 Die Intonationsphrase selbst ist freilich nicht die kleinste segmentierbare Einheit in ge-sprochener Sprache. Sie enthält verschiedene Laute, deren Strukturierung durch einzelne prosodische Domänen beschrieben werden kann: So besteht jede Intonationsphrase aus einer phonologischen Phrase, die klitische Gruppen enthält, die wiederum aus phonologischen Wörtern bestehen, die sich ihrerseits aus Füßen und Silben konstituieren (vgl. Nespor/Vogel 2007; Bergmann 2013: 72). Mit diesen prosodischen Konstituenten beschäftigt sich die Subdis-ziplin der prosodischen Phonologie.

Segmentierung gesprochener Sprache | 119

Die Intonationskontur, die in einem solchen Tonhöhenakzent „gipfelt“, wird mit Selting (1993: 116) als „aufgrund ihrer Tonhöhenverlaufsgestalt […] von Analysierenden und Rezipienten als kohäsiv wahrgenommene prosodische bzw. melodische Einheit zwischen Grenzsignalen“ aufgefasst. Als prototypisch für das Deutsche gilt etwa in Aussagesätzen eine steigend-fallende Intonations-kontur (vgl. Möbius 1993: 18). Ein Turn kann aus einer oder mehrerer solcher Intonationsphrasen bestehen, wobei die Intonationsphrase selbst neben dem Primärakzent zusätzliche Nebenakzente aufweisen kann. Falls die Forschungs-frage die Notation der Nebenakzente verlangt, werden diese bei der Transkripti-on mit einer Majuskel auf dem betTranskripti-onten Vokal gekennzeichnet, während beim Nukleusakzent die gesamte Silbe in Großbuchstaben notiert wird (z.B.: sie geht mit ihrer kAtze[Nebenakzent] zum friSEUR[Nukleusakzent];).

Da die prosodischen Analysen der Gespräche in der vorliegenden Untersu-chung nicht den zentralen Gegenstand der Überlegungen bilden, sondern syn-taktische Besonderheiten der mündlichen Kommunikation Jugendlicher in ihrem Zusammenspiel mit prosodischen Gestaltungsmöglichkeiten analysiert werden sollen, würde eine tiefergehende Beschreibung der internen Struktur der Intonationsphrase und einer genauen phonetischen und phonologischen Beschreibung deutschsprachiger Äußerungen zu weit führen. Hier sollen daher nur in aller Kürze die zentralen Konstituenten einer Intonationsphrase darge-stellt werden:167 Peter Gilles (2005: 7) bezeichnet die internen Bestandteile einer Intonationsphrase mit den Kategorien Vorlauf, Kopf und Nukleus – diese Eintei-lung geht auf die so genannte „Britische Schule“ (vgl. z.B. Cruttenden 1997) zurück und hat sich in der deutschsprachigen Prosodieforschung weitgehend etabliert (vgl. Birkner 2008: 86; Bergmann 2013: 80). Die folgende Beispieläuße-rung nach Gilles (2005: 9) und ihre Extraktion der Grundfrequenz f0 veranschau-licht die Verteilung der einzelnen Konstituenten:

|| 167 Detailliertere Angaben finden sich u.a. in Cruttenden (1997), Bergmann (2006) und Gilles

(2005).

Abb. 7: Konstituenten der Intonationsphrase nach Gilles (2005: 9)

Das „intonatorische Zentrum“ der Intonationsphrase (Gilles 2005: 9) liegt in der Nukleussilbe der Äußerung. Im angegebenen Beispiel ist dies die Silbe MÜNCH (während die Silbe MUT von Mutter nur einen Nebenakzent bildet). Der Vorlauf der Intonationsphrase besteht aus den Lauten bis zur ersten Akzentsilbe, der Kopf erstreckt sich von der ersten Akzentsilbe bis zur Nukleussilbe. Die Nukle-ussilbe und ihr Nachlauf, der die nachfolgenden unbetonten Silben (in diesem Fall: -nerin) enthält, bilden zusammen den Nukleus. Der Vor- und Nachlauf einer Intonationsphrase kann unterschiedliche – prosodisch unselbstständige – Elemente enthalten. Dazu zählen etwa redebeitragseinleitende Vorlaufelemen-te168 (z.B. na ja, ja, also), redebeitragsabschließende Nachlaufelemente169 (z.B.

ne?, ge(ll)?, he, und so), aber auch im Vorlauf oder Kopf der Intonationsphrase geäußerte Verzögerungselemente (äh, ähm, na, so) oder prosodisch integrierte Umformulierungen bzw. Reparaturen (vgl. z.B. JD 3, Z. 372f.: der oabeitet ban ban ban ba bei der gärtnerEI;).

|| 168 In topologisch orientierten Arbeiten der Gesprochene-Sprache-Forschung werden

Vorlau-felemente häufig auch als Vor-Vorfeldelemente bezeichnet (vgl. z.B. Auer 1996; Schwitalla 2003: 147). Begriffliche Überschneidungen gibt es auch zur Kategorie der Operatoren in Opera-tor-Skopus-Strukturen (vgl. Barden/Elstermann/Fiehler 2001).

169 Nachlaufelemente werden in verschiedenen Forschungsarbeiten mit unterschiedlicher theoretischer Ausrichtung auch als Post-completer (vgl. z.B. Deppermann 2008: 59), Tags (vgl.

z.B. Auer 2010) oder Increments (vgl. z.B. Schegloff 1996; Vorreiter 2003) bezeichnet, wobei häufig definitorische Überschneidungen mit der prosodisch selbstständigen „Add-on“-Subklasse der Nachträge sowie den prosodisch unselbstständigen, in die Intonationsphrase integrierten Rechtsversetzungen festzustellen sind.

Segmentierung gesprochener Sprache | 121

Während es sich bei Vorlauf, Kopf und Nachlauf um optionale Elemente handelt, ist die Nukleussilbe obligatorischer Bestandteil einer Intonationsphra-se. Die Tonhöhenbewegung im Nukleus (Nukleussilbe mit oder ohne Nachlauf)

„ist in den meisten Fällen das wesentliche Merkmal für die Bestimmung einer Kontur […]“ (Birkner 2008: 90). Zur Beschreibung dieser nuklearen Tonhöhen-bewegungen haben sich die folgenden fünf typisierten Konturen etabliert: fal-lende, steigende, fallend-steigende, steigend-fallende und gleichbleibende nukleare Konturen.170 Die jeweils letzte Tonhöhenbewegung der Intonations-phrase (Grenzton171) wird bei der Transkription notiert (vgl. die Transkriptions-konventionen in Kap. 7.1.) – für eine detaillierte Analyse der Intonationskurve ist jedoch die Extraktion der Grundfrequenz f0 notwendig, wie oben in Abb. 7 gezeigt wurde.

Neben der bereits genannten obligatorischen Definitionsvoraussetzung des Nuklear- bzw. Primärakzents gibt es verschiedene fakultative Eigenschaften, die Intonationsphrasen kennzeichnen können, aber nicht müssen. Diese Grenzsig-nale172 sollen nach Selting et al. (2009: 370) zu folgenden intonationsphrasenini-tialen und -finalen Phänomenen zusammengefasst werden:173

– intiale Grenzsignale:

o Tonhöhensprung nach unten oder oben (relational zur vorherigen Into-nationsphrase)

o schnellere Sprechgeschwindigkeit (initiales Accelerando) in den Vor-laufsilben

o Pausen

|| 170 Neben diesen fünf Grundtypen der Intonationskontur werden je nach Forschungsfrage

noch weitere genannt (vgl. z.B. Selting et al. 2009, die zwölf nukleare Konturen festlegen).

171 In der Regel werden in Publikationen zur Intonation des Deutschen drei Typen intonatori-scher Töne unterschieden: Akzent-, Begleit-, und Grenztöne (zur näheren Beschreibung vgl.

z.B. Peters 2009: 9697 oder Selting et al. 2009: 383). Für die Segmentierung mündlicher Äuße-rungen von besonderer Bedeutung sind neben den Akzenttönen die initialen und finalen Grenztöne. Dabei handelt es sich um „Töne, die an das Auftreten prosodischer Phrasen wie der Intonationsphrase gebunden sind und an deren Grenzen realisiert werden“ (Peters 2009: 96).

172 Grundsätzlich gibt es sowohl positive als auch negative Grenzsignale (vgl. Bergmann 2013: 7879). Während das Auftreten eines positiven Grenzsignals eine (Laut-, Phrasen-, Äuße-rungs-) Grenze anzeigt, gibt ein negatives Grenzsignal einen Hinweis darauf, dass eine solche Grenze nicht vorliegt. Dies gilt auf Lautebene „beispielsweise für den Velarnasal im Deutschen, der nur im Inlaut oder Auslaut eines Wortes stehen kann, nicht aber im Anlaut“ (Bergmann 2013: 78).

173 Vgl. auch die Zusammenfassung der Merkmale prosodischer Phrasierung bei Birkner (2008: 84)

– finale Grenzsignale:

o finale Dehnung

o Knarrstimme (Glottalisierung)

o Tonhöhenbewegung am Einheitenende auf (un)betonten Silben (fal-lender oder steigender Grenzton)

o Pausen

Die prototypische Intonationsphrase kann nach Bergmann/Mertzlufft/Held (2007) demnach wie folgt schematisch dargestellt werden:

Abb. 8: Darstellung einer fiktiven Intonationsphrase (Bergmann/Mertzlufft/Held 2007)174

An dieser Stelle sei darauf hingewiesen, dass in der Segmentierung der Turns zwar ein gänzlicher Abbruch einer Konstruktion, der durch eine Unterbrechung von Seiten eines/r Gesprächsteilnehmers/in verursacht wurde, als Beendigung einer Intonationsphrase angesehen wird. Im Gegensatz zu anderen Segmentie-rungsvorschlägen (vgl. z.B. Rath 1992: 253), die Hörersignale als turn-segmentierend einstufen, wird hier aber davon ausgegangen, dass ein Turn nicht durch hörerseitige Rezeptionssignale, die rederechtszuweisend bzw. -bestätigend wirken, begrenzt wird.175 Im folgenden Beispiel (5) liegt ein Konstruktionsabbruch aufgrund einer Unterbrechung vor:

|| 174 Grafik online unter: http://paul.igl.uni-freiburg.de/gat-to/modul7/index.html (07.12.

2013).

175 Diese Einstufung findet Unterstützung durch Stein (2003, 408), der es ebenso nicht über-zeugend findet, „an Stellen eines Sprecherbeitrags Grenzen anzunehmen, an denen der Spre-cher selbst offensichtlich nicht nur keinen Einschnitt vorsieht, sondern an denen auch durch die Hörersignale Einschnitte begründet würden, die zu syntaktisch und semantisch nicht mehr

„als kohäsiv wahrgenommene prosodische bzw. melodische Einheit“

initiale Grenzsignale finale Grenzsignale

Segmentierung gesprochener Sprache | 123

Beispiel 5: JD 3, Z. 417-436: „Schulveranstaltung School Pool“

417 Fel: des:: SCHOOLpool is die !GRESCH!te veroascherei.

418 Mar: jo.

419 (---) do muass a LEHrer mitgehen.

((…))

430 Mar: (-) j_eh Super;

431 (1.2)

432 konn NIT a lehrer von da ondern [schual-]

433 Flo: [tuat is]

gym olle MIT;

434 oder,

435 Fel: (-) 'hm_'HM;

‘Fel: Das Schoolpool [Anm. ML: Schulveranstaltung] ist die größte Verarsche. – Mar: Ja. Da muss ein Lehrer mitgehen. Ja eh super. Kann nicht ein Lehrer von der anderen Schule- Flo:

Machen vom Gymnasium alle mit, oder? – Fel: Hm-hm [glottal iSv.: Nein].‘

Sprecher Mar wird in Zeile 432 von Flo unterbrochen, dessen Äußerung tuat is gym olle MIT (‘Machen vom Gymnasium alle mit?‘) sich zeitlich mit Mars Frage überschneidet. Flo setzt sich gegen Mar durch und ergreift das Rederecht. Das Valenzpotential in Mars Äußerung, das durch das Modalverb eröffnet wird, kann nicht vollständig eingelöst werden.

Anders ist dies im Falle zeitgleich verlaufender hörerseitiger Signale, die le-diglich die Aufnahmeaktivierung des Hörers transportieren, wie folgendes Bei-spiel (6) zeigt:

Beispiel 6: JD 3, Z. 290-299: „Preis der Wurstsemmel“

290 Fel: (1.1) des is is GEILschte;

291 Mar: (---) WURSCHTsemmel;

292 Fel: is geilschte is bein NAme [Anm. ML: Fleischhauer]- 293 (---) do gehsch EIne,

294 (--) der hot ans DREIßG gekoschtet;

295 ge- 296 Mar: mh-

297 Fel: (-) wenn i EInigeh und sog (1.0) um !AAN! euro,

|| sinnvoll interpretierbaren Einheiten führten […].“ Stein plädiert also dafür, „Hörersignale (und

andere Formen der Höreraktivitäten [z.B. Kopfnicken, Anm. ML]) nicht als gliederungsrelevan-te Signale zu ingliederungsrelevan-terpretieren“ (Sgliederungsrelevan-tein 2003: 407).

298 Mar: [(-) jo-]

299 Fel: [non ] kriag i GLEICH viel.

‘Fel: Das ist das Geilste. – Mar: Wurstsemmel. – Fel: Das Geilste ist beim Fleischhauer, da gehst du hinein, der hat einen Euro dreißig gekostet, ge? – Mar: mh- Fel: Wenn ich hineingehe und sage um einen Euro- Mar: Ja- Fel: Dann kriege ich gleich viel.‘

Die Rezeptionssignale von Mar in diesem Ausschnitt unterbrechen Fels Ausfüh-rungen zum Kauf einer Wurstsemmel nicht, sondern sie begleiten sie. Dieser Unterschied ist in aller Regel auch prosodisch erkennbar: Will ein Sprecher seinen Kommunikationspartner tatsächlich unterbrechen, ist eine größere Energie im Sprachsignal als bei Aufmerksamkeits-signalen, die das Rederecht des Gegenübers bestätigen, gegeben. Dabei ist auch von Bedeutung, an welcher Stelle der Äußerung von Sprecher A das Simultansprechen von Sprecher B ein-setzt. Findet die Überlappung zeitgleich zum Nukleus der Intonationsphrase von Sprecher A oder – wie in Beispiel (5) – vor der Realisierung des Nukleusak-zents statt, so strebt Sprecher B gemeinhin die Übernahme des Rederechts an.

Findet das Simultansprechen von B jedoch im Bereich des Nachlaufs der Äuße-rung von Sprecher A oder wie in Beispiel (6) im Vorlauf der nachfolgenden Äu-ßerung desselben Sprechers statt, so führt dies in der Regel nicht zum Spre-cherwechsel. Mit Bergmann (2013: 80) soll daher zwischen der „kompetitiven Überlappung“, die zum Abbruch der Konstruktion führt, und der „nicht-kompetitiven Überlappung“, die keine turn-segmentierenden Konsequenzen hat, unterschieden werden.

Insgesamt ist festzuhalten, dass von den oben genannten initialen und fina-len Grenzsignafina-len eines, aber auch mehrere in Kombination und Ergänzung zueinander auftreten können. Intuitiv zunächst einleuchtende und als ver-meintlich verlässlich eingestufte Grenzsignale wie etwa (Atem-)Pausen können aber auch innerhalb einer Phrase vorkommen, ohne deshalb den Beginn oder das Ende einer Intonationsphrase anzuzeigen. Das folgende Beispiel soll dies veranschaulichen:

Beispiel 7: und DER (-) hot so (.) Urolte trAktar; [JD 2, Z. 803]

'und der hat so uralte Traktoren'

Segmentierung gesprochener Sprache | 125

Abb. 9: Extraktion der Grundfrequenz f0 von JD 2, Z. 803

Die Tonhöhenbewegung dieser Intonationsphrase beginnt steigend, hat ihren Höhepunkt auf der Pro-Form (der) und fällt nach Nebenakzenten auf den Silben ur- und trak- gegen Ende der Äußerung leicht ab. Die kurze Pause (ca. 0,25 Se-kunden) nach dem Fokusakzent (DER) kann hier ebenso wenig wie die Mikro-pause nach so als grenzindizierend gewertet werden.

Neben der Prosodie als zentrales Mittel zur Gliederung können aber auch lexikalische Mittel zur Bildung von Intonationsphrasen beitragen. Darunter werden „formal recht heterogene Ausdrücke“ versammelt, deren gemeinsames Kennzeichen v.a. darin liegt, „dass ihre lexikalische Bedeutung größtenteils nur schwach ausgeprägt ist und sie primär keine semantischen, sondern kommuni-kative Funktionen übernehmen“ (Stein 2003: 352) und keine Träger von Propo-sitionen sind, sondern vielmehr gesprächsorganisatorische Funktionen über-nehmen. Dabei handelt es sich um eine offene Klasse von lexikalischen Elementen, zu der v.a. Konjunktionen (z.B. und, oder), formelhafte Wortverbin-dungen (z.B. ich mein, sag mal)176, Gliederungspartikel und Interjektionen (z.B.

also, na ja, tja, ach, ne, nich(t), ge/gö/gell) und rederechtserhaltende gefüllte Pausen (äh, ähm) zählen. Dass diese lexikalischen Mittel in einer Intonations-phrase sowohl redebeitragseinleitend im Vor- als auch redebeitragsabschlie-ßend im Nachfeld vorkommen können, wurde weiter oben bereits erwähnt. Als gesprächsorganisierende Mittel sind sie dabei nicht nur formal, sondern auch

||

176 Unter diesen formelhaften Verbindungen finden sich häufig (Halb-)Sätze, die je nach Kontext sowohl als Diskursmarker als auch als satzförmige Intonationsphrasen mit prosodisch selbstständiger Realisierung vorkommen können. Genauer analysiert wird dies z.B. in Günth-ner/Imos Aufsatz „Die Reanalyse von Matrixsätzen als Diskursmarker. ich mein-Konstruktionen im gesprochenen Deutsch“ (2003).

und DER (-) hot so (.) Urolte trAktar;

100 350

150 200 250 300

Pitch (Hz)

Time (s)

0 2.07

0

funktional heterogen – nach Stein (2003: 354355) lassen sich folgende funktio-nale Ebenen zusammenfassen:

– Gliederung der Sprechbeiträge und damit Orientierungshilfe für die Rezipi-ent/-innen

– Verknüpfung einzelner Elemente innerhalb der Intonationsphrase – Verknüpfung mehrerer Intonationsphrasen

– Überbrücken von Formulierungsschwierigkeiten – Steuern der Turnorganisation

– Ein- bzw. Ausleiten thematischer Abschnitte

– Kontaktsicherung: v.a. Aufmerksamkeits- und Verstehenssicherung In Bezug auf die lexikalischen Elemente im Nachlauf muss beachtet werden, dass diese sowohl in eine selbstständige Intonationsphrase integriert als auch als so genannte „klitische Intonationsphrasen“ (Peters 2009: 125) realisiert sein können. Diese Einteilung fußt auf Gussenhovens (2004: 290) Unterscheidung zwischen „incorporated“ und „enclitized“ Elementen in mündlichen Äußerun-gen zurück, die Jörg Peters wiederum in eine Differenzierung zwischen zwei Typen von Intonationsphrasen überführt: in unabhängige und klitische Intona-tionsphrasen.

Unabhängige Intonationsphrasen weisen mindestens einen Tonhöhenakzent auf und sind nicht an das Auftreten anderer Intonationsphrasen gebunden. Klitische Intonationsphra-sen hingegen sind an das Auftreten unabhängiger IntonationsphraIntonationsphra-sen gebunden und wei-sen selbst keinen nuklearen Akzent auf. (Peters 2009: 125; Hervorhebung im Original)

Die folgenden Beispiele sollen diese Unterscheidung verdeutlichen:

Beispiel 8: ah so des von sankt VEIT; oder, [JD 2, Z. 406f.]

'Ach so, das von Sankt Veit. Oder?'

Die Intonationsphrase beginnt hier mit dem prosodisch integrierten Vorlau-felement ah so, dann folgen Kopf und Nukleus der Intonationsphrase, wobei der Grenzton in seiner fallenden Intonation (in der Transkription gekennzeichnet durch das Semikolon) die Intonationsphrase begrenzt. Der nachfolgende Äuße-rungsteil oder ist prosodisch von der vorangegangenen Intonationsphrase ge-trennt und muss daher als eigene Intonationsphrase klassifiziert werden. Da diese aber keinen eigenen nuklearen Akzent aufweist, kann sie nicht als selbst-ständige, sondern aufgrund ihrer Gebundenheit an die vorhergehende Intonati-onsphrase nur als klitische IntonatiIntonati-onsphrase eingestuft werden.

Segmentierung gesprochener Sprache | 127

Prosodisch integrierte Nachlaufelemente können dabei auch in Kombinati-on mit nachfolgenden klitischen IntKombinati-onatiKombinati-onsphrasen vorkommen, wie Beispiel (9) zeigt:

Beispiel 9: wenn amol zu ZWEIT gehsch oder so; =ge- [ED 1, Z. 727ff.]

'Wenn [du]einmal zu zweit gehst oder so; ge-'

Der Nachlauf des Nukleus (der Primärakzent liegt auf ZWEIT) wird mit oder so abgeschlossen, die Intonation ist fallend. Der unabhängigen Intonationsphrase folgt eine klitische Intonationsphrase in Form der Gesprächspartikel ge.

Dass Nachlaufelemente wie oder so aber auch als eigenständige Intonati-onsphrasen realisiert werden können, zeigt folgendes Beispiel:

Beispiel 10: do tuasch anfoch amol SO- (-) oder SO- [JD 6-2, Z.157f.]

'Da tust [du] einfach einmal so- Oder so-'

Im Unterschied zu Beispiel (9) bildet oder so hier eine unabhängige Phrase mit einer eigenen nuklearen Akzentsilbe (auf SO).

Über die prosodische und lexikalische Indizierung von Äußerungsgrenzen hinaus ist auch die Projektionskraft syntaktischer Konstruktionen, d.h. „die Orientierung an möglichen Endpunkten von Konstruktionen, insbesondere des möglichen Satzes“ (Stein 2003: 228) eine wichtige Komponente, wenn Spre-cher/-innen bzw. Hörer/-innen Äußerungen als zusammengehörig wahrneh-men. Der Begriff der Projektion hat sich in den letzten Jahren in der Gesproche-ne-Sprache-Forschung als wichtiger Ausgangspunkt zur Abgrenzung von Einheitentypen etabliert – so bauen etwa Peter Auer (2000; 2005; 2006; 2009), Mathilde Hennig (2006) und Susanne Günthner (2011b) ihre Konzeption der Einheitenbildung auf die Beschreibung projektierender Kräfte auf.177

In seinem Aufsatz „Vergleichbares und Unvergleichbares bei mündlichen und schriftlichen Texten“ (2010) bezeichnet Johannes Schwitalla den Zeitfaktor in gesprochener Sprache als zentralen Faktor im Kontrast zur geschriebenen Sprache:

||

177 Bereits bei Sacks/Schegloff/Jefferson (1974: 701) wird die Projektierbarkeit als Kriterium zur Festlegung der Endpunkte von Redeeinheiten, so genannten „turn-constructional units“, genannt. Demnach haben die Konstruktionen „points of possible completion, points which are projectable before their occurence“ (720). An diesen Endpunkten finden sich nach Sacks/Schegloff/Jefferson “transition relevance places” (714), also Punkte im Gesprächsver-lauf, an denen ein Sprecherwechsel stattfinden kann, oder an denen der/die selbe Sprecher/-in eine neue turn-constructional unit beginnt.

Unsere psychische Kapazität ist auf allen sprachlichen Ebenen begrenzt durch das Zeit-fenster des Arbeitsgedächtnisses, was zur Folge hat, dass wir im vollziehenden Akt des Sprechens und Hören nur auf kurze Strecken vorausplanen können. (Schwitalla 2010: 8)

Um der Prozessierung mündlicher Kommunikation im zeitlichen Verlauf Rech-nung zu tragen, hat Peter Auer in diesem Zusammenhang den Begriff der „On line-Syntax“ (Auer 2000) geprägt, und zwar in Abgrenzung zur „Offline-Grammatik“ in geschriebenen Texten als „eine vom Realisierungsmodus unab-hängige sprachlich-grammatische Kompetenz der Sprecher“ (Auer 2007: 95).

Neben auf der unterschiedlichen Medialität beruhenden Unterschieden (z.B. dem Einsatz para- und nonverbaler Mittel, der Möglichkeit von fortlaufen-der Expansion und Korrektur)178 ist es v.a. die Strategie der Projektion, die in diesem zeitlich linearen Ablauf die Produktion und Rezeption der Äußerungen erleichtert: „Sprechen und Hörverstehen geschieht auf Zuwachs hin, ‚inkremen-tell‘. Deshalb haben wir in der gesprochenen Sprache Projektionstechniken zur Verfügung, die beim Hörer Erwartungen aufbauen und Verstehenshilfen geben“

(Schwitalla 2010: 10). Sie helfen dem Hörer dabei, mögliche "Redezug-Abschlusspunkte" (Auer 2005: 3) vorherzusagen, was Zeit für andere mentale und interaktive Aktivitäten, z.B. die Vorbereitung des nächsten Turns, schafft (vgl. Auer 2006: 293). In der theoretischen Auseinandersetzung mit diesen po-tentiellen Abschlusspunkten einer Äußerung findet sich ein konzeptioneller Anschluss an den Begriff der Gestaltschließung. Dieser basiert auf wahrneh-mungspsychologischen Überlegungen, denen zufolge die Rezeption einzelner (sprachlicher oder nicht-sprachlicher) Einheiten als Ganzes auf bestimmten Gestaltgesetzen wie etwa der Prägnanz, der Ähnlichkeit oder der guten Fortset-zung (Linearität) beruht (vgl. die gestaltpsychologischen Grundlagen bei Wert-heimer 1923/2012). In Bezug auf Redeteile bedeutet dies, „dass bestimmte pro-jektionsauslösende Strukturteile projektionseinlösende Strukturteile nach sich ziehen, sodass es zu einer Gestaltschließung kommt […]“ (Stein 2003: 428). Die Rezipient/-innen beurteilen das Gehörte also im Verlauf des Gesprächs (und nicht etwa wie bei einem geschriebenen Text im Anschluss an dessen Produkti-on) implizit nach seiner Abgeschlossenheit, wobei die Einschätzung von

Mög-||

178 Stoltenburg (2007: 137) fasst mit Auer (2000) die drei zentralen Merkmale gesprochener Sprache wie folgt zusammen: 1. Flüchtigkeit, 2. Irreversibilität, 3. Synchronisierung. Probleme, die aus diesen Grundmerk-malen resultieren, werden v.a. durch Projektionen und Retraktionen kompensiert. Während über das Verfahren der Projektion mögliche und unmögliche Fortset-zungen der Konstruktionen im noch folgenden Verlauf der Äußerung erwartet werden können, steuert das Verfahren der Retraktion die nachträgliche Bearbeitung, Modifizierung und/oder Reparatur bereits vollzogener Äußerungen.

Segmentierung gesprochener Sprache | 129

lichkeiten der Gestaltschließung auch revidiert werden kann: „[S]o erweist sich,

lichkeiten der Gestaltschließung auch revidiert werden kann: „[S]o erweist sich,