• Keine Ergebnisse gefunden

Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen

N/A
N/A
Protected

Academic year: 2022

Aktie "Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen"

Copied!
21
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

to teach is to touch the future

Gruppe: Althammer , Schindelka 13.05.2016

Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen

Wie verstehen Computer natürliche Sprachen?

LVA – Leiter: Elizabeta Jenko

Wilfried Grossmann

erstellt von

Egbert Althammer 9031924 Herbert Schindelka 8526917

(2)

to teach is to touch the future

Gruppe: Althammer , Schindelka 13.05.2016

Intention und Zielgruppe (fachdidaktische Sicht)

• Überblick über das Thema

• Neugierig machen auf das Thema

• Motivation zum Thema zu schaffen

• Zielgruppe

• BHS 4. Klasse (Informatik)

• AHS 7. Klasse (Wahlpflichtfach Informatik)

 Anregung für VWA bzw. Diplomarbeit

(3)

to teach is to touch the future

Gruppe: Althammer , Schindelka 13.05.2016

Agenda

• Grundsätzliche Überlegungen

• Anatomie, Physik und Informatik

• Saarbrückener Pipeline Modell

• Problemstellungen

• Natürliche Sprache vs. künstliche Sprache

• Spracherkennung vs. Stimmerkennung

• Anwendungen

(4)

Grundüberlegungen zu „verstehen“ und „natürliche Sprache“

Schulz von Thun

Kommunikation ist nicht das, was A sagt sondern B versteht (n. Watzlawik)

(5)

to teach is to touch the future

Gruppe: Althammer , Schindelka 13.05.2016

Wie verstehen Computer natürliche Sprache?

Was heißt verstehen?

• Klare Intention des Users

• Klare Vorstellung von dem was der Computer tun soll

• Technische Schnittstelle

• befehlsorientiert

• und/oder „Freier Text“

(6)

Warum möchten wir (eigentlich), dass uns der Computer versteht?

Techn. Schnittstelle Techn. Schnittstelle

Input Computer/

Verarbeitung Output

(7)

to teach is to touch the future

Gruppe: Althammer , Schindelka 13.05.2016

Warum möchten wir (eigentlich), dass uns der Computer versteht?

Techn. Schnittstelle

Sprachaufzeichnung Spracherkennung

Sprachsteuerung Stimmerkennung

MikrophonVideo

Videoaufzeichnung Mimik

Gestik (Gebärden) Lippenlesen Eye-Tracking

Techn. Interface Maus, Joystick Tastatur

„Steuerung über Gedanken“

Techn. Schnittstelle

Sprachsynthese

(8)

Andere Referate

Fokus für heute

Gesprochene Sprache - Speech (vs. Language)

(9)

to teach is to touch the future

Gruppe: Althammer , Schindelka 13.05.2016

Zur Anatomie, Physik und Informatik

(10)

„Techn.“ Umsetzung

Signal – aufbereitung

(Filterung)

Eigentl.

Signalanalyse

Umweltgeräusche Rauschen Lautstärke

Mustererkennung (Sprecher-)Training

Aussprache- wörterbücher Sprachsynthese

Phoneme Silben/Wörter

Phonem: kleinste lautliche Einheit auf der Ebene des Sprachsystems, die selbst keine sprachliche Bedeutung trägt, sondern nur bedeutungsunterscheidend ist

„Wörterbücher“

(11)

to teach is to touch the future

Gruppe: Althammer , Schindelka 13.05.2016

„Wissenschaftlicher“ Ansatz

• Disziplin: Computerlinguistik

• Saarbrücker Pipeline Modell

Spracherkennung: Schall in Phoneme

Tokenisierung : Die Buchstabenkette wird in Wörter, Sätze etc. segmentiert.

Morphologische Analyse: Personalformen oder Fallmarkierungen werden

analysiert, um die grammatische Information zu extrahieren und die Wörter im Text auf Grundformen zurückzuführen, wie sie z. B. im Lexikon stehen.

Syntaktische Analyse Die Wörter jedes Satzes werden auf ihre strukturelle Funktion im Satz hin analysiert (z. B. Subjekt, Objekt, Modifikator, Artikel, etc.).

Semantische Analyse: Den Sätzen bzw. ihren Teilen wird Bedeutung

zugeordnet. Dieser Schritt umfasst potentiell eine Vielzahl verschiedener Einzelschritte, da Bedeutung schwer fassbar ist.

Dialog- und Diskursanalyse: Die Beziehungen zwischen aufeinander folgenden Sätzen werden erkannt

(12)

to teach is to touch the future

Gruppe: Althammer , Schindelka 13.05.2016

Warum ist Spracherkennung schwierig?

Gewählte Sprache an sich

Variabilität

o Signalqualität

o Phonetisch: Unterschiedliche Aussprache (verschiedene Sprecher, Dialekte, Ansprache, Plauderei, W/M/Kind, …)

o Linguistisch: Homonym, Homophon (Ferse vs. Verse)

Computer besitzt kein Weltwissen

Pragmatisches Wissen was kann jetzt überhaupt gesagt werden

Keine multimodale Erfassung (vgl. aber Mensch Experiment McGurk)

Segmentierung (Buchstaben, Wörter, Sätze, …)

Spontane Wörter

• Abgebrochene Wörter, Ähhh, Mmmhhh

Unbekannte Wörter

Erkennen von Emotionen, Erkennen von Witz, Satire

(13)

to teach is to touch the future

Gruppe: Althammer , Schindelka 13.05.2016

Vor- und Nachteile

Vorteile:

• Hände und Augen frei

• Natürliche Eingabe

Bedienung durch Laien

• Hohe Bandbreite

1000 - 4000 Zeichen pro Minute (Tatstatur 200 – 1000)

Nachteile:

• Akustische Umgebung

Mehrere Sprecher gleichzeitig

Störgeräusche

• Technik / Mikrophone

Bedienung durch Laien

• Ungenügende

Erkennungsleistung

Qualität wird besser

Fehlerbehandlung mit einplanen

(14)

Taxonomie von Sprachen

• Einzelne Kommandos

• Künstliche Sprachen

• Natürliche Sprachen

(15)

to teach is to touch the future

Gruppe: Althammer , Schindelka 13.05.2016

Spracherkennung vs. Stimmerkennung

Spracherkennung

Stimmerkennung

Bessere Verfahren Bessere Datenbasis Höhere Rechnerleistung Wortschatz

Anzahl der Sprecher

schematische Darstellung

(16)

Anwendungen

(1)

Mensch-Maschine-Schnittstelle

• Spracherkennung

• Diktiersysteme

• Call-Center-Anwendungen (z.B. Verkauf von Kinokarten)

• Auskunftssysteme (z.B. Fahrplanauskunft)

• E-Commerce

• Geschäfte über Mobil-Telefone

• Sprachsynthese

• Je nach Komplexität der Interaktion

• Maschinelle Übersetzung geschriebener und gesprochener Sprache

• Unterstützung von Human-Übersetzern

• Domänenspezifische Übersetzungen

• Stimmerkennung in Kriminologie und Forensik

Hilfsmittel für Behinderte

• Vorlesegeräte für Blinde

• Fernsehen für Hörgeschädigte

Quelle: https://hpsg.fu-berlin.de/~stefan/PS/cl-slides.pdf

(17)

to teach is to touch the future

Gruppe: Althammer , Schindelka 13.05.2016

Anwendungen

(2)

• Unterstützung bei der Textverarbeitung

(z.B. automatische Korrektur von Tipp- und Rechtschreibfehlern, Prüfung auf grammatische Richtigkeit)

• Unterstützung von Autoren beim Verfassen von Texten (z.B. Finden des treffenden Ausdrucks oder der richtigen

Terminologie, etwa bei der Verwendung eines kontrollierten Vokabulars in der technischen Dokumentation)

• Sprachsteuerung technischer Geräte oder Computer

• Automatisierte Messung von persönlichen Stärken anhand natürlicher Gespräche wie offene Interviews, Bewerbungsgespräche, Talkshows, Podiumsdiskussionen oder Gruppendiskussionen

Quelle: https://de.wikipedia.org/wiki/Computerlinguistik

(18)

Software

(1)

• Große Auswahl an kostenpflichtiger sowie gebührenfreier Spracherkennungssoftware

(z.B. Dragon Professional, Testsieger 2016 laut www.netzsieger.de)

• Kaum Unterschiede bei der Qualität der Spracherkennung

• Lernfähig – erfordert intensives Training

• Wichtig für hohe Erkennungsrate:

• Akzentfreies Sprechen des Users

• Leistungsfähiger PC

• Gutes Headset/Mikrofon

• Unterschiede in den Zusatzfeatures

Quelle: https://www.netzsieger.de/k/spracherkennungssoftware

(19)

to teach is to touch the future

Gruppe: Althammer , Schindelka 13.05.2016

Software (2)

• Siri (iOS 9):

• Verwendung nur online möglich

• „Werbung“: https://www.apple.com/de/ios/siri

• Cortana (Windows 10)

• In deutscher Sprache, aber nicht mit Ländereinstellung Österreich verfügbar

• http://windows.microsoft.com/de-de/windows-10/getstarted- what-is-cortana

(20)

Links

• Sprachsignale

http://culturmag.de/litmag/siri-ously-neues-aus-der- computerlinguistik/55432

• Wenn Computer Emotionen verstehen lernen

http://www.welt.de/wirtschaft/webwelt/article3905112/Wen n-Computer-Emotionen-verstehen-lernen.html

• McGurk - Effekt

https://www.youtube.com/watch?v=jtsfidRq2tw

(21)

to teach is to touch the future

Gruppe: Althammer , Schindelka 13.05.2016

Danke für die Aufmerksamkeit

Fragen?

Referenzen

ÄHNLICHE DOKUMENTE

Put your solutions in the letterbox labeled Automaten und formale Sprachen adja- cent to room lf , or hand them in through the online moodle -platform. If you hand in online,

1) Geben Sie f¨ ur jedes der W¨ orter a, c und abc jeweils ein weiteres Wort an, das zu dem jeweiligen Wort ¨ aquivalent ist. Geben Sie außerdem ein Wort an, dass zu keinem der..

Put your solutions in the letterbox labeled Automaten und formale Sprachen adjacent to room lf , or hand them in through the online moodle -platform. If you hand in online,

Bitte werfen Sie Ihre Abgabe in den mit Automaten und formale Sprachen beschrifteten Briefkasten neben Raum lf , oder geben Sie sie online ab ¨ uber die moodle-Plattform.. Wenn

Wir werden in diesem Abschnitt zuerst zeigen, dass f¨ur die im vorangegangenen Abschnitt eingef¨uhrten Typen von Grammatiken jeweils Normalformen existieren, d.h. Grammati- ken

Definition Eine nichtdeterministische Turingmaschine M heißt linear be- schr¨ ankter Automat (LBA), wenn bei jedem Lauf von M nur die Speicher- zellen der Eingabe benutzt

Definition Eine nichtdeterministische Turingmaschine M heißt linear be- schr¨ ankter Automat (LBA), wenn bei jedem Lauf von M nur die Speicher- zellen der Eingabe benutzt

Das spezielle Wort, das aus keinem Symbol besteht, wird das leere Wort genannt und meist mit ε bezeichnet.. Die L¨ ange