• Keine Ergebnisse gefunden

Cognitive Computing 2015–2020*

4.8 Von Fall zu Fall: Deklaratives oder exploratives Cognitive Computing?

4.8.3 Deklaratives Cognitive Computing

Einige Cognitive-Computing-Systeme unterstützen als natürlich sprachliche Schnittstelle den Dialog des Anwenders mit den Algorithmen des maschinellen Lernens. Mit so genannten »Digitalen oder Virtuellen Assistenten – wie Apples Siri, Google Now oder Microsoft Cortana – verfügen vor allem Smartphones über eine Funktionalität, die es Nutzern erlaubt, Anfragen in natürlich gesprochener Sprache zu formulieren und im System verarbeiten zu lassen. Nach einer Studie des

Institutes für Management Studies (IMS) der Goldsmiths University of London und der Medien Agentur Mindshare wünschen 81 Prozent der Befragten das ihr »Virtueller Assistent« über die Stimme steuerbar ist.177 Die Sprachein-gaben von Apple-, Android- und Microsoft-Telefonen funktionieren gut, insbesondere bei einfachen Anfragen so z. B. bei Fragen nach Orten, öffentlichen Personen, Sehenswürdigkeiten oder Konsumgütern. Die verbesserte Spracherkennung ist maßgeblich auf den Einsatz künstlicher neuronaler Netze zurückzuführen.178

Neuronale Netze verbessern und ergänzen die konventio-nellen mathematischen Modelle die – im Bereich der Spracherkennung – schon früher versuchten, aus den Audiosignalen Phoneme zu extrahieren, um nachfolgend Buchstabenkombinationen bzw. passende Worte zu zuordnen. Die künstlichen neuronalen Netze entdecken im Training ganz eigenständig Zuordnungsmöglich- keiten von gesprochener Sprache zu Text. Bei konventio-nellem Vorgehen muss dazu jede Eventualität in spezi- fischen Formeln im Programmcode abgebildet sein.

Zudem ist die implizit in den synaptischen Verknüpfun-gen abgelegte Expertise fähig zu Verknüpfun-generalisieren.

Hierin begründet sich die hohe Leistungsfähigkeit der kognitiven Ansätze.

Deklarativ sind diese Systeme aus drei Gründen:

1. Ihre wesentliche Aufgabe besteht darin, auf eine spezifische Eingabe mit einer passenden Ausgabe zu reagieren – im Fall der Spracherkennung also einem Audioinput das passendste Textstück zuzuordnen.

2. Um die Fähigkeit passender Zuordnung zu erlernen, wird ein Referenzdatensatz verwendet. Man spricht dabei von Trainingsdaten. In der Spracherkennung besteht dieser aus einer Vielzahl einzelner Audiodaten und einem für jede Audioquelle bekannten, dazu-gehörigen Textsnippet. Das Trainingsmaterial ist kuratiert.

177 Vgl. (Brauer 2014)

178 Vgl. (Google 2014)

3. Das Training des neuronalen Netzes ist überwacht, da im Lernprozess die synaptischen Gewichte in Richtung gewünschter Zuordnungen sukzessive angenähert werden. Dies geschieht solange, bis das Netz auf jedes Audio- mit dem passenden Textsnippet reagiert.

Google Now, Apple Siri und Microsoft Cortana vermitteln ein erstes Gefühl davon, wie ein Cognitive-Computing-System als virtueller Assistent die Nutzer dabei unter-stützt z. B. durch den Verkehr, ein Restaurant oder ein Geschenk zu finden. Diese B2C-Lösungen können leicht in den Produkten der Anbieter verbaut werden, ohne dass die Anbieter dabei auf individuelle Belange einzelner Endkunden Rücksicht nehmen müssen. Dies liegt an den Trainingsdaten. Einfache Sprache ist kein Phänomen einzelner Kunden oder einer bestimmten Kundengruppe.

IBM setzt mit den Watson Frage-Antwort-Services auf spezifischere Fragen als jene, die virtuellen Assistenten zu stellen wären. Es sind Fragen im Unternehmenskontext, auf die bisher mittels Wissensmanagementsystemen, wie z. B. der Google Search Appliance, versucht wurde, mögliche Antworten zu geben. Dieses konventionelle, formelbasierte Vorgehen ist als Information Retrieval bekannt. Hier wird ein Datenbestand aus einem unter-nehmensinternen Data Warehouse statistisch verarbeitet und auf Anfrage in relevanten Auszügen ausgegeben, gelernt wird jedoch nicht. IBM Watson arbeitet im Gegensatz zu Suchmaschinen auf der Grundlage kura- tierter Daten.

»Where Siri waits for a user to ask a question and then searches the internet for an answer, Watson tries to engage in a conversation and interact with the user, instead of searching the internet. Watson focuses on research and tries to offer new lines of inquiry … Watson focuses on curated information rather than garbage from the internet.«179

Der Zugang zu passenden Antworten folgt, in Abgrenzung zum Information Retrieval, dem grundlegenden Prinzip des Cognitive Computings, dem Hebbschen-Lernen. Die Innovation besteht dabei im Training eines neuronalen Netzes, einer Kombination von Text-Mining-Analysen mit Techniken der Künstlichen Intelligenz. IBM Watson läuft, wie klassische Information-Retrieval-Systeme auch, auf einer herkömmlichen Computerhardware, ist somit in einer von-Neumann-Architektur implementiert.

Man kann auch für diesen Ansatz von deklarativem Cognitive Computing sprechen, denn:

1. Watsons wesentliche Aufgabe ist es, auf eine domänenspezifische Frage passend zu antworten.

2. Um die Fähigkeit passender Frage-Antwort Zuordnung zu erlernen, werden aus einem domänenspezifischen Wissenskorpus, also einer umfassenden Textsamm-lung, Frage-Antwortpaare als Trainingsdaten für ein neuronales Training extrahiert. Das Trainingsmaterial ist somit kuratiert.

3. Das Training ist überwacht. Auch hier werden die synaptischen Gewichte solange geändert bis das neuronale Netz für jedes Frage-Antwort-Paar korrekt deklariert. Im praktischen Einsatz kann Watson so auch auf Fragen antworten, die selbst nicht Bestand-teil des Trainings waren. Watson kann über die im Training gesammelten Erfahrungen generalisieren.

Nach diesem Vorgehen wird Watson’s Cognitive Compu-ting für all jene Bemühungen zu einer Alternative, bei denen bisher mehr oder weniger erfolgreich bzw.

aufwendig versucht wurde Wissensdomänen mittels Ontologie- und Taxonomie-Modellen zu beschreiben.

Diese Versuche sind u. a. mit dem Begriff »Smart Data«

gekennzeichnet. Watson substituiert ein Stück weit

179 Vgl. (Williams 2014)

die bei der Modellierung einer Ontologie von Hand zu deklarierenden Abhängigkeiten. Watson »erschließt«

entsprechende Bezüge im Training. Bei der klassischen Erstellung einer Ontologie sind die Bezüge durch den menschlichen Experten im Ontologie-Editor abzubilden.

Während bei der Modellierung einer Ontologie der Erfolg davon abhängt, inwieweit es dem Experten gelingt, die semantische Binnenstruktur einer Wissensdomäne über den Editor treffend und umfänglich zu operatio-nalisieren, sind bei einem Cognitive-Computing-Ansatz lediglich das Training, der Wissenskorpus und die abgeleiteten Frage-Antwortpaare entscheidend. Hier kommt es auf die Auswahl an. So lassen sich mitunter in der Presse artikulierte Unwägbarkeiten einordnen:

»Watson is still a work in progress. Some companies and researchers testing Watson systems have reported difficulties in adapting the technology to work with their data sets.«180

Waren die Zusammenstellung des Wissenskorpus und die ausgewählten Frage-Antwort-Paare umfänglich und repräsentativ genug? Unter IBM-Bluemix gab es181 die Möglichkeit, mit einer Beta-Version des Watson

Frage-Antwort-Service zu interagieren. Den Domänen Gesundheit und Tourismus wurde exemplarisch je eine Frage gestellt. Die Resultate sind beeindruckend bis vielver sprechend (vgl. Tabelle 8).182

In aus Japan und Südafrika bekannt gewordenen Pro- jekten wird Watson ab 2015 in Callcentern eingesetzt.

Dazu wird ein Spracherkennungssystem Telefongespräche in Text umwandeln, aus denen IBM Watson mögliche Folgefragen auf dem Computer-Bildschirm des Call Center Agents auflistet. Es dient dem Call-Center-Agent dazu, einen schnelleren Überblick und Zugang zu Bereichen der angefragten Wissensdomäne zu erlangen, um Kunden-anfragen schneller und präziser bearbeiten zu können.

Unerfahrene Agents brauchen nach Auskunft der Be- treiber bei schwierigeren Fragen bisher ca. 30 Minuten, um eine passende Antwort herauszufinden. Mit IBM Watson soll diese Zeit deutlich zu verkürzen sein.

Die Hoffnung ist, dass die Technologie einmal in der Lage sein wird, auch kompliziertere Fragen in verschiedenen Branchen zu beantworten, um so ein computergesteuer-tes Beratungsgeschäft zu etablieren.

180 Vgl. (Knight 2014)

181 Zum Zeitpunkt der Erstellung dieses Leitfadens

182 Vgl. (Ananthanarayanan 2014)

Frage I want to travel to Syria, what must I follow?

Antwort If you are already in Syria, stay as far away as possible from large public gatherings or any military activity, which is probably widespread. If you require assistance, EU citizens should contact the embassy of another EU state if they cannot make contact with their home country’s representatives.

Consult your country’s travel warnings for more specific information. If you must travel to Syria, see War zone safety.

Frage Why do I have a cough?

Antwort If you get the flu, antiviral drugs are a treatment option. Check with your doctor promptly if you have a high risk condition and you get flu symptoms.

Tabelle 8: Beispiele für den Frage-Antwort-Service mit Watson