• Keine Ergebnisse gefunden

Technische Basis und Anforderungen an Sprachlösungen

N/A
N/A
Protected

Academic year: 2022

Aktie "Technische Basis und Anforderungen an Sprachlösungen"

Copied!
3
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Technische Basis und Anforderungen an Sprachlösungen

Detlev Artelt aixvox GmbH Monheimsallee 22

52062 Aachen detlev.artelt@aixvox.com

Abstract: Sprachapplikationen bedürfen eine technisch ausgereifte wie auch per- formante Betriebsgrundlage. Hierzu gibt es neben unterschiedlichen Betriebsyste- men auch unterschiedliche Telefonanbindungen und unterschiedliche Softwaresys- teme, die eine Sprachlösung erst ermöglichen. Dieser Artikel gibt einen ersten gro- ben Überblick darüber, welche technischen Grundlagen für eine erfolgreiche Sprachapplikation benötigt werden. Fazit: Eine genaue Bedarfsanalyse im Vorfeld erspart Investitionen in die falsche Technologie und sichert somit den langfristigen Erfolg des Sprachsystems nachhaltig.

1 Systemanforderungen

Zu aller erst sollten die Anforderungen an das System identifiziert werden. Ist dies ein- mal gelungen, lassen sich die nächsten Schritte in der Regel einfacher gehen, denn es macht eine Auswahl der technischen Basis viel einfacher und schließt einige Komponen- ten ggf. bereits im Vorfeld aus. Folgende Klassifizierungen lassen sich festhalten:

Größenordnungen SOHO, Enterprise, Carrier, ASP Telefonanbindungen Analog, ISDN, VoIP, IN

Sprachtechnologie Nur Tonwahl, Sprachsteuerung, natürlich sprachlich Zielsetzung Inbound, Outbound, beides

2 Basistechnologie und Aufbau

Der Trend geht ganz klar in Richtung verteilter Systeme mit standardisierten Schnittstel- len und Komponenten. Dies erleichtert die Skalierbarkeit des Systems und erlaubt es zu- dem bestimmte Komponenten z.B. die Telefoniekarten mehrfach bzw. übergreifend zu nutzen. Systeme basieren auf Standard Industrie-PC’s und entsprechenden Telefoniekar- ten der gängigen Hersteller. Über diese Karten wird der Zugang zum Telefonnetz entwe- der per ISDN oder auch per VoIP hergestellt. Zudem erlauben viele der Karten zusätzli- che Funktionen im Bereich der Spracherkennung. Bei einer Skalierung des Sprachsys- tems ist besonders auf die Skalierungsmöglichkeiten der Sprachkarten zu achten.

574

(2)

Auch wenn derzeit noch Vorbehalte gegenüber der Zuverlässigkeit bzw. Ausfallsicher- heit derartiger Systeme auf PC Basis bestehen, lassen sich diese über Cluster-Architektur mit entsprechenden Redundanzen in den Griff bekommen. Dies zeigt sich auch bei Her- stellern von einst proprietären IVR-Lösungen, die ihren Kunden mittlerweile nur noch eine Software verkaufen und ihnen anbieten, alle notwendigen Hardware-Komponenten mittels einer „shopping list“ selbst zu beschaffen.

3 Sprachanbindung

Die Vorteile die dieser Wandel für den Kunden hat, liegen dabei klar auf der Hand. Eine auf Standard-Komponenten aufbauende Architektur verursacht deutlich geringere Kos- ten bei der Einführung und Instandhaltung. Aber auch die Hardware-Komponenten an sich sind deutlich billiger und zudem austauschbar geworden. Ein weiterer wichtiger Vorteil dieser modernen Architektur liegt auch in der flexibleren Gestaltung von stand- ortübergreifenden Lösungen, die es ermöglichen Applikationslogik und kritische Kun- dendaten im Haus zu behalten und den „Gateway“ beispielweise zu einem Voice Appli- cation Service Provider zu übertragen oder eine „multi-site“ IVR mit zentraler ASR- Engine aufzubauen. Dies bekommt noch größere Bedeutung durch den Wandel zu IP- basierter Telefonie, der stetig vollzogen wird.

4 Sprachtechnologie

Die Unterschiede zwischen den Anbietern sind indes eher graduell. Die Auswahl sollte hier einen guten Kompromiss zwischen Qualität der Spracherkennung und beanspruchter Rechenleistung darstellen. Weitere wichtige Kriterien sind das Kosten-Nutzen- Verhältnis und die Erfahrungswerte bzw. Fähigkeiten beim „Training“ der Komponen- ten. Hierbei sollte stets berücksichtigt werden, dass die Wahl des Herstellers oft eine

„Entscheidung fürs Leben“ darstellt. Denn insbesondere intensives Training und Tuning eines Spracherkenners ist herstellerspezifisch und geht beim Wechsel des Erkenners ver- loren. Dies ist umso dramatischer, da sich an dieser Stelle die wahre Qualität und Reife einer Applikation versteckt, die auf den ersten Blick oft nicht sichtbar ist, aber das Er- gebnis unzähliger Manntage an Optimierungsarbeit darstellt. Somit sind die Kosten für den Erkenner selbst in vielen Fällen deutlich geringer als die Kosten für dessen Optimie- rung. Daher kann eine falsche Technologieentscheidung an dieser Stelle hohe Folgekos- ten mit sich bringen.

5 Aufbau eines Sprachservice

Deutlich schwieriger dagegen wird die Ebene des Dialog-Servers. Hier existieren derzeit einige Softwareprodukte die sich in Bezug auf ihren Funktionsumfang oft nur schwer voneinander abgrenzen lassen bzw. stark überschneiden. So gibt es z.B. Sprachmanage- ment-Systeme die zugleich eine umfassende Entwicklungsumgebung für das Dialog- Design beinhalten. Auch die ehemals proprietären Systeme sind mittlerweile von umfas- senden Applikations-Frameworks umgeben, die Funktionen wie grafisches Dialog-

575

(3)

Design, Reporting oder Management der gesamten Ressourcen ermöglichen (siehe Bild unten). Die umfangreichen Entwicklungsumgebungen können oftmals erst in Bezug auf die weitere zu integrierende Technik ausgewählt werden. Die Entscheidung auf dieser Ebene ist sicherlich sehr stark von individuellen Präferenzen geprägt, allerdings kann ei- ne gute Integrationsfähigkeit in die bestehende Contact Center-Infrastruktur oftmals von größerem Nutzen sein als ein kleiner Handling-Vorteil, der sich durch einen „moderne- ren“ Dialog-Server erzielen lässt.

576

Referenzen

ÄHNLICHE DOKUMENTE

Leukopathien, das sind Gefäßveränderungen und Hohlräume oder Luftein- schlüsse in der Nagelplatte, bringen ebenfalls eine Weiß- färbung der Nägel mit

Die verwendeten Methoden und Technologien müssen einer- seits eine große Anzahl von Datenpaketen verschieben, anderer- seits eine große Anzahl von Beteiligten aufnehmen

One of the objectives of the TransparentFood project is to create a blueprint proposal for a European Backbone Solution that provides basic and simple functionalities to

Die jungen Menschen sind auf der Suche nach ihrem eigenen Standpunkt in der Welt und sind bereit, sich auf eigene Füße zu stellen.. Der Schüler soll in künstlerischer

Widerrufsrecht: Die Bestellung des Abonnements kann ich schriftlich innerhalb von 10 Tagen durch Mitteilung an die Deutscher Ärzte-Verlag GmbH, Postfach 40 02 65, 5000 Köln

Mit ESET Dynamic Threat Defense (EDTD) verfügen Sie über eine cloudbasierte Sandbox-Analyse, die das Schutzniveau für Exchange Server und Endpoints deutlich hebt und Bedrohungen

Nagelpilz Wird der Fußpilz nicht rechtzeitig erkannt oder verschleppt, kann sich daraus ein deutlich hartnä- ckigerer Nagelpilz (Onychomykose oder Tinea unguium)

Das Besondere bei der Wundbehandlung von Diabetikern ist, dass Okklusivverbände an den Füßen zu vermeiden sind. Durch die diabetische Neuropathie spüren die