• Keine Ergebnisse gefunden

Ziele und Herausforderungen

N/A
N/A
Protected

Academic year: 2022

Aktie "Ziele und Herausforderungen"

Copied!
24
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)
(2)

Ziele und Herausforderungen

 Text soll automatisch aus einer Quellsprache in eine Zielsprache übertragen werden

 Dabei soll die Funktion des Textes erhalten bleiben

 Es werden sowohl computerlinguistische Analysen als auch eine hochwertige Textgenerierung benötigt

(3)

Systemarten

 Bilingual vs. Multilingual

 Unidirektional vs. bidirektional

 Batch-Systeme vs. Interaktive Systeme

Maschinelle Übersetzung

(4)

Übersetzungsstrategien

 Formen direkter Übersetzung

Beispielbasierte Übersetzung

Statistische Übersetzung

Und regelbasierte Ansätze:

 Transfer

 Interlingua

Maschinelle Übersetzung

(5)

Übersetzungsstrategien

Maschinelle Übersetzung

(6)

Direkte Übersetzung

 Oberflächliche (morphologische) Analyse

 Wort-für-Wort-Übersetzung mit Wörterbuch

 Einfache Wortstellungskorrekturen + Sehr schnelle, aber

─ schlechte Übersetzung

(7)

Beispielbasierte Übersetzung

 Zuordnung von Übersetzungseinheiten aus einem bilingualen Korpus

 Analogiebildung in neuen Kontext aus Daten der Translation Memory

+ Kommt ohne Regeln und Wissen über die Sprachen aus

─ Schlechtere Ergebnisse

Direkte Übersetzung

(8)

Statistische Übersetzung

 Modell für Übersetzung aus bilingualem alignierten Korpus

 Häufigkeit und Nähe der zu übersetzenden Wörter

 Wahrscheinliche Übersetzungen auf Satzebene, daraus zu Phrasen und Wörtern

 Auch hier keine Regeln benötigt

Direkte Übersetzung

(9)

Transfer

1.

Text in Quellsprache geparst und semantisch analysiert

2.

Abstrakte Repräsentation

3.

Abstrakte zielsprachliche Repräsentation durch Transferregeln

4.

Natürlichsprachliche Ausgabe

+

Keine vollständige Bedeutungsanalyse, einfache Phasen

Wortwahl begrenzt, nur für eingearbeitete

Sprachen

(10)

Interlingua

Analyse der Eingabe erzeugt sprachunabhängige Zwischenrepräsentation

Bisher nicht komplett

Auf Domänen und spezifische Grammatiken beschränkt

+

Schnelle Integration neuer Sprachen ins System

Bisher keine neutrale Repräsentation für alle

Sprachen gefunden

(11)

Wissensbasierte Übersetzung

 System kann auf Weltwissen zurück greifen

 Spezialisiertes Wissen auf Domänen

 Vermeidet Übersetzungsmehrdeutigkeiten

+ Bessere Übersetzungsergebnisse, besonders bei Ambiguität

─ Nicht universell anwendbar

Interlingua

(12)

Anwendung

 Für Rohübersetzungen genutzt, die schneller

nachbearbeitet werden können als die Erstellung einer kompletten Übersetzung

 Wird kontrollierte Sprache eingesetzt (begrenzte Domäne, Grammatik, Lexikon; Eindeutige Sätze), können schnell mehrere übersetzte Texte angefertigt werden

Maschinelle Übersetzung

(13)

Evaluation

 Menschliche Beurteilung

 Algorithmen

BLEU (Durchschnitt des Niveaus der Sätze)

NIST (komplexere Übersetzungen werden höher gewertet)

WER / PER (Zahl falsch übersetzter Wörter / ohne Beachtung der Wortreihenfolge)

METEOR (beachtet Synonyme und Lemmata)

Maschinelle Übersetzung

(14)

Computergestützte Übersetzung

Hilfe für professionelle Übersetzer

Musterabgleich mit der Datenbank gibt Übersetzungsvorschlag

Könnten maschinelle Übersetzung verbessern

Translation Memories

Terminologie-Datenbanken

Alignment-Tools zum Speicher übersetzter Texte

(15)

Translation Memories

 Zweisprachige Textsegmente (Absatz, Satz)

1. Paare von Referenztexten (Kontext bleibt erhalten) 2. Datenbankorientierte Systeme

(Übersetzungseinheiten in Paaren, ohne Kontext)

 Gefundene Segmente können automatisch übersetzt werden

CAT

(16)

Terminologiedatenbanken

 Mehrsprachige Glossare, Thessauri

Termdefinitionen

Linguistische Analyse

Konkordanzen

Entsprechung

 Einheitliche Verwendung der Terminologie

 Leichterer Zugang zum Inhalt

CAT

(17)

Englisch → Japanisch

I have a pen.

watashi wa pen o motteiru.

Demonstration

(18)

Englisch → Japanisch

Syntaktische Analyse

S

NP

Pron

I

VP

Verb

have

NP

Det

a

Nomen

pen

Demonstration

(19)

Englisch → Japanisch

Ersetzung der Satzeinheiten mittels des Lexikons

Konvertierte Satzeinheiten

(S (NP (pron WATASHI)) (VP (verb MOTTEIRU) (NP (det -) (noun PEN))))

Englisch Japanisch

I watashi

have motteiru

a -

pen pen

Demonstration

(20)

Englisch → Japanisch

Rekonstruierung der Syntaxstruktur und Einfügung der Partikel

Konvertierter Syntaxbaum

(S (NP (pron WATASHI)) WA (VP (NP (det -) (noun PEN)) O (verb MOTTEIRU)))

→ watashi wa pen o motteiru.

Englisch Japanisch

S → NP VP S → NP WA VP

VP → Verb NP VP → NP O Verb

Demonstration

(21)

Englisch → Japanisch

Ergebnisse von den Übersetzungswebseiten

Webseite Ergibnis Beurteilung

SYSTRANet watashi ni pen ga arimasu. WorldLingo watashi ni pen ga aru. Google watashi wa pen o motte. X excite watashi wa pen o motteimasu.

Demonstration

(22)

Englisch → Japanisch

Ergibnisse von den Übersetzungswebseiten

Vergleich mit dem Satz „I have a cousin.“

Webseite Ergibnis Beurteilung

SYSTRANet watashi ni pen ga arimasu. WorldLingo watashi ni pen ga aru. Google watashi wa pen o motte. X excite watashi wa pen o motteimasu.

Demonstration

Webseite Ergibnis Beurteilung

SYSTRANet watashi ni itoko ga imasu. WorldLingo watashi ni itoko ga iru. Google watashi wa itoko ga arimasu. X excite watashi niwa itoko ga imasu.

(23)

Englisch → Japanisch

Semantische Analyse und Syntaktische Verarbeitung

Demonstration

Rekonstruierte Syntaxstruktur Das semantische

Merkmal des Nomens Ausdruck

have + NP

[-Mensch]

S → NP wa VP

VP → NP o motteiru S → NP ni VP

VP → NP ga aru

[+Mensch] S → NP ni VP VP → NP ga iru

(24)

Quellen

K.-U. Carstensen et al. (2004): Computerlinguistik und

Sprachtechnologie. Eine Einführung. Spektrum, Akademischer Verlag, Seite 563 - 571

http://www.globalsecurity.org/intell/systems/mt-techniques.htm

http://www.translationdirectory.com/articles/article1814.php#Automat ic_evaluation

http://de.wikipedia.org/wiki/Terminologie-Datenbank

http://de.wikipedia.org/wiki/Maschinelle_%C3%9Cbersetzung

http://de.wikipedia.org/wiki/%C3%9Cbersetzungsspeicher

http://de.wikipedia.org/wiki/Computerunterst%C3%BCtzte_%C3%9C bersetzung

Referenzen

ÄHNLICHE DOKUMENTE

Judith Anna Braunsteiner (Raumorientierung)... Judith Anna

desministeriums für Unterricht, Kunst und Kultur beschäftigen sich mit der Professionalisierung der pädagogischen Berufe, wobei es im Blick auf eine so genannte

Bei der Auftaktveranstaltung am Donnerstag im Preußensaal zog man Bilanz der bisherigen 15 Treffen, bei denen zwölf Jahre lang das Ostheim beliebter Wiedersehensort

Zugleich wirken evangelische Schulen einer Milieuverengung der hannoverschen Landeskirche entgegen, da sie bewusst offen für alle Schüler und Schülerinnen sind, und

Erstellen Sie mit Autodesk Inventor eine Zeichnung. Dokumentieren Sie

Die derzeitige Entwicklung führt zu der Einschätzung, dass China in den kommenden Jahren bei der Er- schließung und Entwicklung von erneuerbaren Energien zu den international

Die zu geringen Arbeitskapazitäten im Forst- bereich müssen aufgestockt werden, um die mittelfristig wieder steigende Nachfrage nach Holz bedienen zu können. Dazu muss die Wald-

Die Einsprachen verteilen sich auf folgende Themen: Festlegung der Bauzone, Stettenfeld, Natur- und Landschaftsschutzzone, Autal, Moostal, Freizeitgartenzone, die Gebiete Schlipf,