• Keine Ergebnisse gefunden

Digitale Kuratierungstechnologien – Verfahren für die effiziente Verarbeitung, Erstellung und Verteilung qualitativ hochwertiger Medieninhalte

N/A
N/A
Protected

Academic year: 2022

Aktie "Digitale Kuratierungstechnologien – Verfahren für die effiziente Verarbeitung, Erstellung und Verteilung qualitativ hochwertiger Medieninhalte"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Proceedings of the Int. Conference of the German Society for Computational Linguistics and Language Technology, pages 138–139, University of Duisburg-Essen, Germany, Sep 30–Oct 2 2015.

Digitale Kuratierungstechnologien

Verfahren für die effiziente Verarbeitung, Erstellung und Verteilung qualitativ hochwertiger Medieninhalte

Georg Rehm DFKI GmbH

Forschungsbereich Sprachtechnologie Alt-Moabit 91c

10559 Berlin

georg.rehm@dfki.de

Felix Sasaki DFKI GmbH

Forschungsbereich Sprachtechnologie Alt-Moabit 91c

10559 Berlin

felix.sasaki@dfki.de

1 Einleitung: Digitale Kuratierung

Das Kuratieren digitaler Informationen, Daten, Meldungen und Medieninhalte hat sich in den vergangenen Jahren als eine grundlegende Tätig- keit mit neuen Anforderungen herauskristalli- siert, die von handelsüblichen Content- Management-Systemen schon längst nicht mehr abgedeckt werden. Kuratieren ist ein komplexer wissens- und zeitintensiver Prozess, in dem Re- dakteure oder interdisziplinäre Teams aus hete- rogenen Quellen ein neues, abgestimmtes Ge- samtwerk entwickeln, das auf einen spezifischen Fokus ausgerichtet ist. Die hierzu erforderlichen Arbeiten umfassen das Auswählen, Zusammen- fassen, zeitliche Einordnen, Internationalisieren, Anreichern, Visualisieren und Erklären der ver- schiedenen Inhalte, wobei insbesondere zu be- rücksichtigen ist, dass Geschwindigkeit, Volu- men und Anzahl der Quellen (Online-Zeitungen, Nachrichtenportale, Twitter, Facebook, Insta- gram etc.) sowie der zu verarbeitenden Informa- tion stetig anwachsen. Ein Beispiel ist die Ent- wicklung eines interaktiven Exponats für ein Be- sucherzentrum, das bei Ausgrabungen gefundene Objekte mit Fotos, Beschreibungen und Zeitan- gaben auf einer Karte visualisiert und die Aus- wahl geeigneter Objekte, Erstellung entspre- chender Inhalte, Gestaltung der Karte und Fest- legung thematischer Perspektiven erfordert.

2 Projektüberblick

Dieser Beitrag gibt einen kurzen Überblick über das Verbundprojekt „Digitale Kuratierungstech- nologien“, an dem die vier in Berlin ansässigen Unternehmen art+com AG, Condat AG, 3pc GmbH und kreuzwerker GmbH sowie das DFKI

als Forschungspartner teilnehmen und das vo- raussichtlich ab dem 1. September 2015 vom Bundesministerium für Bildung und Forschung (BMBF) gefördert wird.1 Das Ziel des zweijähri- gen Vorhabens ist es, die komplexen, von Re- dakteuren und Wissensarbeitern durchgeführten digitalen Kuratierungsprozesse durch Sprach- und Wissenstechnologien zu unterstützen.

Das DFKI wird Komponenten aus diesem Be- reich einbringen und weiterentwickeln und ge- meinsam mit den vier KMU-Partnern zu einer Plattform für digitale Kuratierungstechnologien ausbauen, die Funktionen zur Recherche, Anrei- cherung, Analyse, Kombination (z.B. thematisch, chronologisch, räumlich), Zusammenfassung und Internationalisierung von Inhalten umfasst.

Branchen- und Plattformtechnologien werden die Realisierung branchenspezifischer Workflows und skalierbarer Anwendungen in den jeweiligen Branchen vereinfachen. Die Plattform ermöglicht den Industriepartnern, innovative und effizienz- sowie qualitätssteigernde Lösungen für vier un- terschiedliche Branchen (Museen und Showrooms; TV-/Radio und Web-TV; Verlage und Medienhäuser; Archive und Bibliotheken) effizienter zu entwickeln, zu betreiben, zu integ- rieren und zu verwerten.

Die vom Forschungspartner DFKI eingebrachten Technologien umfassen Methoden, Komponen- ten und Ansätze aus dem Gebiet der Sprach- und Wissenstechnologien, die im Rahmen zahlreicher Projekte wie z.B. ATLAS, COLLATE, LT Web, META-NET, QTLaunchPad, EuroMatrix, Eu- roMatrixPlus und Trendminer (BMBF, BMWi,

1 Siehe http://artcom.de, http://condat.de, http://3pc.de, http://kreuzwerker.de sowie http://dfki.de/lt.

138

(2)

EU/EC etc.) entwickelt wurden. Diese Methoden können den folgenden drei Bereichen zugeordnet werden:

1. Semantische Analyse: Tiefe Analyse mit ho- her Präzision und der Möglichkeit zur Adap- tion an verschiedene Domänen am Beispiel von Informationsextraktion (Zeiten, Orte, Themen, generische benannte Entitäten), au- tomatische Textzusammenfassung, Senti- ment-Analyse sowie Klassifikation und Clustering von Informationen.

2. Semantische Generierung: Unterstützung des Storytellings durch Text-, Hypertext- und Reportgenerierung für ausgewählte Typen von Dokumenten auf Basis von Verfahren zur Informationsextraktion und generischen Textschemata, die z.B. als thematische oder textsortenspezifische Strukturgrammatiken repräsentiert werden.

3. Mehrsprachige Technologien: Robuste und adaptierbare Komponenten für maschinelle Übersetzung sowie Integration verschiedener Wissensquellen unter Berücksichtigung der Kuratierungs-Workflows bei den Industrie- partnern für eingehende (Inbound- Translation) und zu publizierende Dokumen- te (Outbound-Translation) sowie Integration mono- und multilingualer Linked-Open- Data-Quellen (LOD).

3 Technologieplattform

An dieser Stelle soll die Bedeutung der Techno- logieplattform im Rahmen der Wertschöpfungs- kette hervorgehoben werden. Je nach Anwen- dungsfall und Branche fällt die Wertschöpfungs- kette zur Kuratierung von Inhalten unterschied- lich aus. Es sind drei Arten von Akteuren zu un- terscheiden:

• die kuratierende Institution, z.B. Museum, Fernsehsender, Verlag oder Archiv;

• Dienstleister/Agenturen, die für die kuratie- rende Institution Inhalte und Technologien bereit stellen bzw. Komplettlösungen entwi- ckeln (z.B. die vier KMU-Partner);

• an der Kuratierung beteiligte Redakteure und Wissensarbeiter, z.B. interne Mitarbeiter o- der Dienstleister, aber auch externe Wissen- schaftler, Experten oder Freiberufler.

Die Plattform für digitale Kuratierungstechnolo- gien soll diesen unterschiedlichen Akteuren eine umfassende Menge von Funktionalitäten bieten, die den Kuratierungsprozess unterstützen. Durch den Einsatz von Sprach- und Wissenstechnolo- gien können einzelne, bisher noch rein manuell

bzw. intellektuell durchgeführte Kuratierungstä- tigkeiten (teil-)automatisiert werden. Die Akteu- re können durch die Nutzung der Plattform grö- ßere Mengen an Inhalten schneller sichten und weiterverarbeiten. Mit der Technologieplattform wird eine deutliche Effizienzsteigerung und Kos- tensenkung des Kuratierungsprozesses angestrebt – bei gleichbleibender oder sogar verbesserter Qualität. Dabei können, wie in Abb. 1 darge- stellt, vier Schichten unterschieden werden, näm- lich Kernkomponenten der Sprach- und Wissens- technologie, allgemeine Kuratierungskomponen- ten, allgemeine Plattformkomponenten sowie Branchentechnologien.

Abbildung 1: Plattform für Kuratierungstechnologien

Das DFKI wird die bereits vorhandenen Kompo- nenten so weiter entwickeln, dass sie den Anfor- derungen der anderen Schichten genügen und von den Industriepartnern in ihre jeweiligen Branchenlösungen integriert werden können. Die Industriepartner wiederum konzipieren und ent- wickeln generische Technologiekomponenten, die für ihre Branchenanwendungen benötigt werden, aber auch in anderen Lösungen einge- setzt werden können. Wir fokussieren insbeson- dere die folgenden Zielmerkmale der Plattform:

• Vollintegrierte robuste, performante und ska- lierbare Komponenten mit offenen APIs für eine effiziente Einbettung in branchenspezi- fische Kuratierungs-Workflows;

• Einfache Nutzbarkeit der Cloud-Plattform durch browserbasierte SaaS-Webarchitektur;

• Anwendungsorientierte Branchenlösungen mit hoher Usability (User Interfaces, Interak- tionsdesign, Informationsvisualisierung).

4 Schlussfolgerungen

Unsere grundlegende Arbeitshypothese ist, dass der gezielte Einsatz sprachtechnologischer Ver- fahren digitale Kuratierungsprozesse deutlich effizienter und produktiver gestalten kann und sind überzeugt, diese Hypothese gemeinsam mit den KMU-Partnern im Rahmen des hier knapp skizzierten Vorhabens verifizieren zu können.

Sprach- und Wissenstechnologien Kuratierungstechnologien

Branchentechnologien

Plattformtechnologie

Branchenlösungen

139

Referenzen

ÄHNLICHE DOKUMENTE

Denn das vor über 70 Jahren gegründete Unter- nehmen für Brunnenbau und Schneckenbohrpfahltechnik stammt ursprünglich aus den Niederlanden, die mit ihren sandigen und moorigen

Davon versprechen sich die Verantwortlichen vor Ort nicht nur neue diagnostische Erkenntnisse, sondern auch zahlrei- che Vorteile für die Patienten – durch eine deut- liche

Alle FIPRON-Produkte haben einen unbegrenzten Anwendungsbereich, da sie in jedem Bereich oder an jedem Ort eingesetzt werden können, an dem eine elektrische Verbindung besteht..

Im AlleAktien DCF-Modell berechne ich den Wert von Medpace anhand der zukünftigen Gewin- ne, die das Unternehmen erwirtschaftet. Ich nehme dabei an, dass Medpace in Zukunft stark

Durch den neuen Stellar-Detektor kann das System die Strahlung nicht nur noch effizienter nutzen, sondern auch das Bildrau- schen weiter reduzieren sowie den Kontrastumfang

Die Halterungen für Instrumentenabwurfbehälter (siehe Abb. oben links) bestehen aus dem bruchfestem Hochleistungskunststoff HDPE. Sie sind einfach und schnell an Euro-

Der MULTIVAC Smart Hub ist eine gesicherte Microsoft Azure Umgebung, in der Ihre Daten 24/7 für die Über- wachung, Steuerung und Optimierung Ihrer Produktion durch die

Intelligen- te Gebäude der Zukunft sind zwar mit digita- len Lösungen ausgestattet, aber erst wenn diese von Unternehmen und öffentlichen Trägern für die Steuerung zentraler Prozesse