Ausblick auf aktuelle Trends
Web 2.0 (Social Web)
Informationsintegration:
(Web) Content Management und Portale
Service-Orientierte Architektur (SOA)
Grid Computing
Einige Datenbanken-Trends
– neue Datentypen
– relational vs. XML
– Datenbanken als Web Services
Web 2.0 & Datenbanken
Social Web:
Wikis, Blogs, Foren, RSS-Feeds, Mashup
RIA = Rich Internet Applications
Steigende Anforderungen an Datenbanken
– wachsende Datenmenge
– vermehrt gleichzeitig schreibende Zugriffe
– Skalierbarkeit:
Performance (Antwortzeit)
Speicherbedarf
– Caching-Funktionalität für Lesezugriffe
– Verteilung auf mehrere Server
Anforderungen an Datenbanken im Web 2.0
Grid-Computing
– Kapazität während des Betriebs steigern
Weitere Technologien:
– Replikation
– Clustering
– Fail-Over-Funktionen
– Load Balancing
Speicherung und Verarbeitung neuer Datentypen
– Java
– XML
– Multimediale Daten: Videos, Bilder, Audio, Geodaten
Web Publishing
Web-Contentmanagement (WCM)
Kombination ECM (Enterprise Content Management) + WCM
Professionelle WCM-Systeme ab 50.000 $, Enterprise- Lösungen 250.000-400.000 $
Quelloffene WCM-Lösungen kritisch:
– fehlender Support
– keine Investitionssicherheit
– Entwicklungsaufwand
Compliance
– Archivierung des Web-Content aus rechtlichen Gründen
– Umgang mit dynamischen und personalisierten Webseiten
Portalsoftware
Vielfältige Anbieterlandschaft
– Nischenanbieter (z.B. Abaxx, Pironet)
– Best-of-Breed Anbieter (z.B. Hummingbird, Vignette, Opentext)
– Open-Source Produkte (z.B. Plone)
– Standardsoftwaranbieter (SAP, Oracle, Microsoft, IBM)
Portale übernehmen immer mehr Funktionen:
– Webportal für Außendarstellung (CRM, Marketing usw.)
– Enterprise Content Management
– Collaboration Plattform
– Integration von Informationen und Funktionen aus unterschiedlichsten Systemen
– Dokumentenmanagement
Portal-Trends
Ganzheitliche Prozess-Steuerung über Systemgrenzen (Enterprise Application Integration; EAI)
Portlets (Portal + Applet) = kleine wiederverwendbare Webkomponenten
Zugriff auf Backend-Systeme über Portlets
– ERP (Enterprise Resource Planning)
– CRM (Customer Relationship Managemen)
– E-Mails
Standards erforderlich
– Java Portlet Standards: JSR 168, JSR170
– Microsoft: Webparts → www.sharepoint-community.com
Paradigmenwechsel
(SOA)
Service-Konzept
“Eine Menge von aufrufbaren Komponenten deren Schnittstellenbeschreibungen
veröffentlicht und gefunden werden können
(W3C)”
Grid-Vision
Computing als ein Service (Utility)
– Ein Netzwerk von Clients und Service- Providern
Client-Side: Einfachheit
– Anforderung und Bereitstellung von
Informationen und Informationsverarbeitung
Server-Side: Leistungsfähigkeit
– Availability, Reliability, Security
– Kapazität nach Bedarf, Lastverteilung
Virtualisierung
– Service ist höchste Steigerung zu virtual
“Databases are Web Services”
[Jim Gray]
Früher: Business Logik in TP-Monitoren als mittlere Schicht in 3-Tier-Architektur
Webserver & HTTP 3-Tier-Architektur von neuer Bedeutung
Web Clients sind meist Applikationsprogramme (nicht nur Browser)
Screen Scraping zum Datenbezug von Webseiten, aber wachsende Rolle von XML Web Services
Auch Datenbanksysteme können Port 80 abhören und Web Services veröffentlichen (Klassen, Stored
Procedures) somit auch 2-Tier möglich
Aus Sicherheitsgründen 3-Tier weiter sinnvoll
Web Services für Datenbankföderationen
Neue Datentypen
Datenbanken-Community von Information Retrieval (IR) isoliert
Viele Anwendungen
– Große Textbestände
– Daten mit temporale und räumlichen Eigenschaften
Neue Datentypen in erweiterbaren DBMS – Erweiterung des SQL-Standards
Ungenaue Antworten, probabilistisches Schließen (vor allem beim Text Retrieval)
Herausforderung für traditionelle Datenbanken
Noch keine klare Algebra für Integration dieser neuen
XML vs. relational ?
Nicht alle Daten relational
Schema beginnt mit <stuff/> , danach Struktur und Constraints (aber nicht 100%ig zu spezifizieren)
Glaubenskrieg bei DB-Profis:
– „Radikale“: Cyberspace = ein großes XML-Dokument, kann mit XQuery++ manipuliert werden
– „Reaktionäre“: Struktur ist dein Freund! Semistrukturierte Daten sind zu vermeiden!
Integration von DB-Systemen mit File-Systemen
Traditionelle File-Systeme nicht mehr ausreichend (in großen Unternehmen Milliarden von Dateien)
Ausweg: voll indizierte semistrukturierte Datenbank (speziell auch für Abfragen)