Darstellung von Informationsquellen
!"#$
%&'
Daten im Netz
Textbasiert RTF
ASCII
Semistrukturiert HTML XML
Binär:
Word
Postscript Strukturiert:
Datenbanken Binär:
A/V
)*
+
,-./012-3456-078
9/03:;
HTML
=>
?
@ABCDEFAGHIJADKL
MCDGNO
Hypertext Markup Language
P
Dominierende Sprache zur Auszeichnung von Dokumenten im Internet
P
Definiert vom World Wide Web Consortium, W3C:
Q
MIT
Q
INRIA
Q
Keio University
R
Jedes Informationssystem im Netz muss:
S
HTML Informationen integrieren können
S
HTML Ausgaben erzeugen
T
Mit HTML-Mitteln mit Nutzern interagieren
VW
X
YZ[\]^_Z`abcZ]de
f\]`gh
Hypertext Markup Language
i
Konzepte:
j
Informationen werden als Dokumente aufgefasst
k
Dokumenteninhalte werden als Klartext dargestellt
k
Dokumententeile werden durch Tags ausgezeichnet
l
Inhaltlich (<h1>Einleitung</h1>, <em>wichtig</em>)
m
Gestalterisch (<b>wichtig</b>)
n
Dokumente werden durch Links zu einem Hypertext verbunden (dem Web)
oqp p rts u rv s w
rv s w rv s wx p p
rts uzy rv s w rv s w
rv s wy oqp p rts u rv s w
rv s w rv s wx p p
rts uzy rv s w rv s w
rv s wy
Quellanker
mit Ankertext Zielanker
Mit Ankertext
Link
|}
~
HTML
Sprache umfaßt
Elemente (wie <h1>)
<h1>Neue Vorlesungen</h1>
<br>
<hr>
Attribute (wie bei <hr height="3">)
Entitäten (wie &)
Grammatikalische Regeln über Elemente (<html> ist
Startsymbol, darin die Elemente <head> und <body>)
¡¢£
¤¥¦
HTML Beispiel/1
§ ¨ © ª« ¬ ®¯ ° ¬± ² ®³ ´ ²µ « ¶ · · ¸ ¹«
· · © ¬ © ° ¬± ²º¼» ½¾ ¬À¿ ÁÂà ÄÅ ÄtÆ Â Á Ç · ·¯ ÈÉ
§
ÊÅ
Ë ÇÌÉ
§ ÊÎÍ Á ÏÉ
§Å ÄÅ ÇÍ É Ð³ ¶ ´
Í ¿ Ç ÄÂÑ µ ÂÃ Å ÄÅÌÒ Å ÓÔ ¿ µ Â Ó
Æ ¿ Ë ÁÅ Ä Õ § ·
Å ÄÅ ÇÍ É
§ Ö ÁÃ Í Ê¿ Í ÓØ× Ù ÊÅ ÅqÚ Ñ · ·ÜÛ Û Û
» ÄÂ Ó
» Ó
Ò ¶ Ö
Í ¿ Ç ÄÂ
» ÏÎÍ Ù
É
§ · ÊÎÍ Á ÏÉ
§ Ö
Æ ÏÜÝ É
§
Ú É § Á Ê¿ Í ÓØ× Ù ÊÅ ÅqÚ Ñ · ·Û Û Û
» Ó
Ò ¶ Ö
Í ¿ Ç ÄÂ
» ÏÎÍ · Ù
É Ð¿ Í ÄÍ ³  ÄÀÞ Í ¿Ã ÄÅ ß ÁÒ Ë ÇÜà Å
´
Í ¿ Ç ÄÂ § · ÁÉ § Ö¿ É
§ Á Ê¿ Í ÓØ× Ù ÊÅ ÅqÚ Ñ · ·ÜÛ Û Û
» Ë Á
Å Ê
» Ó
Ò ¶ Ö
Í ¿ Ç ÄÂ
» Ï
Í · ÙÉ Ð Áá Ê Ö
Í ¿ Í Äá Ê ± Á
Å ÊÎÍ Ë ÁÅ Ä Õ
Ò Â Ï µ Â Ó
Æ ¿ Ë ÁÅ Ä Õ § · ÁÉ § ·
Ú É
§
ʾ
É µ
ÂÃ
Å ÄÅÒ Å Ó ß
Ò Ò Ë Çà ¿ µ Â Ó
Æ ¿ Ë Á
Å Ä Õ § · ʾ
É
§
Ú É § Á Ê¿ Í ÓØ× Ù ÊÅ ÅqÚ Ñ · ·Û Û Û
» ÄÂ Ó
» Ó
Ò ¶ Ö
Í ¿ Ç ÄÂ
» ÏÎÍ ·ÄÂ ÏÍâ ã
Í Â
» ÊÅ Ë Ç ÙÉ °tÆ ËÍ Ú Áä Í
ÄÂ ¯ Â ä Ç Ä
Ã Ê § ·
ÁÉ
» § ·
Ú É
æç
è
éêëìíîïêðñòóêíôõ
öìíð÷ø
HTML Beispiel/2
ù úÎûü ý ýþ ÿ û þ ÿ ÿû ÿ ÿ û û þ û ý þ ü
ù ü þ ú ÿ ÿ û û þ
þ û û Îþ ù
ÿ
þ þ ü
ù û
ü ù úÎû ÿ þ
ù ÿ ÿ þ ÿ
þ ÿ ýþ þ ! ý þ ÿ ! ! " þ
ù úÎû ÿ
ù û
ü
ù ÿ ÿ þ Îþ ýþ ÿ
þ þ ü " þ ú
ú
þü
þ
ù ÿ ÿ þ Îþ ýþ û ý "
þ
ú
ú
þü
þ
ù úÎûü ý
ù
# $ ÿ þ Îþ %þ þ ù
ù &
'
þü þ ü û (
þ $ ÿ ù ü þ ú
ÿ ÿ ú
ú
þü þ *) û $ ü û (
þ $ ÿ ÿ ý
ü û ü ý ý þü ù
ü
þ þ þü ý ú
þ Îþ + ü
þ ÿ
þ ý , ÿ ÿ ÿ ú þ -. ÿ
þ
þ ýþ ÿ
þü ú
þü þ "þü û
þ / ù
ù û
ù ÿ ý
12
3
456789:5;<=>58?@
A78;BC
HTML – Elemente für Struktur
D
Struktur
E
!DOCTYPE gibt Art des Dokuments an:
<!DOCTYPE HTML PUBLIC
-//W3C//DTD HTML 4.01 Transitional//EN>
F
<html>…</html> umfaßt Dokument
F
<head>…</head> enthält Informationen zur Seite
F
<body>…</body> umfaßt Inhalt der Seite
G
Festes Seitenschema:
<!DOCTYPE…>
<html>
<head>…</head>
<body>…</body>
</html>
IJK
L
MNOPQRSNTUVWNQXY
ZPQT[\
HTML – Elemente im Kopfteil
]
<base> enthält Basis-Adresse der Seite
]
<title> enthält Titel der Seite
^ _ ` _ acb d ef g h
b i a `cj k l
j m _ ` _n _ op i l
j orq is t _ `u ^ v _ ` _ ab d
w
<meta> enthält
x
Inhaltsklassifikation der Seite
<meta scheme="ISBN" name="identifier"
content="0-8230-2355-9">
y
oder Protokollinformation
<meta http-equiv="Expires"
content="Tue 24 Sep 2002 00:00:00 GMT">
z
<link> gibt Beziehung zu anderer Seite an
<link rel="Glossary" href=" URL ">
||}
~
HTML – Elemente für Gestaltung
Umbruch, Trennungen wbr br nobr p spacer Neue<br>Zeile
Schriftarten
b i s strike tt u blink bdo marquee Das ist <b>wirklich wichtig</b>
Schriftauszeichnung
abbr acronym cite code del dfn em ins kbd samp strong var ruby rt rb
Formeln sub sup
Schriftgröße
basefont font big small
¡¢£
¤¥¦
HTML – Elemente für inhaltliche Strukturen
§
Überschriften h1 h2 h3 h4 h5 h6
<h2>Aktuelle Meldungen</h2>
§
Blöcke
comment hr div span address pre xmp
plaintext listing blockquote q banner multicol center
<center>Blah blah bla <hr> blah
blah</center>
©ª«
¬
®¯°±²³®´µ¶·®±¸¹
º°±´»¼
HTML – Elemente für inhaltliche Strukturen
½
Listen : ol ul dir menu li dl dt dd
¾
<font SIZE=+1>Allgemeines</font> <p>
<ul>
<li><a HREF="/inst/ag-sek/index.html"
>Institutsleitung</a>
<li><a HREF=
"/inst/lageplan.html">Lageplan</a>
<li><a HREF=
"
¿ÁÀ À ÂÃ Ä ÄÆÅ Å Å Ç ÈÉ À ¿ Ç ÊÌË Í ÎÐÏ Ñ ÒÓ Ô Ç ÕÏ ÄÐÖ Ó× Í ÓÎ Ô ÀÄ Ï ÒÏ ÊÆØ Ô"
>Telefonverzeichnis</a>
<li><a HREF="/inst/announce/index.html"
>Vorträge</a>
<li><a HREF=
"
¿ÁÀ À ÂÃ Ä ÄÆÅ Å Å Ç ÈÉ À ¿ Ç ÊË Í ÎÐÏ Ñ ÒÓ Ô Ç ÕÏ ÄØ Ñ × Ä Ê ÑÉ Ë Ï Ô ÓÄ Ô ÕÏ Ù Ç ¿À È Ò"
>Frauenbeauftragte</a
</ul><p>
ÛÜÝ
Þ
ßàáâãäåàæçèéàãêë
ìâãæíî
HTML – Elemente für inhaltliche Strukturen
ï
Tabellen
table th tr td thead tbody tfoot col colgroup
ð
<table border="1">
<tr><th align="center">Währung</th>
<th align="center">1 EUR</th></tr>
<tr><td>Deutschland (DEM)</td>
<td align="right">1,95583</td></tr>
<tr><td>Frankreich (FRF)</td>
<td align="right">6,55957</td></tr>
</table>
ñ
Abbildungen img overlay
caption map area Frankreich (FRF) 6,55957 1,95583 Deutschland (DEM)
1 EUR
Währung
óôõ
ö
÷øùúûüýøþÿøû
úûþ
HTML – Elemente für Interaktion
Formulare
form input select option textarea
htmlarea button label fieldset legend
<form ACTION="/cgi-bin/telefon"
METHOD="GET">
<i>Die Nummer von</i>
<input NAME="x" VALUE="" SIZE=30>
<input TYPE="submit" VALUE="bitte">
</form>
Formularverarbeitung
Client
Client URL URL Server Server
Programm Programm Datenbank
!" # $ %& '(%& '( %& & ) *+ , -/. 01 2 3
"
http://www.x.y/cgi-bin/telefon?x=Meier
SELECT ....
x=Meier
<i>Meier</i>: -4711
567
8
9:;<=>?:@ABC:=DE
F<=@GH
HTML – Elemente für komplexe Darstellung und Inhalte
I
Browserdarstellung
style frameset frame iframe noframes layer ilayer
I
Applets, Skripte und Objekte
applet param textflow script noscript object embed bodytext
J
Hyperlinks a
K
Zielanker:
<a name="lokal">Zielankerbeschriftung</a>
K
Quellanker:
<a href="Zielanker">Quellankertext</a>
<a href=
"http://x.y.com/seite.html#lokal"
>Quellankertext</a>
MNO
P
QRSTUVWRXYZ[RU\]
^TUX_`
Dokumentenadressen - URLs
a
Uniform Resource Locator definiert eine Syntax für eindeutige Bezeichner im Internet
a
Internet Dienste sind (zumeist) definiert durch
b
Aufgabe
c
Portnummer auf dem der Dienst angeboten wird
c
Transportprotokoll (TCP oder/und UDP)
c
Protokoll
d
Z.B.: Web Dienst
e
Übertragen von HTML Seiten
e
Port 80
e
TCP
e
HTTP
f
Z.B.: Usenet Dienst
g
Übertragen von News
h
Port 119
h
TCP
h
NNTP
jkl
m
nopqrstouvwxoryz
{qru|}
URL
~
Uniform Resource Locators sind syntaktische Vereinheitlichung von Dienstbezeichungen:
http://grunge.cs.tu-berlin.de:8000/
ftp://ftp.cs.tu-berlin.de/pub/net/www mailto:tolk@cs.tu-berlin.de
~
Form:
http://grunge.cs.tu-berlin.de:8000/resource/data.html#top
Bedeutung ist von Protokoll abhängig, URL ist nur als Syntax definiert
Protokoll Rechnername
Portnummer
Pfad
Resource
Referenz
Information aus HTML-Seiten erschliessen
Erschliessen des Hypergraphen selber
Crawling
Erschliessen der Dokumente
HTTP Protokoll über Internet
Erschliessen der Inhalte von Seiten
Extraktion aus HTML-Text
Nutzung der Informationen in Tags (<address>, <title>)
Problem: Semantik der Inhalte
Wie extrahieren ("Produkt" etc.)
Markierung nutzen (<address>, <h*> etc.)
Gestaltung (Bilder, Framesets etc.)
¡
¢
£¤¥¦§¨©¤ª«¬¤§®¯
°¦§ª±²
XML: Sprache zur Definition von
Auszeichnungssprachen
´´µ
¶
·¸¹º»¼½¸¾¿ÀÁ¸»ÂÃ
ĺ»¾ÅÆ
Auszeichnungssprachen
Ç
Auszeichnungssprachen fügen Markierungen zu einem Text hinzu
Ç
Beispiel HTML:
<U>Robert Tolksdorf</U>
<ADDRESS>
TU Berlin<BR>
FR 6-10<BR>
Franklinstr. 28/29<BR>
D-10578 Berlin<BR>
</ADDRESS>
È
Tags haben logische oder visuelle Bedeutung
ÊËÌ
Í
ÎÏÐÑÒÓÔÏÕÖ×ØÏÒÙÚ
ÛÑÒÕÜÝ
Auszeichnungssprachen
Þ
Kann es eine universelle Auszeichnungssprache geben?
ß
Alle visuellen und sonstigen Möglichkeiten aller Ausgabegeräte müßten durch Tags steuerbar sein
à
Alle semantischen Konzepte aller Domänen müßten durch Tags repräsentierbar sein
à
Alle notwendigen Granularitäten der Auszeichnung müßten unterstützt werden:
á â ãä åæ ç çæ èêé é é â ë ãä åæ ç çæ è
á â ãä åæ ç çæ è â çì å ã ç çæ èêé é é â ë çì å ã ç çæ è â í åì èêé é é â ë í åì è
â ë ãä åæ ç çæ è
á â ãä åæ ç çæ è
â çì å ã ç çæ èêé é é â ë çì å ã ç çæ è
â í åì è â îï ð èêé é é â ë îï ð è â í åì çñ ãò æ èêé é é â ë í åì çñ ãò æ è â ë í åì è
â ë ãä åæ ç çæ è
ó
Nein: Anwendungsspezifische Auszeichnung nötig
õö÷
ø
ùúûüýþÿúúý
üý
XML als Ergebnis der HTML Entwicklung
?
!"#
$
%&'()*+&,-./&)01
2(),34
XML Q&A
5
Was ist XML?
Die Extensible Markup Language ist die Definition einer Untermenge von SGML, mit der man einfach Auszeichnungssprachen definieren kann
6
Woher kommt XML?
XML ist ein Standard des World Wide Web Konsortiums W3C
7
Was macht man mit XML?
Anwendungsspezifische Auszeichnungssprachen definieren und standardisieren
7
Was ist der Vorteil von XML-basierten Auszeichungssprachen?
Standardisierung ermöglicht Datenaustausch
9:;
<
=>?@ABC>DEFG>AHI
J@ADKL
Abfragesprachen
Auszeichnungssprachen
XML-QL
XQL XHTML
WML
XML-EDI
Darstellung Verarbeitung
Browser XML XSL
Kernstandard
Namespaces XML
XLink XPointer
M NO
P N
QRS T U
QOV
WYXU[Z\ S
QOV
M
S T
Z] ^
S ] _
Z]
QOV
RS ` aZ `
QOV
b
cd Te `Z]
Mf M
b
cd Te `Z] g M P O S T
UOV
h U[Z\ OV
Wi j
QOV
W
Tk l[Z a U[Z Z T a
XML
nop
q
rstuvwxsyz{|sv}~
uvy
XML basierte Auszeichnungssprachen
Document Type Definition
Eine XML-basierte Sprache wird durch eine XML-DTD (Document Type Definition) definiert
Eine DTD enthält
Definitionen gültiger Elemente (Tags) der Sprache
Definitionen von Attributen der Elemente und deren Typen
Definitionen von Kürzeln (Entitäten)
Grammatikregeln
¡¢£¤¥¦¡§¨©ª¡¤«¬
£¤§®¯
Beispiel: AdressenML
°
Elementdefinitionen und Grammatikregeln:
<?xml version="1.0" encoding="UTF-8"?>
<!ELEMENT ADRESSBUCH ANSCHRIFT*>
<!ELEMENT ANSCHRIFT (NAME,
(STRASSE | POSTFACH)?, ORT)>
<!ELEMENT NAME ANY>
<!ELEMENT STRASSE ANY>
<!ELEMENT POSTFACH ANY>
<!ELEMENT ORT EMPTY>
±
Beispiel:
² ³´ µ¶ · ·¸ ¹ º» ¼ ² ³½ · º» µ¾ ¿À ¼ ²½ ³Á ¶ ¼ µ[ ÃÅÄ Æ Ç
À  ÈÉ Ê ËÂ Æ Ì ² ͽ ³Á ¶ ¼
² ·À µ ³ · ·¶ ¼ ¿ ÆÎ Ï
É ÈÐ Ï Ê Ç ÆÒÑ ÓÔ Í ÓÕ ² Í ·À µ ³ · ·¶ ¼
Ö ×Ø Ù ÚÛ Ü[Ý Þ ßà á âã Þ äå æç Ý Þè éê ëì í Þ îðï
Ö îå ä ñò óØ ôõ Ùï Ö îå öØ ç ñ ñè ÷ò óï
øùú ûüþý ÿ ü ÿ ÿ ÿ ÿ
ý ü ý ÿ ÿ
Beispiel: AdressenML
Attributdefinitionen:
<!ATTLIST ORT
PLZ CDATA #REQUIRED NAME CDATA #REQUIRED LAND CDATA #IMPLIED>
Weiter möglich: Defaultwerte Mögliche Datentypen:
!
CDATA : Zeichenkette
"
ID : Eindeutiger Bezeichner
"
IDREF : Referenz auf ID
"
Selbstdefinierte Token
# $% & &' ( ) & *+ , )- .
/+ )0
1' + 0 1 & 243 56 6 78 9 5: ; <
8 9 5: <=
>? ?A@ B CED ?GF HI J KML N O N
? BQPF H RS T HF U H
?
P@
BQVW X
Z[\
]
^_`abcd_efgh_bij
kabelm
Beispiel: AdressenML
n
Kürzeldefinitionen:
<!ENTITY TubStrasse "Franklinstr. 28/29" >
o
Im Dokument:
<STRASSE>&TubStrasse;</STRASSE>
p
Zusätzlich auch DTD-weite Kürzel
qQr s t s u sGv rw xy qMz {w r v tQ| r v s
y z s
~
Wohlgeformtheit und Validität
Wohlgeformtheit:
Einhaltung der XML-Regeln, z.B.
Attributwerte in " eingeschlossen
Groß- und Kleinschreibung relevant
Alle Elemente sind geschlossen
(Als Abkürzung: <STRASSE></STRASSE> = <STRASSE/> )
Korrekte Schachtelung von Elementen
Validität:
Es gibt eine DTD zu einem XML-Dokument
Das XML-Dokument folgt den Regeln seiner DTD
¡¢£¤¥¦§¡¨©
ª ¡¤«¬
Mehrere XML-Sprachen in einem Dokument
Dokumentenfragmente in unterschiedlichen Sprachen sind kombinierbar
Möglichkeit 1: <element xmlns ="URN"> legt fest, daß
<element> ... </element> und alle Tags darin aus der durch URN bezeichneten XML-Sprache stammen
sollen
®
<notes>
<p xmlns="urn:w3-org-ns:HTML">
This is a <i>funny</i> book!
</p>
</notes>
No tiz en sp rac he HT M L
°±²
³
´µ¶·¸¹ºµ»¼½¾µ¸¿À
Á·¸»ÂÃ
Mehrere XML-Sprachen in einem Dokument
Ä
Möglichkeit 2: <element xmlns:name="URN">
definiert ein Präfix name , das allen Tags aus der durch URN bezeichneten XML-Sprache vorangestellt werden
Å
<notes xmlns :webml="urn:w3-org-ns:HTML"
xmlns:math="urn:w3-org-ns:MathML">
<webml:p>
This is a <webml:i>funny</webml:i> book with <math:apply><math:power/>
<math:ci>10</math:ci><math:ci>2</math:ci>
</math:apply> pages!
</webml:p>
</notes>
ÇÈÉ
Ê
ËÌÍÎÏÐÑÌÒÓÔÕÌÏÖ×
ØÎÏÒÙÚ
XML Linking Language (XLink)
Û
Einfache Links in HTML mit dem <A> -Element
Û
Ein Quellanker, ein Zielanker
Û
Unidirektional
Û
Ungetypt
...
- III Prozesswissenschaften - IV.Elektrotechnik und
Informatik
… Die
Fakultät IV der
TU Berlin
ÝÞß
à
áâãäåæçâèéêëâåìí
îäåèïð
XML Linking Language (XLink)
ñ
Fortgeschrittene Hyperlinks
ñ
Ein Quellanker, n Zielanker
ñ
Bidirektional (hat Teile, ist Teil von)
ñ
Getypt (ist Bestandteil von)
ñ
Extern zu Dokumenten
... - III Prozesswissenschaften - IV.Elektrotechnik und
Informatik
… Die Fakultäten
der TU Berlin
Organisatorische
Einheiten
óôõ
ö
÷øùúûüýøþÿøû
úûþ
Einfache Links
Annahme: xlink Namespace an
http://www.w3.org/1999/xlink gebunden:
xmlns:xlink="http://www.w3.org/1999/xlink"
Einfacher Link:
<link xlink:type="simple"
xlink:href="http://iv.tu-berlin.de">
Elektrotechnik und Informatik</link>
Extended Links
Erweiterte Links stehen in einem Container bei dem type="extended" gilt
Ein erweiterter Link verbindet eine beliebige Anzahl von Resourcen
Elemente im erweiterten Link beschreiben
beteiligte Resourcen
Links zwischen Resourcen
Attribute
!
role: URI einer Resource die die Art des erweiterten Links beschreibt (informelle Typisierung)
"
title : Lesbare Kurzbeschreibung des erweiterten Links
$%&
'
()*+,-.)/012),34
5+,/67
Extended Links
8
<elink xlink:type="extended">
9 :; < = > :; < =@? AB CD E FG HI J K HL F
M
G N O P@Q RL S T E
FG N U KWV M X
G Y N N N F M
G N O P@Q G J Z S
G E F T J P N N N F
M
G N O P@Q K N K
G S E F\[ L H] S U U^ N U U S O UI
R J T K S O F _a`
b
G N O P M
G N O P@Q Kc d S E FG HI J K HL F
M
G N O P@Q RL S T E
FG N U KWV M X
G Y N e F M
G N O PQ G J Z S
G E F T J P N e F
M
G N O P@Q K N K
G S E F\f G S P KL H K
SI
R O N P g O h i O T HL X J K N P F _
`
b
G N O P M
G N O PQ Kc d S E F
JL I F
M
G N O P@Q T
L H X E F T J P N N N F M
G N O PQ K H E F T J P N e F
M
G N O P@Q U R H^ E FL S d
G JI S F
M
G N O P@Q JI K g J K S E F H O j Sk g S U K F _a`
b _ S
G N O P
`
mno
p
qrstuvwrxyz{ru|}
~tux
Erweiterte Links - Resourcen
Lokal im erweiterten Link:
@
@
@
¡ ¢ £
¤ a¥
£
¤
¦ §
¥ ¢ ¨© ª
«
Entfernt in anderen Dokumenten:
¬ ® ¯ ° ±
®
¯ °@² ³´ µ¶ · ¸ ¹º » ³ ¹¼ ¸
± ® ¯ °² ½¼ ¶ ¾ · ¸ ® ¿ ³WÀ ± Á Â
® ® ® ¸ ± ® ¯ °² » ö · ¸ ¾ » °® ® ® ¸
± ® ¯ °² ³
® ³ ¶ · ¸\Ä ¼ ¹Å ¶ ¿ ¿Æ ® ¿ ¿¶ ¯ ¿º
½ » ¾ ³¶ ¯ ¸ ÇaÈ
¬ ® ¯ ° ±
®
¯ °@² ³´ µ¶ · ¸ ¹º » ³ ¹¼ ¸
± ® ¯ °² ½¼ ¶ ¾ · ¸ ® ¿ ³WÀ ± Á Â
® É ¸ ± ® ¯ °@² » ö · ¸ ¾ » °® É ¸
± ® ¯ °² ³
® ³ ¶ · ¸\Ê ¶ ° ³¼ ¹ ³
¶ º ½ ¯
® ° Ë ¯ Ì Í ¯ ¾ ¹¼ Á » ³
® ° ¸ ÇaÈ
ÏÐÑ
Ò
ÓÔÕÖ×ØÙÔÚÛÜÝÔ×Þß
àÖ×Úáâ
Erweiterte Links – Resourcen: Attribute
ã
role : URI einer Resource die die Art der Resource beschreibt (informelle Typisierung)
ã
title : Lesbare Kurzbeschreibung der Resource
ã
label : Bezeichner der Resource im erweiterten Link
ä
href : URI der Resource bei type="locator"
æçè
é
êëìíîïðëñòóôëîõö
÷íîñøù
Erweiterte Links - Arcs
ú
Drei Arten von Links möglich
û
Lokal – Entfernt
ü
Entfernt – Entfernt
ü
Entfernt – Lokal
ý
<link xlink:type="arc"
xlink:from="fakultaeten" xlink:to="fakiii"
xlink:show="replace"
xlink:actuate="onRequest" />
þ
<link xlink:type="arc"
xlink:from="fakiii" xlink:to="fakiv"
xlink:show="replace"
xlink:actuate="onRequest" />
Erweiterte Links – Arcs: Attribute
arcrole : URI einer Resource die die Art des Links beschreibt (informelle Typisierung)
title : Lesbare Kurzbeschreibung des Links
from : Bezeichner der Resource im erweiterten Link, bei der der Link beginnt (dort mit label markiert)
to : Bezeichner der Resource im erweiterten Link, zu
der der Link geht (dort mit label markiert)
!"#$%&
'!()
Erweiterte Links – Arcs: Attribute
*
show : Wie das Linkziel angezeigt werden soll:
+
new: In neuen Anzeigekontext laden (Fenster, Frame, … Ähnlich Verwendung von target="_blank")
,
replace: Aktuellen Anzeigekontext ersetzen (ähnlich target="_self")
,
embed: In aktuellem Anzeigekontext ersetzen (wie <img>)
-
other: Kontext- und anwendungsabhängig
-
none: Keine Festlegung
.
actuate : Zeitl. Verhalten der Link-Traversierung
/
onLoad: Sofortiges Traversieren (wie <img>)
/
onRequest: Nach Anforderungsereignis (z.B. Click)
0
other : Kontext- und anwendungsabhängig
0
none : Keine Festlegung
234
5
6789:;<7=>?@7:AB
C9:=DE
XML Base
F
XML Dokumente können das Attribut xml:base verwenden
F
Definiert explizit die Basisadresse (URI), die zur Auflösung relativer Verweise benutzt wird
G
Basisadresse eines Elements ist
HJI
die explizit mit xml:base definierte
K
I
die URI des umgebenden Elements
L
I
die URI des beinhaltenden Dokuments
NOP
Q
RSTUVWXSYZ[\SV]^
_UVY`a
Erschliessung von XML Dokumenten
b
Klare formale Definition der Syntax und klare Forderung nach deren Einhaltung
b
Tools müssen wohlgeformte Dokumente parsieren können
b
Tools können anhand der DTD Validität prüfen
b
Eigene Sprachen können formal sicher definiert
werden
def
g
hijklmniopqrilst
uklovw
XML-basierte Sprachen
yz{
|
}~~ ~
XML-basierte Sprachen
Der eigentliche Gewinn durch XML entsteht durch die Standardisierung einer Sprache zur Definition von
Auszeichnungssprachen
Der eigentliche Gewinn durch domänenspezifische Auszeichnungssprachen ist ihre Standardisierung
Standardisierung für
einheitliche Darstellung
Austauschbarkeit von Daten
¡
¢£¤
Formelsatz
Mathematical Markup Language MathML ist Auszeichnungssprache für mathematische Formeln (www.w3.org/TR/REC-MathML)
¥ ¦§ ¨ © ª«
¦ ¨¬ ¬ ¯® «
¦° ±§ ²«
¦ ³¯´ ¨µ « ¦¶ ·« · ¦ ²¶ ·« ¦ ² ³¯´ ¨µ «
¸ ¹»º ¼ ¹½ ¾
½ ¿À ¸Á ÂÀ à ¸ ÄÁ ÂÀ ¸ Ä ¹»º ¼ ¹½ ¾
½ ¿À
¸Å Æ ¹½ ¾
½ ¿À ¸Á ÂÀ Ç Ã Ã ¸ ÄÁ ÂÀ ¸ ÄÅ Æ ¹½ ¾
½ ¿À
¸È Æ Æ ¹¯É À
¸
ƺ
¼ ÊË ÄÀ
¸Á ½ À Ì ¸ ÄÁ ½ À
¸Á ½ À ½ ¸ ÄÁ ½ À
¸ ÄÈ Æ Æ ¹¯É À
¸ ÄÈ Æ Æ ¹¯É À
¸ Ä ¾È ¿ ÍÀ
Es existieren erste Browsererweiterungen und Autorenwerkzeuge
∑ = 100
i 0
x i
ÏÐÑ
Ò
ÓÔÕÖ×ØÙÔÚÛÜÝÔ×Þß
àÖ×Úáâ
Multimediapräsentationen
ã
SMIL (Synchronized Multimedia Integration Language) ist Auszeichnungssprache für
Multimediapräsentation (http://www.w3.org/TR/REC- smil)
ä åçæ èé ê
å ëíì î æ ïð ñ ò ó ë ó ô èöõ î ë÷ ò ï è î ëíø ù ñ òæ ð ï è è ù ò úüû ï ñ ò ýæ ò þ ê
åçÿ ï ê
å ë ú èø æ ïð ñ ò÷ ë ôíì õ ë ò ï è î ëíø ù ñ òæ ð ï è è ù ò úû ï ñ ò æ ò þ ê
å û ú ëíø æ ïð ñ òæ ø û ù ú
õ ò úüû ï ñ ò æ ò þ ê
å þÿ ï ê
å þæ èé ê
Erste Unterstützung in Playern (RealPlayer G2) und
erste Autorenwerkzeuge
Grafiken
Scalable Vector Graphics (SVG) ist standardisiertes Zeichnungsformat
(http://www.w3.org/Graphics/SVG)
<svg width="3in" height="3in">
<desc>A blue circle with a red outline</desc>
<g><circle cx="200" cy="200" r="100"
style="fill: blue; stroke: red"/></g>
</svg>
Erste Unterstützung in Browsern absehbar
!
"
#$%&'()$*+,-$'./
0&'*12
Geschäftlicher Datenaustausch
3
Noch keine Standardisierung absehbar
3
Konkurrierende Entwürfe. Beispiele:
Entwicklung Informationen bei
CBL eCO Systems www.commerce.net www.veosystems.com Open Trading Protocol www.otp.org
Rosettanet www.rosettanet.org
OBI Open Buying Initiative www.openbuy.org ICE www.w3.org/TR/1998/NOTE-ice-
19981026
Open Financial Exchange www.ofx.net
XML/EDI www.xmledi.com
Oasis Open www.oasis-open.org
Biztalk www.biztalk.org
567
8
9:;<=>?:@ABC:=DE
F<=@GH
HTML –> XHTML
JKL
M
NOPQRSTOUVWXORYZ
[QRU\]
Weiterentwicklung von HTML
^
XHTML ist die Neuformulierung von HTML mit Hilfe einer XML-DTD (http://www.w3.org/TR/xhtml1)
_
XHTML definiert einen XML Namensraum, in dem die bekannten Tags und Attribute von HTML 4 definiert sind
_
Hauptsächlich syntaktische Änderungen wg.
Anforderungen an Wohlgeformtheit
_
Funktionale Ergänzungen des Sprachumfangs noch nicht
_
Zukünftig: Modularisierung der Sprache des Web
aab
c
defghijeklmnehop
qghkrs
XHTML…
t
… ist die Weiterentwicklung von HTML auf XML Basis (Quelle: http://www.w3.org/MarkUp/)
t
XHTML 1.0
u
Zweck: HTML 4 auf XML Basis
u
Status: W3C Recommendation 26 January 2000
u
Quelle: http://www.w3.org/TR/xhtml1/
v
XHTML Basic
w
Zweck: Minimale Untermenge von XHTML
x
Status: W3C Recommendation 19 December 2000
x
Quelle: http://www.w3.org/TR/xhtml-basic/
z{|
}
~
XHTML…
Modularization of XHTML
Zweck: Definition abstrakter Module von XHTML
Status: W3C Recommendation 10 April 2001
Quelle: http://www.w3.org/TR/xhtml-modularization/
XHTML 1.1 - Module-based XHTML
Zweck: Definition konkreter Module von XHTML
Status: W3C Recommendation 31 May 2001
Quelle: http://www.w3.org/TR/xhtml11/
¡¢£¤¥
¦ §¨
XHTML 1.0
©
Neuformulierung von HTML 4, keine wesentlichen Änderungen der Tag-Menge
©
XHTML Dokumente müssen im XML-Sinn wohlgeformt also korrekt geschachtelt sein
©
Öffnenden Elemente müssen geschlossen werden (<p>!)
ª
Alle Element- und Attributnamen sind in Kleinschreibung
ª
Attributwerte müssen in Anführungszeichen stehen (z.B. start="1" )
ª
Attribute müssen immer einen Wert tragen (z.B. checked="checked")
«
Leere Tags entsprechen XML markiert: <br/>
«
<script> und <style> enthalten #PCDATA , deshalb werden <, & und Kürzel ( < ) interpretiert
¬
Fragmente verweisen immer auf das id -Attribut
®¯°
±
²³´µ¶·¸³¹º»¼³¶½¾
¿µ¶¹ÀÁ
HTML4/XHTML1 Kompatibilität
Â
Leere Elemente durch Leerzeichen kompatibel machen: <br> -> <br/> -> <br />
Â
Abkürzung bei nichtleeren Elementen vermeiden:
<p /> -> <p><p/>
Â
<script> und <style> als CDATA markieren:
<script>
<![CDATA[ Script ]]>
</script>
Ã
Attribute lang und xml:lang gleichzeitig
verwenden
ÅÆÇ
È
ÉÊËÌÍÎÏÊÐÑÒÓÊÍÔÕ
ÖÌÍÐ×Ø
Modularisiertes XHTML
Ù
Structure Module
Ú
Geben Struktur eines Dokuments
Û
body, head, html, title
Ü
Text Module
Ý
Umfassen Elemente die Text enthalten
Þ
Überschriften: h1 , h2 , h3 , h4 , h5 , h6
Þ
Blöcke: address , blockquote, div, p, pre
ß
Laufender Text: abbr, acronym, br, cite, code, dfn, em, kbd, q, samp, span, strong, var
à
Hypertext Module
á
Elemente für Hyperlinks
â
a
äåæ
ç
èéêëìíîéïðñòéìóô
õëìïö÷
Modularisiertes XHTML
ø
List Module
ù
Umfaßt Elemente zur Auszeichnung von Listen
ú
dl , dt , dd , ol , ul , li
û
Presentation Module
ü
Elemente zur visuellen Markierung
ý
b, i, tt, big, small, sub, sup, hr
þ
Edit Module
ÿ
Elemente zur Markierung von Änderungen del , ins
Bi-directional Text Module
Schrift in zwei Richtungen
bdo
Modularisiertes XHTML
Basic Forms Module
Einfache Formulare
form, input, label, select, textarea
Forms Module
Formulare wie in HTML4
form, input, label, select, textarea, fieldset,
button, legend, optgroup
!"
#
$%&'()*%+,-.%(/0
1'(+23
Modularisiertes XHTML
4
Basic Tables Module
5
Einfache Tabellen
6
table, caption, td, th, tr
7
Tables Module
8
Tabellen wie in HTML4
9
table, caption, td, th, tr, col, colgroup, tbody,
thead, tfoot
;<=
>
?@ABCDE@FGHI@CJK
LBCFMN
Modularisiertes XHTML
O
Image Module
P
Abbildungen
Q
img
R
Client-side Image Map Module
S
Browser-seitige Image Maps
T
a
U, area, img
U, input
U, map, object
UV
Server-side Image Map Module
W
Server-seitige Image Maps
X
img
Y, input
Y,
Z
Object Module
[
Eingebettete Objekte
[
object, param
*: Es werden zusätzliche
Attribute für die Tags
definiert
]^_
`
abcdefgbhijkbelm
ndehop
Modularisiertes XHTML
q
Frames Module
r
Rahmen
s
frameset , frame , noframe
t
Target Module
u
Rahmen als Ziele für Inhaltsdarstellung
v
a
w, area
w, base
w, link
w, form
wx
Iframe Module
y
Eingebettete Rahmen
z
iframe
|}~
Modularisiertes XHTML
Intrinsic Events Module
Ereignisse
a
, area
, frameset
, form
, body
, label
, input
, select
, textarea
, button
Metainformation Module
Metainformationen
meta
Link Module
Metaverweise
link
Base Module
Basis URL für Dokument
base
¡
¢£¤¥¦§¨£©ª«¬£¦®
¯¥¦©°±
Modularisiertes XHTML
²
Scripting Module
³
Scripte
´
noscript, script
µ
Style Sheet Module
¶
Formatvorlagen
·
style + style Attribute Module Änderungen
¹º»
¼
½¾¿ÀÁÂþÄÅÆǾÁÈÉ
ÊÀÁÄËÌ
Modularisiertes XHTML
Í
Legacy Module
Î
Überkommene Elemente
Ï
basefont, font, center, menu, dir, isindex, s, strike, u
Ï
body
Ð, br
Ð, caption
Ð, div
Ð, dl
Ð, h1-h6
Ð, hr
Ð, img
Ð,
input
Ð, legend
Ð, li
Ð, ol
Ð, p
Ð, pre
Ð, script
Ð, table
Ð,
tr
ÐÒÓÔ
Õ
Ö×ØÙÚÛÜ×ÝÞßà×Úáâ
ãÙÚÝäå
XHTML Basic
æ
XHTML für kleine Geräte
æ
Konkurrenz zu WML/WAP, Konvergenz mit WAP 2.0
æ
Umfang:
ç èéëê ì íé ìê î ïñð ò ì ó îô õ÷ö øúù û ü÷ý þ ø û ÿ
! ! "
#$ % & ' &
( '*) +, +- +. +/ +0 +1 # 2
2
$ ! 2
! 2
! & 3 )
4 576 89 : ;9 < ; => ?@ A9B C
4 DEF G HI JK LNM O PQ R PS R P P R T
Q R UQ R Q V
W XY Z[\ ]^ _ ` Za bdc ef g hdi jk l g mn op m g
qp
mp r l g c j l h c i g lp s l
n ep n
t uv wxy z
v {|N} w ~ |} d
d¡ ¢
£ ¤ ¥¦§ ¨ © ª« ¬ ®
§ ¯ ° ± ²d³ ´ µ·¶ ¸¹ º¹ »
¼ ½¾ ¿ÁÀ Âà ÄNÅÆ ÇÀ ¿ÂÅ Ã ½Å ÈÉ Ê
¾Ë ÌÍ ÎÏ
¼ ÐÑÒ Ó ÔÕ Ö× ØNÙÚ Û ÜdÝ Þ
ß àá âã äå æç èãé êë ìí
ïðñ
ò
óôõö÷øùôúûüýô÷þÿ
ö÷ú
XHTML 1.1
Führt keine neuen Elemente ein
Umfaßt alle Module aus XHTML Modularization
Ist zweites Profil neben XHTML Basic
Praktisch zunächst kaum Auswirkungen
W3C Dokumente
!"#$%&'(")*
+!"%,-
XML Linking…
.
… beschäftigt sich mit Technologien für Hyperlinks (Quelle: http://www.w3.org/XML/Linking.html)
.
XML Linking Language (XLink) Version 1.0
/
Zweck: Elemente zur Beschreibung von Referenzen zwischen XML Dokumenten
/
Status: W3C Recommendation 27 June 2001
/
Quelle: http://www.w3.org/TR/xlink/
0
XML Base
1
Zweck: Methode zur Definition einer Basis URI für XML Dokumente (ähnlich <base> in HTML)
2
Status: W3C Recommendation 27 June 2001
2
Quelle: http://www.w3.org/TR/xmlbase/
456
7
89:;<=>9?@AB9<CD
E;<?FG
XML Signature…
H
… beschäftigt sich mit Technologien für Signaturen zu XML Dokumenten und XML Mitteilungen
(Quelle: http://www.w3.org/Signature)
H
Canonical XML Version 1.0
I
Zweck: Normalisierung von XML Dokumenten definiert
I
Status: W3C Recommendation 15 March 2001
I
Quelle: http://www.w3.org/TR/xml-c14n
J
XML-Signature Syntax and Processing
K
Zweck: Signatur Unterschrift und Verarbeitung
L
Status: W3C Proposed Recommendation 20 Aug. 2001
L
Quelle: http://www.w3.org/TR/2001/PR-xmldsig-core-
20010820
NOP
Q
RSTUVWXSYZ[\SV]^
_UVY`a
XHTML…
b
… ist die Weiterentwicklung von HTML auf XML Basis (Quelle: http://www.w3.org/MarkUp/)
b
XHTML 1.0
c
Zweck: HTML 4 auf XML Basis
c
Status: W3C Recommendation 26 January 2000
c
Quelle: http://www.w3.org/TR/xhtml1/
d
XHTML Basic
e
Zweck: Minimale Untermenge von XHTML
f
Status: W3C Recommendation 19 December 2000
f
Quelle: http://www.w3.org/TR/xhtml-basic/
hij
k
lmnopqrmstuvmpwx
yopsz{
XHTML…
|
Modularization of XHTML
}
Zweck: Definition abstrakter Module von XHTML
~
Status: W3C Recommendation 10 April 2001
~
Quelle: http://www.w3.org/TR/xhtml-modularization/
XHTML 1.1 - Module-based XHTML
Zweck: Definition konkreter Module von XHTML
Status: W3C Recommendation 31 May 2001
Quelle: http://www.w3.org/TR/xhtml11/
RDF
... Technologien zur Wissensrepräsentation (Quelle: http://www.w3.org/RDF/)
Resource Description Framework (RDF) Model and Syntax Specification
Ziel: Grundlage für RDF Modellierungssprache
Status: W3C Recommendation 22 February 1999
Quelle: http://www.w3.org/TR/REC-rdf-syntax
Resource Description Framework (RDF) Schema Specification 1.0
Ziel: Strukturierte RDF Modellierungsaussagen
Status: W3C Candidate Recommendation 27 March 2000
Quelle: http://www.w3.org/TR/rdf-schema
¡¢£¤¥¦§¢¨©ª«¢¥¬
®¤¥¨¯°
RDF
±
RDF Model Theory
²
Ziel: Semantik für RDF / RDF-Schema
³
Status: W3C Working Draft 25 September 2001
³
Quelle: http://www.w3.org/TR/rdf-mt/
´
RDF Test Cases
µ
Ziel: Testanwendungen
¶
Status: W3C Working Draft 15 November 2001
¶
Quelle: http://www.w3.org/TR/rdf-testcases/
·
Refactoring RDF/XML Syntax
¸
Ziel: Anpassung der RDF Grammatik nach Kommentaren
¹
Status: W3C Working Draft 06 September 2001
¹
Quelle: http://www.w3.org/TR/rdf-syntax-grammar/
»»¼
½
¾¿ÀÁÂÃÄ¿ÅÆÇÈ¿ÂÉÊ
ËÁÂÅÌÍ
Lifecycle The W3C Recommendation Track
Working Draft
Last Call Working Draft
Candidate
Recommendation
Proposed
Recommendation
Recommendation W3C
Note Note Note
ÏÐÑ
Ò
ÓÔÕÖ×ØÙÔÚÛÜÝÔ×Þß
àÖ×Úáâ
Dokumentenstatus
ã
Note
ä
Arbeitsnotiz
å
Working Draft
æ
Arbeitspapier einer Arbeitsgruppe
æ
Stark veränderlich
æ
Kein Bestätigung des aktuellen Arbeitsstands
æ
Erklärte Absicht zur Erstellung eines Standards
ç
Last Call Working Draft
è
Arbeitspapier einer Arbeitsgruppe
è
Arbeitsgruppe hält Ergebnis für Lösung der Arbeitsaufgabe
êëì
í
îïðñòóôïõö÷øïòùú
ûñòõüý
Dokumentenstatus
þ
Candidate Recommendation
ÿ
Entsteht aus Last Call Working Draft durch Veröffentlichung
Nachfrage von Implementierungserfahrungen
Proposed Recommendation
Entsteht aus Candidate Recommendation bei hinreichender Implementierungserfahrung (und deren Berücksichtigung)
W3C Recommendation
Ergebnis einer Konsensbildung über Proposed Recommendation