1
Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen36
Form und Darstellung von Informationen
1. Computermetaphern
2. Beschreibungssprachen für Texte
3. Grammatiken zur Beschreibung syntaktischer Strukturen 4. Beispiel einer Textbeschreibungssprache: HTML
5. Übersicht über Textsysteme
6. Schablonen und Generierung von Texten (z.B. Serienbriefe) 7. Nützliche Hilfsmittel in Textsystemen
8. Das World Wide Web als Hyperdokument 9. Funktionsweise von Suchmaschinen 10. XML
Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen37
Grammatiken zur Beschreibung formaler Strukturen
•Grammatiken definieren eine gemeinsame Sprache:
–Syntax:beschreibt die zulässige Form der Sätze der Sprache –Semantik:beschreibt die Bedeutung der Sätze
•Eine Grammatik ist eine Menge von Regeln, die bestimmen, welche Sätze zur Sprache gehören und welche nicht.
•In Computersprachen müssen (im Gegensatz zu natürlichen Sprachen) die Regeln streng eingehaltenwerden.
•Eine Grammatik wird durch 4 Bestandteile definiert:
–Terminalsymbole(T): Zeichen der Sprache (was man sieht) –Variablen(Nichtterminalsymbole; V): werden durch T's ersetzt –Regeln(R): Ersetzungsregeln für alle Variablen
–Startsymbol(S): Eine ausgezeichnete Variable
Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen38
Wichtige Grammatik-Typen
•Komplexität der Regelnbestimmt Ausdrucksstärke und Interpretierbarkeit der Sprachen
•Kontextfreie Grammatiken:Die Bedeutung der Variablen auf der linken Seite einer Regel ist unabhängig vom Kontext, in dem die Variable vorkommt:
–Auf der linken Seite steht immer nur eine Variable –Beispiel: A := B C | D E
–Gegenbeispiel: 'a' A := 'a' B C und 'b' A := 'b' D E –gut interpretierbar
•Reguläre Grammatiken:Kontextfreie Grammatiken, bei der die rechte Seite einer Regel entweder ein Terminalzeichen oder ein Terminalzeichen gefolgt von einer Variabeln enthält :
–Beispiel: A := 'a' | 'a' A
–besonders einfach interpretierbar
Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen39
Verbreiteter Grammatikformalismus: EBNF
•EBNF= Extended Backus Naur Form
•1960 von Backus und Naur zur Beschreibung der Syntax von Programmiersprachenerfunden; später erweitert.
•Kontextfreie Regeln der Art:"linker Teil" := "Ersetzung durch rechten Teil", z.B. A := B C D; statt :=auch: =, ::=
•Unterscheidung zwischen Variablen & Terminalsymbolen:
<A> := B <C> D oder A := 'B' C 'D' bzw.A := "B" C "D"
•Konstrukte zur Regelbildung:
–Sequenz: z.B. A B Coder mit Kommata A, B, C
–Alternative:z.B. A | B | Ceine Alternative wird ausgewählt –Option:A? A darf weggelassen werden (Kardinaliät: 0 ..1); auch: [A]
–Wiederholung:A* A darf wegelassen oder beliebig oft wiederholt werden (Kard. 0 .. N); auch {A}
–Wiederholung ohne Weglassen-Option:A+(Kard.: 1 .. N); auch <A>
–Gruppierung:(A B C) wichtig bei Verschachtelungen wie z.B.(A | B)*
Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen40
Grafische Darstellung: Syntaxdiagramme
•Sequenz:A := B C
•Option:A := B?
•Wiederholung:A := B*
•Alternative:A := B | C
•Terminal-Produktion:A := 'a'
Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen41
Grammatik für Spiegel-Artikel (T, NT, R, S)
T= { 'A', 'B', 'C', ... , 'Z', 'a', ..., 'z', '1', ..., '9' , '.', ... ,"Pixelgrafik"}V= { Spiegel-Artikel, Aufreißer, Schlagzeile, Kurzfassung, Inhalt, Bildteil, Abschnitt, Bild, Bildunterschrift, Wort, Ascii-Zeichen}
R= { Spiegel-Artikel := Aufreißer Schlagzeile Kurzfassung Inhalt+ Inhalt := Bildteil | Abschnitt
Bildteil := Bild Bildunterschrift Aufreißer := Wort+ Schlagzeile := Wort+ Kurzfassung := Wort+ Abschnitt := Wort+ Bildunterschrift := Wort+ Wort := Ascii-Zeichen+
Ascii-Zeichen := 'A' | 'B' | 'C' | ... | 'Z' | 'a' | ... | 'z' | '1'| ... | '9' | '.' | ...
Bild := "Pixelgrafik"
}
S= Spiegel-Artikel
2
Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen42
Beispiel für Ableitung
Spiegel-Artikel := AufreißerSchlagzeile Kurzfassung Inhalt Inhalt Inhalt Inhalt Inhalt
→WortWortSchlagzeile Kurzfassung Inhalt Inhalt Inhalt (...)
→Ascii Ascii Ascii Ascii Ascii Ascii Ascii AsciiWort Schlagzeile Kurzfassung Inhalt Inhalt Inhalt
→EICHELSWortSchlagzeile Kurzfassung Inhalt Inhalt Inhalt
→EICHELS Ascii Ascii Ascii Ascii Ascii Ascii Ascii Ascii Ascii AsciiSchlagzeile Kurzfassung Inhalt Inhalt Inhalt
→EICHELS GIFTLISTESchlagzeileKurzfassung Inhalt Inhalt Inhalt
→EICHELS GIFTLISTE Wort Wort Wort WortKurzfassung Inhalt Inhalt Inhalt ...
→EICHELS GIFTLISTE Höhere Steuern auf LeitungswasserKurzfassung Inhalt Inhalt Inhalt ...
→EICHELS GIFTLISTE Höhere Steuern auf Leitungswasser Angesichts der Finanzmisere ...
InhaltInhalt Inhalt
→EICHELS GIFTLISTE Höhere Steuern auf Leitungswasser Angesichts der Finanzmisere ...
BildteilInhalt Inhalt
→EICHELS GIFTLISTE Höhere Steuern auf Leitungswasser Angesichts der Finanzmisere ...
Bild BildunterschriftInhalt Inhalt ...
→EICHELS GIFTLISTE Höhere Steuern auf Leitungswasser Angesichts der Finanzmisere ...
Beim Geld ... Berlin - ... Danach ... Seine Streichliste ... Der ergiebigste ...
Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen43
Erweiterungen für Umbruch & Hervorhebung
Spiegel-Artikel := Rubrik Schlagzeile Bildteil? Kurzfassung Inhalt Inhalt := (Teil Umbruch)* TeilTeil := Bildteil | Abschnitt Bildteil := Bild Bildunterschrift
Aufreißer := "Mark-A" Wort+ "End-Mark-A" Umbruch Schlagzeile := "Mark-S" Wort+ "End-Mark-S" Umbruch Kurzfassung := "Mark-K" Abschnitt "End-Mark-K" Umbruch Abschnitt := Satzteil+
Satzteil := Normal | Fetttext | Kursivtext Normal := Wort+
Fetttext := "Mark-F" Abschnitt "End-Mark-F"
Kursivtext := "Mark-K" Abschnitt "End-Mark-K"
Bildunterschrift := "Mark-B" Abschnitt "End-Mark-B"
Wort := Ascii-Zeichen+
Ascii-Zeichen := 'A' | 'B' | 'C' | ... | 'Z' | 'a' | ... | 'z' | '1'| ... | '9' | '.' | ...
Bild := "Pixelgrafik"
Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen44
Formale Beschreibung der anderen Artikel
•Focus-Artikel
Artikel := Rubrik Schlagzeile Bildteil Textteil+ Rubrik := 'Vermischtes' | 'Politik' | 'Wirtschaft' | ...
Textteil := Satzteil+ ....
•Netzeitung-Artikel
Artikel := Schlagzeile Datum Bildteil Kurzfassung Autor Textteil+ Datum := Wochentag '. ' Monat ' ' Uhrzeit
Wochentag := '1' | ... | '31'|
Monat := 'Jan' | ... | 'Dez' Uhrzeit := Zahl Zahl ':' Zahl Zahl Zahl := '1' | ... | '9' | '0'
Autor := Wort Wort ...
(Rest jeweils analog zu Spiegel-Artikel)
Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen45
Grundprinzip von Textsystemen
•Der Rohtext wird mit zusätzlichen Informationen (Auszeichnungen) angereichert.
•Die Auszeichnungen werden vom Darstellungsprogramm interpretiert und angezeigt.
•Die Auszeichnungen können neben Formatanweisungen auch semantische Information enthalten.
•Allerdings sind semantische Informationen häufig
anwendungsspezifisch und daher schlecht standardisierbar.
Einführung in die Informatik für Hörer aller Fakultäten 1. Puppe: Form & Darstellung von Informationen46
Wichtige Auszeichnungssprachen
•Mit vorgegebenen Auszeichnungen: HTML(Hypertext Markup Language)
•Mit selbst definierbaren Auszeichnungen (für dokumenten- spezifische Semantik): XML (Extensible Markup Language)
•Literatur zu HTML:
–findet man überall
–Gute Kurzeinführung (Text: Teilkapitel über HTML)
http://wwwbruegge.in.tum.de/teaching/ws01/WAPP/index.html –Referenz im Netz:
http://selfhtml.teamone.de/navigation/html.htm
•Eingabewerkzeug:Jeder Texteditor (Ascii-Text)
•Anzeige:Aktuelle Browser (z.B. Internet-Explorer, Netscape)