Grundlagen der Rechnernetze
Applikationsschicht
Übersicht
• Web und HTTP
• File Transfer: FTP
• Electronic Mail
• Domain Name System (DNS)
2 Grundlagen der Rechnernetze ‐Applikationsschicht
HTTP Übersicht
Grundlagen der Rechnernetze ‐Applikationsschicht 3
Hyper Text Transfer Protocol (HTTP)
• Application Layer Protocol auf Basis von TCP
• HTTP definiert Formate und Austausch von Nachrichten zum aufrufen von Web‐Seiten (Request‐Response)
• Client‐Server‐Paradigma(Web‐Server und Web‐Client bzw.
Web‐Browser) (Server‐Port meist 80, manchmal 8080)
• Web‐Server sind zustandslos (engl. stateless)
• Bzw. HTTP ist ein zustandsloses Protokoll
HTTP definiert in RFC 1945 und RFC 2616 (definiert das Protokoll aber nicht die Darstellung von Webseiten auf dem Browser)
Terminologie
• Web‐Seite beinhaltet Objekte
• z.B. HTML‐File, JPEG‐Image, Java‐Applet, Video‐Clip etc.
• Typischerweise ein Basis‐HTML‐File und mehrere darin referenzierte Objekte
• Objekte sind über Uniform Resource Locator (URL) adressierbar
• Besteht aus Host‐Name des Web‐Servers und Objekt‐
Pfadname auf dem Server, z.B.:
• www.someSchool.edu/someDepartment/picture.gif
• Host‐Name: www.someSchool.edu/
• Pfadname: /someDepartment/picture.gif
Beispiel‐Webserver:
• Apache HTTP Server
• Nginx
• Microsoft Internet Information Services
• Google Web Server
Beispiel‐Webclients:
Mosaic, Netscape, Internet Explorer, Mozilla Firefox, Opera, Safari, Google Chrome, Microsoft Edge, Vivaldi
• always on
• fixed IP address
• port 80 or 8080
Abbildung aus Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
HTTP‐Beispiel
Grundlagen der Rechnernetze ‐Applikationsschicht 4
1. HTTP‐Client öffnet TCP‐Verbindung mit HTTP‐Server www.someSchool.edu auf Port 80
2. HTTP‐Client sendet Request
/someDepartment/index.htm an HTTP‐
Server
3. HTTP‐Server ermittelt Objekt /someDepartment/index.htm und sendet Response über die TCP‐
Verbindung
4. HTTP‐Server schließt TCP‐Verbindung 5. HTTP‐Client empfängt Response und
schließt die TCP‐Verbindung ebenfalls.
HTTP‐Client findet in dem Objekt ein HTML‐File mit 10 referenzierten JPEG‐
Objekten
6. Die ersten vier Schritte werden für jedes JPEG‐Objekt wiederholt
Ist das immer so?
H S
TCP‐Verbindung herstellen
Request
/someDepartment/index.htm
Response HTML‐File
TCP‐Verbindung abbauen
Dieselben Schritte für jedes
JPEG‐Objekt
Persistente und Nicht‐Persistente Verbindung
Grundlagen der Rechnernetze ‐Applikationsschicht 5
HTTP erlaubt zwei Verbindungsarten zwischen Client und Server:
• Persistent: eine TCP‐Verbindung für alle Request‐Response‐
Paare (typischerweise genutzt); Server schließt TCP‐
Verbindung, wenn vom Client bis zu einem Timeout keine weiteren Anfragen mehr kamen
• Nicht‐Persistent: separate TCP‐Verbindung für jedes Request‐Response‐Paar
Nicht‐Persistente Verbindungen bedeuten mehr Overhead
• 2*RTT Verzögerung für TCP‐Verbindungsherstellung
• Ressourcen auf Client und Server für TCP‐Variablen und Puffer (insbesondere auf Server der gleichzeitig viele Clients bedienen muss problematisch)
Aber: Nicht‐Persistente TCP‐Verbindungen ermöglichen Parallelität
Moderne Browser erlauben eine Festlegung der maximal erlaubten parallelen TCP‐Verbindungen.
• Jede TCP‐Verbindung behandelt einen Request/Response
• (Default in der Regel 5 bis 10 parallele TCP‐Verbindungen)
Abbildung aus Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
HTTP‐Request‐Nachricht
Grundlagen der Rechnernetze ‐Applikationsschicht 6
Allgemeines Format Beispiel
Abbildung aus Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
GET /somedir/page.html HTTP/1.1 Host: www.someschool.edu
Connection: close
User-agent: Mozilla/4.0 Accept-language: fr
• Nachrichten sind in ASCII (Format definiert über sp, cr und lf)
• Request‐Line:
• Methoden: GET, POST, HEAD, PUT und DELETE
• Im Beispiel: Browser bittet um Objekt somedir/page.html. Brower verwendet HTTP Version 1.1
• Header‐Lines: Host
• Im Beispiel: Request geht an www.someschool.edu
• Wieso nochmal? TCP‐Verbindung ist doch schon hergestellt?!? siehe Web‐Proxy‐Cache
• Header‐Lines: Connection: closeClient will keine Persistente Verbindung
• Header‐Lines: User‐agent: Mozilla/4.0 Browser‐Typ
• Header‐Lines: Accept‐langugage: frBeispiel eines Content‐Negotiation‐Headers (hier: falls vorhanden französische Variante des angefragten Contents)
• Es gibt noch viele weitere Header‐Lines….
HTTP‐Request‐Nachricht
Grundlagen der Rechnernetze ‐Applikationsschicht 7
Allgemeines Format Beispiel
Abbildung aus Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
GET /somedir/page.html HTTP/1.1 Host: www.someschool.edu
Connection: close
User-agent: Mozilla/4.0 Accept-language: fr
• Method GET: vorhin schon besprochen
• Method POST
• Auch Anfrage einer Web‐Seite, aber Antwort hängt von übergebenen Parametern ab
• Parameter stehen in Entity Body
• Beispiel: User hat ein Form ausgefüllt (z.B. Suchwort für Suchmaschine)
• Aber: Parameter können auch mittels GET in der URL übergeben werden (Beispiel Form mit zwei Eingabefeldern; ausfüllen mit monkeys und bananas; die URL ist dann
www.somesite.com/animalsearch?monkeys&bananas)
• Method HEAD: wie GET, nur Server lässt in seiner Antwort das angefragte Objekt weg (z.B. sinnvoll für Debugging)
• Method PUT: sinnvoll für Web‐Publishing‐Tools; User kann damit Objekt auf gegebenen Objekt‐Pfad hoch laden
• Method DELETE: offensichtlich sinnvoll, wenn es ein PUT gibt
HTTP‐Response‐Nachricht
Grundlagen der Rechnernetze ‐Applikationsschicht 8
Allgemeines Format Beispiel
HTTP/1.1 200 OK Connection: close
Date: Thu, 07 Jul 2007 12:00:15 GMT Server: Apache/1.3.0 (Unix)
Last-Modified: Sun, 6 May 2007 09:23:24 GMT Content-Length: 6821
Content-Type: text/html
(data data data data data ...)
Im Unterschied zu Request steht bei Response im Header ein status Code; Übliche Status‐Codes
• 200 OK: Request erfolgreich
• 301 Moved Permanently: Objekt wurde verschoben; neue URL steht in Header‐Line Location:
• 400 Bad Request: Request wurde von Server nicht verstanden
• 404 Not Found: angefragtes Objekt existiert auf dem Server nicht
• 505 HTTP Version Not Supported: Angefragte HTTP‐Protokoll‐Version wird vom Server nicht unterstützt
Header‐Lines des Beispiels offensichtlich Wozu eigentlich Last‐Modified?
Last‐Modified ist für Caching (auf Client und auch Proxy) sinnvoll
Abbildung aus Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
Client‐Server‐Interaction: Cookies
Grundlagen der Rechnernetze ‐Applikationsschicht 9
HTTP‐Server ist Stateless
Wie kann sich z.B. Amazon‐Server meinen aktuellen Einkaufswagen (sogar über viele Tage hinweg)
merken?
Lösung: Cookies (siehe Beispiel)
1. Cookie‐Header‐Line im HTTP‐Response (Set‐cookie: <eindeutige Nummer>) 2. Cookie‐Header‐Line im HTTP‐Request
(nachdem Cookie‐Nummer erlernt wurde) 3. Cookie‐File auf dem Client mit Einträgen
(host‐Name: Identifikationsnummer) 4. Backend‐Datenbank auf Server‐Seite
Damit lässt sich jede HTTP‐Aktivität des Clients mit der Cookie‐Nummer auf dem Web‐Server loggen.
Wenn User sich auch noch registrieren muss, dann lässt sich jede HTTP‐Aktivität des Users auf dem Web‐Server loggen.
Cookies vereinfachen vieles (z.B. Einkaufswagen) Aber: nicht unumstritten bzgl. Privacy
Abbildung aus Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
Motivation für Web‐Caching
Grundlagen der Rechnernetze ‐Applikationsschicht Abbildung aus Kurose/Ross „Computer 10
Networking: A Top‐Down Approach“, 2008
Beispiel‐Annahmen
• Mittlere Objekt‐Größe pro HTTP‐Reply: 1 Mbit
• Mittlere Anzahl an HTTP‐Requests: 15 Request/sec
• (HTTP‐Request‐Größe vernachlässigbar klein) Damit ergibt sich La = ankommende Bits pro Sekunde:
La = 15/1 (req/sec / 1Mbit)
Als Verkehrsintensität (d.h. ankommende Bits pro Sekunde La dividiert durch Übertragungsrate
La/R(LAN) = 0.15
La/R(AccessLink) = 1.0 Queueing‐Theory:
Mehrere 10 mSec Delay im LAN
Delay am Access‐Link wächst über jede Grenze
Damit ist die mittlere Antwortzeit für einen HTTP‐Request in Bereich von Minuten oder gar mehr!
Wie Lösen? Kapazität des Access‐Linkt erhöhen (z.B. auch 100 Mbps) Kostenfaktor! andere Lösung?
R(access link) = 15 Mbps
R(LAN) = 100 Mbps
Web‐Caching
Grundlagen der Rechnernetze ‐Applikationsschicht Abbildung aus Kurose/Ross „Computer 11
Networking: A Top‐Down Approach“, 2008
Web‐Cachebzw. Proxy‐Server erfüllt HTTP‐Anfragen für Web‐
Server.
Browser des Users so konfiguriert, dass alle HTTP‐Anfragen erst an den Proxy laufen.
Am Beispiel für Anfrage von
http://www.someschool.edu/campus.gif
1. Browser stellt TCP‐Verbindung mit Proxy her uns sendet Request für das Objekt dort hin
2. Proxy prüft ob Objekt lokal gespeichert. Falls ja, antworte mit HTTP‐Response mit dem Objekt.
3. Falls nein, stelle TCP‐Verbindung mit Original‐Web‐Server (www.someschool.edu) her. Sende HTTP‐Request von Proxy an Web‐Server. Web‐Server antwortet mit Objekt auf Anfrage des Proxy.
4. Mit empfang des Objektes am Proxy, wird dieses an den Web‐
Client per HTTP‐Response geantwortet und das Objekt für zukünftige Anfragen im Proxy lokal gespeichert.
Damit können zukünftige Anfragen nach http://www.someschool.edu/campus.gif
ohne „Internet‐Verzögerung“ beantwortet werden. Außerdem:
Web‐Caching
Grundlagen der Rechnernetze ‐Applikationsschicht Abbildung aus Kurose/Ross „Computer 12
Networking: A Top‐Down Approach“, 2008 R(access link) = 15 Mbps
R(LAN) = 100 Mbps
Beispiel‐Annahmen
• Mittlere Objekt‐Größe pro HTTP‐Reply: 1 Mbit
• Mittlere Anzahl an HTTP‐Requests: 15 Request/sec
• Typische Cache‐Hit‐Raten = im Bereich 0,2 bis 0,7; Annahme hier 0,4
• Annahme 2 Sekunden‐Internetverzögerung
Damit ergibt sich La = ankommende Bits pro Sekunde:
La = 15/1 (req/sec / 1Mbit)
Als Verkehrsintensität (d.h. ankommende Bits pro Sekunde La dividiert durch Übertragungsrate
La/R(LAN) = 0.15
La/R(AccessLink) = 1.0 * 0,6 (d.h. nur die Cache‐Misses) Queueing‐Theory:
Mehrere 10 mSec delay im LAN und Mehrere 10 mSec am Access‐Link
Mit Damit ist die mittlere Antwortzeit für einen HTTP‐Request:
0,4 * 0,01 sek + 0,6 * (2,0 + 0,01 sek) ~ 1,2 sek anstatt viele Minuten!
Web‐Caching: Conditional GET
Grundlagen der Rechnernetze ‐Applikationsschicht 13
Problem: Objekt im Cache ist nicht mehr aktuell, wenn das Objekt auf dem Web‐Server verändert wurde.
Lösung: condidional GET
• Request‐Nachricht verwendet GET‐Methode und beinhaltet
• Header‐Line If‐Modified‐Since:
Beispiel: (www.exotiquecuisine.com/fruit/kiwi.gif)
Zunächst sendet ein Proxy auf Anfrage eines Clients an den Web‐Server GET /fruit/kiwi.gif HTTP/1.1
Host: www.exotiquecuisine.com Darauf antwortet der Web‐Server an den Proxy HTTP/1.1 200 OK
Date: Thu, 7 Jul 2007 15:39:29 Server: Apache/1.3.0 (Unix)
Last-Modified: Mon, 4 Jul 2007 09:23:24 Content-Type: image/gif
(data data data data data ...)
Web‐Caching: Conditional GET
Grundlagen der Rechnernetze ‐Applikationsschicht 14
Proxy leitet das Objet an Web‐Client und speichert das Objekt lokal inklusive der Last‐
Modified‐Information
Eine Woche später fragt derselbe oder irgend ein anderer Client das Objekt im Proxy nach Proxy macht dann einen Up‐to‐date‐Check und sendet hierzu an den Web‐Server
GET /fruit/kiwi.gif HTTP/1.1 Host: exotiquecuisine.com
If-modified-since: Wed, 4 Jul 2007 09:23:24
Der Web‐Server antwortet immer mit einem Response, allerdings, wenn das Objekt nicht geändert wurde ist die Antwort einfach:
HTTP/1.1 304 Not Modified
Date: Thu, 14 Jul 2007 15:39:29 Server: Apache/1.3.0 (Unix)
Leerer Body
Übersicht
• Web und HTTP
• File Transfer: FTP
• Electronic Mail
• Domain Name System (DNS)
15 Grundlagen der Rechnernetze ‐Applikationsschicht
File Transfer: FTP
Grundlagen der Rechnernetze ‐Applikationsschicht 16
File Transfer Protocol (FTP): RFC 959:
• Bewegen von Dateien zwischen lokalem Dateisystem (FTP‐Client) und Remote‐Dateisystem (FTP‐
Server)
• User authentifiziert sich per Username und Passwort
• Anschließend Dateiaustausch
Zwei TCP‐Verbindungen (Control‐Connection und Data‐Connection)
• Port 21: Control‐Nachrichten (persistente TCP‐Verbindung)
• Port 20: Datennachrichten (nicht‐persistent, d.h. für jede Datei eine separate Verbindung) Control‐Nachrichten von FTP sind out‐of‐band (d.h. Trennung zwischen Control‐ und Daten‐Kanal) Control‐Nachrichten z.B. von HTTP sind hingegen in‐band (d.h. ein Kanal für Control und Daten) Anders als HTTP speichert FTP während einer User‐Session Zustand (z.B. Position im Dateibaum) Damit FTP stärker limitiert bzgl. Gesamtanzahl erlaubter aktueller bedienter User
Abbildung aus Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
FTP: übliche Commands und Replies
Grundlagen der Rechnernetze ‐Applikationsschicht 17
Commands und Replies über Control‐Kanal in lesbarer 7‐Bit‐ASCII‐Codierung CRLF nach jedem Command
Jeder Command besteht aus vier Buchstaben und Argument. Beispiele:
USER username: zum senden der User‐Identifikation PASS password: zum Senden des User‐Passwortes
LIST: Erfrage Liste aller Dateien/Unterverzeichnisse in aktuellem besuchten Verzeichnis
RETR filename: Herunterladen der Datei STOR filename: Hochladen der Datei
In der Regel erzeugt ein Command vom Client genau einen Reply vom Server.
Reply besteht aus Drei Ziffern und optionalem erklärendem Text. Beispiele:
331 Username OK, password required
125 Data connection already open; transfer starting 425 Can‘t open data connection
452 Error writing file
Abbildung aus Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
Übersicht
• Web und HTTP
• File Transfer: FTP
• Electronic Mail
• Domain Name System (DNS)
18 Grundlagen der Rechnernetze ‐Applikationsschicht
Email: eine High‐Level‐Sicht
Grundlagen der Rechnernetze ‐Applikationsschicht Abbildung aus Kurose/Ross „Computer 19
Networking: A Top‐Down Approach“, 2008
Drei wesentliche Komponenten
• User Agent
• Z.B. mit GUI: Outlook, Apple Mail, Thunderbird, …
• Z.B. textbasiert: mail, pine, elm
• Mail‐Server
• Mailbox für jeden User
• Outgoing‐Message‐Queue
• Simple Mail Transfer Protocol (SMTP)
• Auf Basis von TCP
• Zur Kommunikation zwischen Mail‐Servern
• Client‐Seite zum Empfang von Mails
• Server Seite zum Senden von Mails
Mail‐Server implementiert SMTP und agiert damit als Client und als Server
Kommunikation zwischen User‐Agent und Mail‐
Server
• Authentifizierung mittels Username und Passwort
• Zugriff auf Mailbox (siehe POP3, IMAP und Web)
Simple Mail Transfer Protocol (SMTP)
Grundlagen der Rechnernetze ‐Applikationsschicht Abbildung aus Kurose/Ross „Computer 20
Networking: A Top‐Down Approach“, 2008
SMTP‐Fakten
• Definition in RFC 2821
• Mail‐Body (d.h. der Inhalt) aus historischen Gründen auf 7‐Bit‐ASCII eingeschränkt Aufwand für andere Zeichensätze und Binär‐
Daten
• Normalerweise werden keine Intermediate‐Mail‐
Server verwendet
• TCP‐Verbindungsherstellung von SMTP‐
Client mit SMTP‐Server (z.B. Port 25)
• Nach TCP‐Verbindung Handshaking‐Phase:
z.B. mitteilen von Sender‐und Ziel‐
Mailadresse und Mailversand
• Prozess wird über dieselbe TCP‐Verbindung für weitere Nachrichten wiederholt (d.h.
persistende TCP‐Verbindung)
• Was, wenn ein Mailserver nicht erreichbar?
wiederholte TCP‐
Verbindungsherstellungen und Zustellungsversuche
Simple Mail Transfer Protocol (SMTP)
Grundlagen der Rechnernetze ‐Applikationsschicht Abbildung aus Kurose/Ross „Computer 21
Networking: A Top‐Down Approach“, 2008
Beispiel‐Transcript zu Nachrichtenaustausch nach TPC‐
Verbindungsherstellung zwischen SMTP‐Client und ‐Server:
Client: crepes.fr
Server: hamburger.edu
Mail‐Text: „Do you like ketchup? How about pickles?“
S: 220 hamburger.edu C: HELO crepes.fr
S: 250 Hello crepes.fr, pleased to meet you C: MAIL FROM: <alice@crepes.fr>
S: 250 alice@crepes.fr ... Sender ok C: RCPT TO: <bob@hamburger.edu>
S: 250 bob@hamburger.edu ... Recipient ok C: DATA
S: 354 Enter mail, end with „.“ on a line by itself C: Do you like ketchup?
C: How about pickles?
C: .
S: 250 Message accepted for delivery C: QUIT
S: 221 hamburger.edu closing connection
Reply‐Code (und optionaler Text) auf jeden eingehenden Befehl.
Jede Zeile endet mit CRLF. Textende durch „CRLF.CRLF“ dargestellt.
Danach kann erneut MAIL FROM: crepes.fr für weitere Mail stehen.
Mail‐Nachrichtenformate und MIME
Grundlagen der Rechnernetze ‐Applikationsschicht 22
Mail‐Content (Achtung: nicht SMTP) beinhaltet neben dem eigentlichen Text – d.h. dem Body – zusätzliche Informationen:
• Zusätzliche Header‐Lines (separiert durch CRLF)
• Format wie aus HTTP bekannt (lesbarer Text mit Keyword‐
Value‐Paar durch „:“ getrennt)
• Definiert in RFC 822
• Immer erforderliche Keywords sind To: und From:
• Optionale Keywords z.B. Subject:
• Body folgt nach einer Blank‐Line
• Beispiel:
From: alice@crepes.fr To: bob@hamburger.edu
Subject: Searching for the meaning of life.
Text text text
Mail‐Nachrichtenformate und MIME
Grundlagen der Rechnernetze ‐Applikationsschicht 23
Multipurpose Internet Mail Extensions (MIME) zum Versenden von Multimedia und non‐ASCII‐Text
• Verwendung weitere Header definiert in RFC 2045 und 2046 als MIME‐
Extensions zu RFC 822
• Zwei wesentliche MIME‐Header
• Content‐Type: erforderlich zur Darstellung auf dem User‐Agent
• Content‐Transfer‐Encoding: erforderlich für den Transport von Binary‐
Data über 7‐Bit ASCII (Beispiel base64)
• Beispiel
From: alice@crepes.fr To: bob@hamburger.edu
Subject: Picture of yummy crepe.
MIME-Version: 1.0
Content-Transfer-Encoding: base64 Content-Type: image/jpeg
(base64 encoded data ...
... base64 encoded data )
Mail‐Nachrichtenformate und MIME
Grundlagen der Rechnernetze ‐Applikationsschicht 24
Empfangender SMTP‐Server fügt noch Recived: Header‐Line(s) hinzu Beispiel:
Received: from crepes.fr by hamburger.edu; 12 Oct 98 15:27:39 GMT
From: alice@crepes.fr To: bob@hamburger.edu
Subject: Picture of yummy crepe.
MIME-Version: 1.0
Content-Transfer-Encoding: base64 Content-Type: image/jpeg
(base64 encoded data ...
... base64 encoded data )
Durch Mail‐Forwarding kann auch ein ganzer Pfad von Received angehangen sein.
Beislpielsweise: Mail‐Frowarding von hamburger.edu nach sushi.jp
Received: from hamburger.edu by sushi.jp; 3 Jul 01 15:30:01 GMT
Received: from crepes.fr by hamburger.edu; 3 Jul 01 15:17:39
GMT
Mail‐Access‐Protokolle
Grundlagen der Rechnernetze ‐Applikationsschicht 25
Warum eigentlich die Trennung zwischen User‐Agent und Mail‐Server
• User‐Agent des Empfängers muss sonst immer an sein
• User‐Agent des Senders braucht im Falle nicht‐Erreichbarkeit die
Übertragungsversuche (z.B. alle 30 Minuten) nicht selbst zu unternehmen Damit werden aber Mail‐Access‐Protokolle notwendig
• POP3 (Post Office Protocol – Version 3)
• IMAP (Internet Mail Access‐Protocol)
• Web‐Basiert (HTTP)
Aber auch SMTP wird auf User‐Agent verwendet: zum versenden von Mail auf den eigenen Mail‐Server
Abbildung aus Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
SMTP, HTTP
POP3,
IMAP,
HTTP
Mail‐Access‐Protokolle: POP3
Grundlagen der Rechnernetze ‐Applikationsschicht 26
Einfaches Protokoll definiert in RFC 1939
• TCP‐Verbindungsherstellung mit Mail‐Server auf Port 110
• Anschließend drei Phasen: authorization, transaction, update
Authorization: Authentifizierung des User mittels Username und Passwort
• user <username>
• pass <password>
Transaction: Nachrichten empfangen, Nachrichten zur Löschung markieren, Löschungsmarkierungen aufheben, Mail‐Statistiken erfragen
Update: nachdem Client quit gesendet hat; Mail‐Server löscht die mit delete markierten Nachrichten
Im Prinzip zwei Varianten möglich:
• Variante: download‐and‐delete
• Variante: downlad‐and‐keep
Mail‐Access‐Protokolle: POP3
Grundlagen der Rechnernetze ‐Applikationsschicht 27
Beispiel einer Download‐and‐Delete‐Transaction (c: client, s: server) C: list
S: 1 498 S: 2 912 S: .
C: retr 1
S: (blah blah blah ...
S: ...
S: ... blah blah blah) S: .
C: dele 1 C: retr 2
S: (blah blah blah ...
S: ...
S: ... blah blah blah) S: .
C: dele 2 C: quit
S: +OK POP3 server signing off
Mail‐Access‐Protokolle: IMAP, Web‐basiert
Grundlagen der Rechnernetze ‐Applikationsschicht 28
POP3 und mehrere Client‐Rechner (z.B. Desktop‐PC, Notebook)?
• Nur downlad‐and‐keep sinnvoll
• Mailbox aufräumen und in Foldern verwalten ist kompliziert, wenn alle Rechner konsistent gehalten werden sollen
Bessere Lösung: IMAP (RFC 3501)
• Nachrichten verbleiben auf dem Server und werden dort verwaltet (herunter geladene Nachrichten liegen aber auch lokal vor)
• Jede Mail‐Nachricht ist einem Folder zugeordnet (z.B. Inbox)
• User kann Nachrichten auf dem Server löschen und in Folder verschieben
• Nachrichten können auf dem Server durchsucht werden
• Nachrichten können nur Teilweise herunter geladen werden (z.B. nur Header oder nur ein Teil einer Multipart‐MIME‐Message)
Alternative Lösung: Web‐basiert (HTTP)
• Email‐Zugang über Browser (z.B. Google‐Mail oder SoGo an unserer Uni)
• Kommunikation mit der Mailbox über Browser (HTTP‐basiert)
• HTTP‐Kommunikation aber nur zwischen User‐Agent und Mail‐Server
• Kommunikation der Mail‐Server weiterhin über SMTP
Übersicht
• Web und HTTP
• File Transfer: FTP
• Electronic Mail
• Domain Name System (DNS)
29 Grundlagen der Rechnernetze ‐Applikationsschicht
DNS Übersicht
Grundlagen der Rechnernetze ‐Applikationsschicht 30
Problem:
• IP braucht IP‐Adressen (z.B. 121.7.106.83)
• Menschen brauchen Host‐Namen (www.uni‐koblenz.de)
Aufgabe von DNS: Directory‐Service zur Übersetzung von Host‐Name in IP‐
Adresse
• DNS ist eine verteilte Datenbank auf Basis einer Hierarchie von DNS‐Servern (häufig UNIX‐Maschinen auf denen Berkeley Internet Name Domain (BIND) läuft)
• DNS ist ein Protokoll zur Abfrage von Übersetzungen auf den DNS‐Servern DNS ist auf der Anwendungsschicht
• Läuft nur auf den End‐Systemen (Client, Server) nicht auf Routern
• Verwendet UDP (Port 53)
Spezifikation: RFC 1034, RFC 1035 und Aktualisierungen in weiteren RFCs
DNS Übersicht
Grundlagen der Rechnernetze ‐Einführung 31
H N S
• Client‐Server‐Prinzip
• Beispiel: HTTP‐Anfrage an Web‐Server www.someschool.edu erfordert DNS Abfrage der IP
1. Client‐Seitig: DNS‐Anwendung
2. Browser extrahiert Host‐Name www.someschool.edu aus der URL und ruft damit DNS‐Anwendung auf (z.B. UNIX‐System: gethostbyname())
3. DNS‐Client sendet Anfrage mit dem Hostnamen an DNS‐Server
4. DNS‐Client empfängt irgendwann (typischerweise im Bereich Millisekunden bis Sekunden) eine DNS‐Antwort mit der IP‐Adresse zu www.someschool.edu 5. Browser kann TCP‐Verbindung auf Basis von IP‐Adresse und Port (z.B. Port 80
für HTTP‐Server) herstellen
Client:
DNS‐Client und z.B. Web‐Browser
Server:
DNS‐Server
DNS Übersicht
Grundlagen der Rechnernetze ‐Applikationsschicht 32
DNS macht/kann aber noch mehr
• Host Aliasing
• Beispiel eines Canonical Host‐Namens: relay1.wes‐coast.enterprise.com
• Beispiel eines Alias‐Host‐Namens: enterprise.com, www.enterprise.com
• DNS zur Abfrage des Canonical‐Host‐Names zu einem Alias‐Host‐Name
• Mail Server Aliasing
• Beispiel eines Canonical‐Host‐Name eines Mail‐Servers: relay1.west‐
coast.hotmail.com
• Beipiel einer Email‐Adresse: bob@hotmail.com
• DNS übersetzt Alias‐Host‐Name Hotmail.com ist den Canonical‐Host‐
Name
• (Bemerkung: Mail‐Server und Web‐Server können identische (aliased) Host‐Namen haben)
• Load Distribution
• Replizierte Server (z.B. für stark frequentierte Seiten wie cnn.com)
• DNS liefert liste von IP‐Adressen; Client nimmt in der Regel die erste IP
• Rotiere IP‐Reihenfolge
DNS Übersicht
Grundlagen der Rechnernetze ‐Applikationsschicht 33
Philosophisches
• Normalerwiese interagiert der User direkt mit den Application‐Layer‐
Protokollen (Web, Mail, FTP etc.)
• DNS ist für viele andere Dienste ein Core‐Internet‐Service auf der auf Anwendungsebene
• Typisches Beispiel der Internet Philosophie: vieles der Komplexität des
Internets ist am Rand des Internets
DNS: verteilte, hierarchische Datenbank
Grundlagen der Rechnernetze ‐Applikationsschicht 34
Warum nicht ein zentraler DNS‐Server?
• Single‐Point‐of‐Failure (SPOF) – ein Serverausfall legt das gesamte Internet lahm
• Verkehrsaufkommen – fast jeder Internet‐Host braucht DNS
• Kommunikationsdistanz – Problem den einen DNS‐Server sinnvoll auf dem Globus zu plazieren
• Verwaltung – fast jeder Server‐Host muss über DNS auffindbar sein
Also: wie immer, ein Skalierbarkeitsproblem. Es kommt nur eine verteilte Lösung in Frage.
Außerdem nicht ein einziger Provider: hierarchische Organisation
DNS: verteilte, hierarchische Datenbank
Grundlagen der Rechnernetze ‐Applikationsschicht 35
Root DNS‐Server
com DNS‐Server
org DNS‐Server
edu DNS‐Server
yahoo.com DNS‐Server
amazon.com DNS‐Server
pbs.org DNS‐Server
poly.edu DNS‐Server
umass.edu DNS‐Server
Root DNS Server
Top‐Level‐Domain (TLD) DNS Server
Authoritative DNS Server
(*) Beispiel und Abbildung aus Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
Kleiner Ausschnitt aus der DNS Server‐Hierarchie
(*)Root‐DNS‐Server
• Root‐Server werden von verschiedenen Institutionen betrieben. Die Internet Corporation for Assigned Names and
Numbers (ICANN) koordiniert den Betrieb
• 13 Root‐DNS‐Server (A bis M)
• Allerdings steht jeder Buchstabe für einen Cluster von replizierten Servern
• (Bemerkung: Anycast, Alternative Roots)
DNS: verteilte, hierarchische Datenbank
Grundlagen der Rechnernetze ‐Applikationsschicht 36
Root DNS‐Server
com DNS‐Server
org DNS‐Server
edu DNS‐Server
yahoo.com DNS‐Server
amazon.com DNS‐Server
pbs.org DNS‐Server
poly.edu DNS‐Server
umass.edu DNS‐Server
Root DNS Server
Top‐Level‐Domain (TLD) DNS Server
Authoritative DNS Server
(*) Beispiel und Abbildung aus Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
Kleiner Ausschnitt aus der DNS Server‐Hierarchie
(*)Top‐Level‐Domain‐Server
• Beispiel: com, org, net, edu, gov
• Beispiel für Länder‐Top‐Level‐Domains:
de, uk, fr, ca, jp
• Verwaltet durch Unternehmen
Authoritative DNS Server
• Öffentlich erreichbare Server eines Unternehmens / einer Einrichtung müssen über solche DNS‐Server erreichbar sein
• Kann über eigene DNS‐Server oder
über einen Dienstleister realisiert sein
DNS: verteilte, hierarchische Datenbank
Grundlagen der Rechnernetze ‐Applikationsschicht 37
Root DNS‐Server
com DNS‐Server
org DNS‐Server
edu DNS‐Server
yahoo.com DNS‐Server
amazon.com DNS‐Server
pbs.org DNS‐Server
poly.edu DNS‐Server
umass.edu DNS‐Server
Root DNS Server
Top‐Level‐Domain (TLD) DNS Server
Authoritative DNS Server
(*) Beispiel und Abbildung aus Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
Kleiner Ausschnitt aus der DNS Server‐Hierarchie
(*)Ein weiterer wichtiger DNS‐Server: Local DNS‐Server
• Durch ISP (z.B. Uni/Campus, Unternehmen, lokaler ISP) realisiert
• Bekannt gemacht in der Regel über DHCP (siehe z.B. Netzstatus des Betriebssystems)
• In der Regel nahe am Host
• Agiert als Proxy zwischen Host und DNS‐Infrastruktur
H N S
Beispiel DNS‐Anfrage
Grundlagen der Rechnernetze ‐Applikationsschicht 38
Abbildung aus Kurose/Ross „Computer Networking:
A Top‐Down Approach“, 2008
1. Anfrage „gaia.cs.umass.edu“ am local DNS‐Server dns.poly.edu
2. Anfrage „gaia.cs.umass.edu“ am Root‐DNS
3. Ergebnis: Liste von TLD‐Server, die für edu zuständig sind
4. Anfrage „gaia.cs.umass.edu“ an einen der TLD‐Server
5. Ergebnis: IP des zuständigen auth.
DNS‐Server dns.cs.umass.edu
6. Anfrage „gaia.cs.umass.edu“ an DNS‐
Server dns.cs.umass.edu
7. Ergebnis: IP von gaia.cs.umass.edu 8. Zurücksenden des Ergbnisses von
dns.poly.edu an cis.poly.edu Damit: 4 Anfragenachrichten und 4
Antwortnachrichten für eine einzige DNS‐
Abfrage!?! Noch schlimmer:
Beispiel DNS‐Anfrage
Grundlagen der Rechnernetze ‐Applikationsschicht 39
Abbildung nach Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
• TLD‐Server muss den auth. Server nicht unbedingt schon kennen; TLD‐Server kennt nur einen intermediate DNS‐Server
• Beispiel: intermediate‐Server
dns.umass.edu und jedes Department hat einen eigenen DNS‐Server, z.B.
dns.cs.umass.edu
Damit: 5 Anfragenachrichten und 5
Antwortnachrichten für eine einzige DNS‐
Abfrage!?!
Lösung? Caching!
• DNS‐Server‐Antworten werden in Cache gespeichert
• Signifikante Reduktion von Nachrichten und Latenz
• Zuordnung von Domain‐Name auf IP ist nicht permanent; Einträge verweilen in Cache bis zu einem Timeout (z.B. zwei Tage)
dns.umass.edu
dns.cs.umass.edu
DNS‐Anfrage: rekursiv versus iterativ
Grundlagen der Rechnernetze ‐Applikationsschicht 40
Abbildungen aus Kurose/Ross „Computer Networking:
A Top‐Down Approach“, 2008
Iterative Query
Rekursive Query
In der Regel:
• Anfrage an Local DNS‐Server rekursiv
• Der Rest Iterativ
• (Am häufigsten jedoch Cache‐Hit)
DNS‐Records
Grundlagen der Rechnernetze ‐Applikationsschicht 41
DNS‐Server speichern Ressource‐Records (RRs)
DNS‐Reply‐Nachrichten beinhalten ein oder mehrere auf die Anfrage passende RRs.
RRs bestehen aus 4‐Tupel (Name, Value, Type, TTL)
TTL ist die Lebensdauer des RR (wird danach aus Cache entfernt) (Name, Value) hängt von Type ab
• Type = A: Name ist Host‐Name und Value ist IP‐Adresse Beispiel: (relay1.bar.foo.com, 145.37.93.126, A)
• Type = NS: Name ist Domain und Name ist der Name eines auth. DNS‐Server, der die IP‐Adressen der Hosts bestimmen kann
Beispiel: (foo.com, dns.foo.com, NS)
• Type = CNAME: Name ist der canonical Host‐Name für den Alias‐Host‐Name Beispiel: (foo.com, relay1.bar.foo.com, CNAME)
• Type = MX: Name ist der canonical Name eines Mail‐Servers zu einem Alias‐Host‐Name Beispiel: (foo.com, mail.bar.foo.com, MX)
• Erlaubt ein und denselben Alias für Mail‐Server und z.B. Web‐Server Beispiel: foo.com für joe@foo.com und ww.foo.com
• Unterscheidung durch Anfrage entweder MX oder CNAME
DNS‐Nachrichten
Grundlagen der Rechnernetze ‐Applikationsschicht 42
DNS‐Query und ‐Reply‐Nachrichten haben dasselbe Format 12 Byte Header
• Identification: Client kann damit Replay seinem Request zuordnen (z.B. mehrere gleichzeitige ausstehende Requests)
• Flags:
• 1‐Bit Query/Reply‐Flag: Unterscheidung von Query‐ und Reply‐Nachricht
• 1‐Bit Authoritative‐Flag: 1, wenn Server authoritative für den angefragten Namen
• 1‐Bit Recursion: in Query: Recursion‐Desired in Reply: Recursion‐Available
• Number‐Fields: Anzahl Vorkommen der folgenden vier möglichen Datentypen
Abbildung aus Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
DNS‐Nachrichten
Grundlagen der Rechnernetze ‐Applikationsschicht 43
Questions: Einträge der Form (Name, Type) (z.B. Type A oder Type MX) Answers: Antwort in Form von RRs (Name, Value, Type, TTL)
• Reply kann mehrere RRs enthalten
• z.B. Host mit mehreren IP‐Adressen für Load‐Balancing Authority: Reply‐Einträge über zuständige Authoritative‐Server
Additional Information: Beispiel „Reply auf MX‐Query: Ergebnis = canonical Name des Mail‐Servers und zusätzlich Type A Record für dessen IP‐Adresse“
Abbildung aus Kurose/Ross „Computer Networking: A Top‐Down Approach“, 2008
Eintragen von RR in die DNS Datenbank
Grundlagen der Rechnernetze ‐Applikationsschicht 44
Beispiel: Neue Firma Network Utopia mit Domain‐Namen networkutopia.com Networkutopia.com muss über einen Registrar angemeldet werden
• Registrar bietet solche kostenpflichtige Dienstleistung an
• Registrare können auf www.internic.net gefunden werden
Ggf. wird auch IP eines primären und sekundären Authoritativen DNS‐Server angegeben
• Zum Beispiel: dns1.networkutopia.com und dns2.networkutopia.com mit 212.212.212.1 und 212.212.212.2
• Registrar veranlasst Eintragung von Type NS und Type A Eintrag in TLD com, d.h. für primary authoritative Server networkutopia.com:
(networkutopia.com, dns1.networkutopia.com, NS) (dns1.networkutopia.com, 212.212.212.1, A)
Dann noch ein Web‐Server und Mail‐Server‐Eintrag in den eigenen authoritativen DNS‐
Server
• Type A Eintrag für Web‐Server www.networkutopia.com und
• Type MX Eintrag für Mail‐Server mail.networkutopia.com
In der Regel alles noch einfacher: Provider stellt für Kunden die Server zur Verfügung.
Kunde registriert über Provider (der ist dann auch der Registrar) einfach eine Domain.
Robustheit von DNS
Grundlagen der Rechnernetze ‐Applikationsschicht 45
DNS ist eine kritische Komponente der Internet‐Infrastruktur Diskussion möglicher Angriffe
• DDoS‐Attacke gegen DNS‐Root‐Server
• Auf Basis von ICMP‐Ping oder
• Fluten mit DNS‐Anfragen bzgl. Top‐Level‐Domains (z.B. alle Server für die Top‐Level‐Domain com)
• Man‐in‐the‐Middle‐Attack
• Abfangen von Client‐Queries oder
• Eintragen von falschen Cache‐Einträgen
• Nutzen der DNS‐Infrastruktur, für DDoS‐Attacke auf authoritative DNS‐Server mit gefälschten Source‐Adressen
DNS ist aber sehr robust
• DNS‐Server Konfiguration
• Caching
Zusammenfassung und Literatur
Grundlagen der Rechnernetze ‐Applikationsschicht 46
Zusammenfassung
• Anwendung versus Anwendungsprotokoll (z.B. Email‐Client und Server versus SMTP, POP3, IMAP, HTTP)
• Anwendungen und deren Anwendungsprotokolle haben
unterschiedliche Anforderungen an das Transport‐Protokoll:
Grundlagen der Rechnernetze ‐Applikationsschicht Abbildung aus Kurose/Ross „Computer 47
Networking: A Top‐Down Approach“, 2008
Besonderheit DNS: Dienst auf Anwendungsebene, welcher von fast allen anderen
Anwendungen genutzt wird
Zusammenfassung
• Damit ergibt sich in der Regel Auswahl zwischen TCP oder UDP
• Was ist mit Sicherheit? Erweiterung von TCP für Sicherheit auf
Anwendungsebene mittels SSL (Secure Sockets Layer) bzw. TLS (Transport Layer Security)
• Was ist mit Bandbreiten‐ und Latenz‐Garantien? Anwendungen mit solchen Anforderungen „laufen in der Regel“; können mit
nichtvorhandenen Garantien im gewissen Rahmen umgehen.
Grundlagen der Rechnernetze ‐Applikationsschicht Abbildung aus Kurose/Ross „Computer 48
Networking: A Top‐Down Approach“, 2008
Literatur
• James F. Kurose, Keith W. Ross, „Computer
Networking: A Top‐Down Approach“, 4th Edition, 2008
– 2.1.4 Transport Services Provided by the Internet – 2.2 The Web and HTTP
– 2.3 File Transfer: FTP
– 2.4 Electronic Mail in the Internet
– 2.5 DNS‐The Internet‘s Directory Service – 2.9 Summary
Grundlagen der Rechnernetze ‐Applikationsschicht 49