Mit dem Namen `Internetwork´ bezeichnet man den Zusammenschluß von vielen kleinen Teilnetzwerken der verschiedensten Technologien, die durch das darüberliegende TCP/IP zusammengebunden werden. Die weltweite Verbindung von schätzungsweise 60.000 solcher TCP /IP-Netzwerken, die aus dem ARPANET entstanden ist, trägt den Namen das Internet.
Heute wird aber schon von vielen die Meinung vertreten, das Internet sei viel mehr als nur ein gewöhnliches Computernetz. Es ist vielmehr ein riesiges, weltweit verfügbares Informationsmedium, das keinen aussperrt, der die falsche Kleidung trägt, die falsc he Hautfarbe hat oder der falschen Religion angehört. Und jeder kann jederzeit mitmachen.
Der erste Teil des Kapitels behandelt die Entstehung des Internet, von den anfänglichen vier Computern bis heute, wo schon über 10 Millionen Computer am weltgrößten Computernetz hängen. Der zweite Teil beschreibt kurz den Aufbau des Internet anhand eines B eispieles. Im dritten Teil wird die Übertragung von Daten beschrieben. Teil vier beschreibt den Aufbau der im Internet verwendeten Adressen, und der fünfte Teil behandelt die wichtigsten Dienste, die im Internet benutzt werden können.
Das heute allgemein bekannte Internet nahm seinen Ursprung im Jahre 1957 [RZ96]. Damals gründete das US Verteidigungsministerium (Department of Defense, DoD) die Advanced Research Projects Agency (ARPA), um die Führung in Wissenschaft und Technologie im mili tärischen Bereich zu gewährleisten. Im Mittelpunkt stand dabei die Erforschung verschiedener Arten von paketorientierten Netzwerken, welche auch nach einem Atomschlag noch funktionieren sollten. Es mußten auch Protokolle für die transparente Kommunikation von netzwerkfähigen Computern über diese paketorientierten Netzwerke entwickelt werden.
12 Jahre später, im Jahre 1969, wurde dann der erste Prototyp - das ARPANET - vom US Verteidigungsministerium in Betrieb genommen. Das Netz bestand aus nur vier Computern.
Im selben Jahr entstand auch der erste Request for Comment (RFC) “Host Software“.
RFC's spielen im Internet eine sehr wichtige Rolle. Sie sind eine Reihe offizieller Dokumente, die von der IETF verwaltet und der Öffentlichkeit zur Verfügung gestellt werden. Sie dienen in erster Linie zur einfachen und unbürokratischen Standardisierung von Verfahren, die in irgendeiner Form mit dem Internet verwendet werden. Es kann sich dabei um eine Anmerkung zu bestehenden Verfahren, einen Verbesserungsvorschlag oder den Vorschlag zu einem neuen Verfahren handeln. Jeder, der am Internet interessiert ist, kann einen solchen RFC beim RFC-Editor einreichen.
In den folgenden Jahren entstanden die ersten wichtigen Dienste im Internet: Telnet zur Nutzung von Ressourcen anderer Computer und EMail zur elektronischen Versendung von Nachrichten und Briefen. Eine genaue Beschreibung der wichtigsten Dienste im Interne t erfolgt im Kapitel 2.5.
1973 wurden die ersten internationalen Verbindungen zu den Ländern England und Norwegen hergestellt. Und es entstand ein weiterer wichtiger Dienst im Internet: FTP zum Übertragen von Dateien. 1979 wurde wieder ein neuer Dienst, das Usenet, eingerichtet. Da s Usenet ist eine Art schwarzes Brett, mit dessen Hilfe Benutzer innerhalb des Netzes über verschiedenste Dinge miteinander diskutieren können. Die Beiträge der Benutzer sind nach Themenbereichen, den sogenannten Newsgruppen, sortiert.
Da viele Personen keinen Zugriff auf das militärische ARPANET hatten, wurden 1980-81 zwei weitere Netzwerkprojekte, BITNET und CSNET, ins Leben gerufen. BITNET (Because It's Time NETwork) verwendet das NJE Protokoll von IBM und verbindet vor allem IBM Computer im akademischen Bereich an Schulen und Forschungszentren. In seiner größten Ausdehnung (1992) beteiligten sich 49 Staaten am BITNET. Heutzutage existieren zwar Gateways zum Internet, jedoch wird das BITNET immer mehr vom Internet ersetzt. CSNET (Computer and Science Network) wurde von der National Science Foundation (NSF) gegründet und den Universitäten, der Industrie und Forschungsgruppen der Regierung zur Verfügung gestellt. Mit der Gründung der Corporation for Research and Education Networking (CREN) versch molz 1987 das CSNET mit dem BITNET.
1982 wurden von der ARPA zwei neue Protokolle zur Datenübertragung in Netzwerken eingeführt: TCP (Transmission Control Protocol) und IP (Internet Protocol), heute vielfach unter dem Titel TCP/IP bekannt. Dies führte zu einer ersten Definition des Begriffes “Internet“ als eine Menge von miteinander verbundenen Netzwerken, die vorwiegend das TCP/IP Protokoll verwenden. Daraufhin entschied sich auch das DoD, TCP/IP als Standard Protokoll für das ARPANET zu verwenden. In Europa wurde inzwischen das European UNI X Network (EUNet) gegründet. Es unterstützte die Dienste EMail und Usenet.
1983 wurde die erste Version des UNIX Betriebssystems 4.2BSD mit integriertem TCP/IP veröffentlicht. Im selben Jahr wurde der militärische Teil vom ARPANET, das MILNET, in das „Defense Data Network“ ausgegliedert und der restliche Teil mit dem CSNET verbun den.
Im Jahre 1984 durchbrach die Anzahl der Computer im Internet die 1000er Marke. Weiters wurde das DNS (Domain Name Service) eingeführt, um die Adressierung der Computer zu vereinfachen. Statt der 32-Bit IP-Adresse konnte nun ein Name für die Computer verwen den werden. In Japan entstand das JUNET (Japan UNIX Network).
1986 gründete die U.S. National Science Foundation (NSF) das NSFNET als schnelle Verbindung schon existierender kleiner Netzwerke. Die Geschwindigkeit betrug 56 Kbps. Es folgte eine regelrechte Explosion von Verbindungen zum Netz, vor allem von Universitä ten. Heute stellt das NSFNET, mit einer Geschwindigkeit von 45 Megabits pro Sekunde, den wichtigsten Backbone für das Internet in den USA dar.
Zwischen 1987 und 1989 stieg die Anzahl der Computer im Internet von 10.000 auf 100.000. Um die Datenübertragungsgeschwindigkeit an die neuen Anforderungen anzupassen, wurde das NSFNET auf 1.544 Mbps erweitert. Es entstanden weitere Verbindungen zu den Län dern Kanada, Dänemark, Finnland, Frankreich, Island, Norwegen und Schweden. Inzwischen gab es schon über 1000 RFC's und es wurde zur Koordination von Entwicklungen für das Internet die Internet Engineering Task Force (IETF) gegründet. Die IETF ist eine offen e internationale Vereinigung von Herstellern, Operatoren und Forschern im Bereich Computer Netzwerke, die sich mit der Entwicklung der Internet Architektur und mit dem reibungslosen Betrieb des Internet beschäftigen.
1990 wurde das ursprüngliche ARPANET aufgelöst. Im Internet hingegen entstanden die ersten kommerziellen Provider, das Internet wird öffentlich. Weitere Länder, darunter auch Österreich, stießen zum Internet.
1991 entstanden weitere Dienste im Internet. Wais, ein Suchsystem für das Netz, Gopher, ein textbasierendes Informationssystem und schließlich das World-Wide-Web (WWW), ein grafisches Hypertext Informationssystem. Der Backbone des NSFNET wurde auf 44,736Mbps aufgest ockt und der Verkehr über das NSFNET erreichte 1 Billion (= 1012) Bytes pro Monat.
1992 waren bereits über 1 Million Computer mit dem Netz verbunden. In den USA ist die erste Bank, die World Bank, im Internet vertreten. 1993 wurde von der NSF ein spezielles Informationssystem über das Internet, genannt InterNIC, gegründet.
Das Internet Talk Radio beginnt zu “senden“ und wichtige Institutionen wie die UNO oder Das Weiße Haus sind über das WWW erreichbar. Besonders die beiden Informationsdienste trugen zur rasanten Verbreitung des Internet bei. WWW erreichte dabei Steigerungsraten von 350% pro Jahr und Gopher sogar 997%. Mosaic, ein Programm zur Darstellung des WWW Informationsangebotes, verbreitete sich ebenso rasch im Internet. 1994 überholte WWW den Dienst Telnet und im April 1995 wurde FTP von WWW vom ersten Platz verdrängt.
1994 feierte das Internet seinen 25sten Geburtstag und mittlerweile kann man sogar eine Pizza über das Netz bestellen. Es mußten auch traditionelle Anbieter eigener Netzwerke wie zum Beispiel Compuserve und American Online erkennen, daß sie ohne eine Verbi ndung ihrer Netze zum Internet keine neuen Kunden mehr gewinnen konnten.
Inzwischen ist das Informationsangebot im Internet so riesig geworden, daß man ohne spezielle Suchsysteme beinahe überhaupt nichts mehr finden kann. Die 1995 eingeführten Suchmaschinen (engl. search engines) gehören deshalb schon zu den wichtigsten Hilfsm itteln im Internet. In diesem Jahr fand ein weiteres, für das Internet maßgebliches Ereignis statt: Die Firma Sun präsentierte ihre neuentwickelte Programmiersprache JAVA. Java ist eine plattformunabhängige, objektorientierte Programmiersprache, deren Program me im Bytecode direkt über das Internet geladen und ausgeführt werden können. Es ergeben sich dadurch völlig neue Möglichkeiten sowohl im Bereich der Hardware als auch der Software. Man kann sich nun Computer vorstellen, welche die benötigten Programme dir ekt vom Internet laden und ausführen. Man muß kein riesiges Softwarepaket kaufen, sondern bezahlt jedesmal nur für das Ausführen der benötigten Softwareteile. Es wird sich in nächster Zukunft zeigen, ob diese Ideen auch praktisch realisiert werden können.
Im Prinzip ist das Internet eine Verbindung vieler kleiner Netzwerke. Am einfachsten ist der Aufbau des Internet anhand eines Beispiels zu verstehen. Im folgenden wird deshalb die Einbindung des lokalen Netzes eines Institutes der TU Graz in das Internet e rklärt.
Das Institut für Angewandte Informationsverarbeitung und Kommunikationstechnologie
(IAIK) der TU Graz betreibt ein lokales Netzwerk (LAN). Ein LAN, oder Lokal
Area Network ist ein Netzwerk, welches alle Computer direkt mit einem
Kabel miteinander verbinde t. Die Hauptaufgabe eines LAN's ist es eine
gemeinsame Nutzung von
verschiedenen Ressourcen wie Drucker, CD-ROM Laufwerke, Streamer oder Festplattenspeicher
zu ermöglichen. In weiterer Folge ermöglicht ein Netzwerk auch
die Kommunikation zwischen Menschen , die an den jeweiligen Computern arbeiten.

Abbildung 2-1 Local Area Network
Dieses Netzwerk sowie auch viele andere Netzwerke im Bereich der TU sind mit dem Hochgeschwindigkeitsnetz (TUGNET) der TU Graz verbunden und bilden ein Wide Area Network (WAN). Die Verbindung erfolgt über einen speziellen Computer (Router), der im allgemeinen L AN's mit WAN's oder WAN's mit größeren WAN's verbindet. Seine Aufgabe ist die Weiterleitung der ankommenden Pakete entweder zum richtigen Netzwerk oder zum richtigen, lokal verbundenen Computer.

Abbildung 2-2 TUGNET (WAN)
Der Bereich, über den sich dieses Hauptnetz erstreckt, wird auch Domain genannt. Eine Domain ist ein selbst verwaltetes Teilnetzwerk im Internet, wobei die Adresse eines jeden Comuters einem bestimmten Adreßschema folgen muß. Innerhalb der Domäne der TU-Gr az zum Beispiel beginnt jede IP-Adresse mit den Zahlen 129.27.
Eine IP Adresse ist eine positive, ganze Zahl, die jedem Computer im Internet eine eindeutige Adresse zuordnet. Eine genauere Beschreibung von IP-Adressen erfolgt im Abschnitt Adressierung im Internet.
Die nächste Stufe in dieser Hierarchie bildet das ACONET. Das ACONET ist ein 34 Mbps Hochgeschwindigkeits-Netz in Österreich, das Universitäten, Schulorganisationen und auch einige Firmen miteinander verbindet. Ausgehend von der Zentrale in Wien existieren weit ere Verbindungen zu Netzen innerhalb Europas und über New York zum NSFNET in den Vereinigten Staaten.

Abbildung 2-3 ACONET
Zur Datenübertragung im Internet werden Protokolle verwendet, die unter dem Namen TCP/IP zusammengefaßt werden [DOUC]. Diese Protokollfamilie war zu einem großen Teil mitverantwortlich für die heutige Verbreitung des Internet, denn TCP/IP war das erste Pro tokoll, das folgende Vorteile bot:
Üblicherweise werden bei TCP/IP vier verschiedene Schichten unterschieden. Die Grundlage bildet die Netzwerkschicht, deren Aufgabe der eigentliche Datentransport ist. Sie kommuniziert direkt mit der darunterliegenden Hardware (Netzwerkkarte). Darauf aufba uend liegt die Internet-Schicht, die die erste Abstraktion von einem konkreten Netzwerk darstellt. Die Daten werden auf dieser Ebene mit dem Internet Protokoll (IP) in Form von Datenpaketen, sogenannten Datagrammen, übertragen. Für die Netzwerkschicht stel lt ein solches Datagramm irgendwelche beliebigen Daten dar, die mit einem Header versehen über das Netz übertragen werden. Aber auch das IP-Paket selbst enthält wieder ein Datenpaket einer höheren Protokollebene, das wiederum aus einem Header und den eigen tlichen Daten besteht.

Abbildung 2-4 Datenübertragung im Internet
IP ist ein verbindungsloses Protokoll, das bedeutet, IP Datenpakete werden einfach mit einer Quell- und Zieladresse versehen und ohne Verbindungsaufbau in das Netz geschickt. Dabei kann es natürlich auch vorkommen, daß einzelne Pakete doppelt oder gar nich t ankommen. Es ist Aufgabe der darüberliegenden Schicht, solche Fehler zu erkennen und entsprechend zu reagieren. Hauptaufgabe von IP ist es also einerseits die Unterschiede verschiedener darunterliegender Netzwerkschichten zu verbergen und andererseits ei ne einheitliche Schnittstelle zu höheren Schichten zur Verfügung zu stellen. IP führt zu diesem Zweck ein einheitliches Adressierungsschema ein. Jedes IP Paket enthält zwei 32 Bit Adressen, die Absender- und die Empfängeradresse, die jeden Computer im Inte rnet eindeutig identifizieren. Zusätzlich enthält jedes IP Paket Informationen über das Protokoll der darüberliegenden Transportschicht.
Eines der wichtigsten Protokolle der Transportschicht ist TCP (Transmission Control Protokoll). Die Hauptaufgabe von TCP ist es, die Einschränkungen von IP auszugleichen. Für den Benutzer soll es nicht mehr sichtbar sein, daß darunterliegende Schichten Da tenpakete versenden, sondern statt dessen soll der Benutzer mit einem Byte-Strom wie bei einer gewöhnlichen Datei arbeiten können. TCP garantiert, daß alle Pakete in der richtigen Reihenfolge ankommen und nur einmal vorhanden sind. Zusätzlich multiplext T CP die Verbindung zwischen zwei Rechnern: während auf der Internet-Schicht zwischen zwei Computern nur eine Verbindung zur gleichen Zeit existieren kann, teilt TCP diese Verbindung in virtuelle Kanäle auf, die über sogenannte Portnummern angesprochen werde n können. TCP bietet im Gegensatz zu IP eine verbindungsorientierte Kommunikation.
Als letzte Schicht folgt die Anwendungsschicht. Viele verschiedene Dienste der Anwendungsschicht setzen auf TCP/IP auf, von denen die meisten ein eigenes, anwendungsspezifisches Protokoll zwischen dem Server und den verschiedenen Client-Programmen verwend en.
Um am Internet aktiv teilhaben zu können, benötigt man als erstes Adressen von Computern oder Personen, mit denen man kommunizieren will. Dieser Abschnitt beschreibt die im Internet verwendeten Adreßspezifikationen.
Wie bereits im vorigen Abschnitt erwähnt, besitzt jeder einzelne Computer im Internet eine eindeutige IP Adresse. Eine IP Adresse ist eine positive, ganze, 32 Bit lange Zahl, wobei aber die einzelnen 4 Byte durch Punkte getrennt angegeben werden. Eine gült ige IP Adresse wäre zum Beispiel: “129.27.2.10“. Da es ziemlich schwierig ist, sich mehrere IP Adressen zu merken, wurden im Jahre 1984 Domain Name Server (DNS) eingeführt, die die Zuordnung eines Namens zu einer IP Adresse ermöglichen. Somit kann der Adre sse 129.27.2.10 der Name news.tu-graz.ac.at zugeordnet werden. Im Namen des Computers steckt aber mehr als bloß die IP Adresse. Man kann auch Unterbereiche (sub-domains) erkennen, die durch Punkte voneinander getrennt sind und von rechts nach links den adr essierten Computer immer genauer spezifizieren. Im obigen Beispiel ergibt sich folgende Bedeutung:
Bei der Adressierung von Computern im Internet muß aber noch auf einen weiteren Parameter, die Portnummer, geachtet werden. Server sind meist sehr leistungsfähige und daher sehr teure Computer. Aus diesem Grund laufen auf einem Server oft mehrere Programm e, die Dienstleistungen im Internet anbieten. Das können zum Beispiel ein FTP-Server, ein WWW-Server und ein Telnet-Server sein. Damit nun ein Client Programm eine Verbindung zum richtigen Server herstellen kann, wird das Netzwerk-Interface eines Computers auf TCP-Ebene in Ports aufgeteilt, und jedes Server Programm erwartet Verbindungen über das ihm zugeordnete Port.

Abbildung 2-5 Zuordnung von Ports
Will ein Client eine Verbindung zum WWW Server aufbauen, so muß er den Port mit der Nummer 80 verwenden. Will er hingegen mit dem FTP Server kommunizieren, so benutzt er die gleiche Computeradresse, aber dieses Mal den Port mit der Nummer 21. Verwendet man einen WWW-Browser als Client, so wird die Portnummer nach der Computeradresse durch einen Doppelpunkt getrennt angegeben (z.B.: popper.iaik.tu-graz.ac.at:80). Für die Dienste im Internet sind diese Portnummer durch den RFC 1700 (Assigned Numbers) genormt. Das heißt die Standardportnummer jedes WWW Servers lautet 80, die eines FTP Servers 21. Ist der Server mit einem anderen Port verbunden, so muß die Portnummer zusätzlich explizit angegeben werden.
Für die Adressierung von Personen gelten die gleichen Regeln wie bei der Adressierung eines Computers. Den einzigen Unterschied bildet das @ Zeichen in der Adresse. Die Adresse einer Person besteht immer aus der Kombination Benutzername@Computername, wobei statt dem Computernamen meist der Name der Domäne angegeben wird. Das DNS sorgt dann für die Umsetzung des Domänennamens in einen Computernamen. Die Adresse wplatzer@iaik.tu-graz.ac.at zeigt zum Beispiel eine Adresse mit einer Angabe des Domänennamens.
Das Internet stellt seinen Benutzern auf der Basis von TCP/IP als Transportprotokoll eine Vielzahl von Dienstleistungen zur Verfügung [HHRS94]. Diese Dienste sind normalerweise unter Verwendung weiterer Protokolle realisiert, die wiederum auf TCP/IP aufset zen. Es folgt nun eine Beschreibung der wichtigsten, im Internet jedem zur Verfügung stehenden Dienste.
Das Client/Server Prinzip ist eigentlich kein Dienst, den man als Anwender in Anspruch nehmen kann. Es handelt sich hierbei vielmehr um ein grundlegendes Prinzip, auf dem wichtige Dienste wie Gopher oder Word Wide Web aufbauen.
Wie bereits erwähnt, ist die gemeinsame Verwendung von Ressourcen eine Hauptanwendung von Netzwerken. Meistens ist dieses “Teilen“ durch zwei separate Programme implementiert, die auf verschiedenen Computern laufen. Ein Programm, der Server, stellt eine Re ssource zur Verfügung und das andere Programm, der Client, nutzt diese Ressource.
In einem lokalen Netzwerk sind solche Ressourcen meist irgendwelche Geräte (Hardware). Zum Beispiel speichert ein zentraler Computer die Dateien der Benutzer (File-Server) oder man kann einen zentralen Drucker benutzen (Print-Server). Im Internet spielen H ardware Server keine große Rolle, da miteinander kommunizierende Computer meist geographisch weit voneinander entfernt sind. Es werden daher hauptsächlich Informationsserver (Information Server) verwendet. Beim Internet Dienst News zum Beispiel kann ein Cl ient Programm zu einem News Server folgenden Befehl senden: „Sende mir alle neuen Newsgruppen seit 10.05.1996“, worauf der News Server die gewünschten Informationen zurücksendet. Der Ablauf dieses Informationsaustausches wird in Protokollen definiert, dere n Spezifikationen wiederum in den bereits erwähnten RFC's zur Verfügung stehen.
Eine Stärke dieses Prinzips liegt darin, daß die beiden Programme auf verschiedenen Computern mit verschiedenen Technologien unter verschiedenen Betriebssystemen 10.000 Kilometer entfernt laufen können. Es genügt, wenn man lediglich den Namen oder die IP-A dresse des anderen Computer kennt.
Telnet war die erste Dienstleistung, die im Internet benutzt werden konnte. Das Protokoll für eine Telnet Verbindung ist im RFC 318 beschrieben. Telnet erlaubt es, mit einem Computer am anderen Ende der Welt genauso einfach zu arbeiten wie mit dem Computer , an dem man gerade sitzt. Zu diesem Zweck startet man ein Programm, das auf den meisten Systemen telnet heißt. Dieses Programm sorgt dann dafür, daß alle Eingaben über die Tastatur zum anderen Computer und alle Ausgaben zurück zum eigenen Computer übertra gen werden. Man benutzt also den lokalen Bildschirm und die lokale Tastatur, arbeitet aber mit dem entfernten Computer. Das ganze funktioniert natürlich nur dann, wenn auf dem anderen Computer ein Telnet Server läuft und wenn man eine Zugangsberechtigung f ür diesen Computer besitzt.
Verwendet wird der Dienst Telnet zum Beispiel von Systemadministratoren, um entfernte Computer zu konfigurieren und zu warten. Es wird dazu einfach das Konfigurationsprogramm auf dem anderen Computer gestartet.
Eine weitere Anwendung ist die Benutzung sehr leistungsfähiger Computer für rechenintensive Aufgaben. Der Benutzer stellt eine Telnet Verbindung zu einem sehr schnellen Computer her und startet dort sein Programm. Das Ergebnis der Berechnungen wird wieder auf seinem Bildschirm angezeigt. In einem firmeninternen LAN genügt es deshalb meistens, einige wenige sehr leistungsstarke Computer zu installieren, da alle Benutzer ihre zeitkritischen Programme auf diesen Rechnern ausführen können.
Telnet wird auch oft für Suchprogramme in verschiedensten Datenbanken verwendet. So kann man zum Beispiel eine Telnet Verbindung zu einem Computer in einer Bibliothek aufbauen. Nach dem Starten eines geeigneten Programmes kann man ganz einfach in einer rie sigen Datenbank nach Büchern suchen. Dabei findet der leistungsstarke Bibliothekscomputer die gewünschten Bücher schneller als mein eigener Computer und es müssen nur relativ wenig Daten, die Suchkriterien und die Suchergebnisse, über das Netzwerk übertrag en werden.
EMail steht für electronic mail (elektronische Post) und ist einer der wichtigsten Dienste im Internet. Täglich werden unzählige elektronische Briefe quer über das Internet hin- und hergeschickt. Mittels EMail kann man jedem Benutzer des Internet binnen kü rzester Zeit einen elektronischen Brief zukommen lassen; ein entsprechender konventioneller Brief würde für die gleiche Entfernung einige Tage oder noch länger benötigen. Man braucht dafür nur ein geeignetes Programm und die EMail Adresse des Empfängers. N atürlich kann man mit dem Mail-System des Internet auch andere beliebige Daten wie zum Beispiel Bilder oder Programme versenden.
EMails haben ein standardisiertes Format und bestehen im wesentlichen aus zwei Teilen: einem Vorspann (header) und der Nachricht selbst (body). Im Header werden Informationen wie die Adresse des Senders, die Adresse des Empfängers, die Absendezeit, das Abs endedatum, die Überschrift der Nachricht usw. übertragen.
Die Übertragung von Mails im Internet geschieht mit einem speziellen Protokoll der TCP/IP Familie, dem SMTP (Simple Mail Transfer Protocol). Es beschreibt das Format von EMails und die Art und Weise wie EMails von einem Computer zum anderen weitergeleitet werden. Für diesen Zweck ist in jedem Computernetz ein Programm installiert, welches sich um die Weiterleitung der EMails kümmert. Dieses Programm nennt man transport agent. Auf UNIX Rechnern heißt dieses Programm meist sendmail und es kann auch direkt zur Erstellung von EMails verwendet werden. Mail-Programme für Benutzer kommunizieren auf UNIX Rechnern ebenfalls über SMTP mit den transport agents.
Auf PC's oder Macintosh Rechnern wird diese Aufgabe häufig von einem anderen Protokoll, dem POP (Post Office Protocol), übernommen. Es wird auf Computern verwendet, die nicht ständig mit dem Internet verbunden sind. Auf POP basierende Mail-Programme stell en von Zeit zu Zeit eine Verbindung zu einem Mail-Server her und prüfen, ob inzwischen neue EMails angekommen sind. Dieses Protokoll kann aber nur zum Holen von EMails verwendet werden. Zum Senden von EMails wird wieder das SMTP Protokoll verwendet.
Ein weiteres, relativ neues Protokoll für die Übertragung von EMails ist IMAP (Internet Message Access Protocol). Es wurde ebenfalls für Computer ohne direkte Internetanbindung entwickelt und besitzt einige Erweiterungen gegenüber POP. Zum Beispiel ist ein e Verwaltung der EMails am Server möglich. Dazu können EMails mit einem Status (gelesen, beantwortet, gelöscht, usw.) versehen oder zwischen Ordnern verschoben werden. Die Vorteile dieser Verwaltung zeigen sich aber erst, wenn das Mail-Konto von mehreren O ffline-Computern aus verwendet wird. Mittels POP würden in diesem Fall die EMails auf den verschiedenen Computern verstreut sein.
Mit Hilfe des SMTP Protokolls können nur reine ASCII Texte übertragen werden. Um auch die Übertragung von binären Daten wie Bildern oder Musikdateien zu ermöglichen, wurde ein neues, erweitertes Nachrichtenformat, genannt MIME, entwickelt. Die Name MIME st eht für Multipurpose Internet Mail Extensions. Dabei werden binäre Daten in reine ASCII Daten umgesetzt und in einer Kopfzeile vermerkt. Danach wird die EMail, die nun nur mehr aus ASCII Daten besteht, ebenfalls mit mit SMTP übertragen. Auf der Gegenseite werden die Daten wieder dekodiert und gespeichert.
Ein weiterer sehr wichtiger Dienst im Internet ist FTP. FTP steht für File Transfer Protocol und bezeichnet ein weiteres Protokoll für die Übertragung von Dateien im Internet. Mit Hilfe des Dienstes FTP können im Internet Dateien von einem Computer auf ein en anderen Computer übertragen werden.
Wie auch viele andere Internet Dienste basiert FTP auf dem Client/Server Prinzip; jedoch werden beim Aufbau einer FTP Verbindung zwei verschiedene Ports verwendet. Über das Port mit der Nummer 21 werden nur die Befehle für die Datenübertragung gesendet. D ie angeforderten Daten werden dann über Port 20 übertragen.
Auch bei diesem Dienst benötigt man wie bei Telnet eine Zugangsberechtigung zum Computer, von dem man Dateien laden will. Jedoch gibt es im Internet eine riesige Anzahl von FTP-Servern, von denen man auch ohne Zugangsberechtigung Daten beziehen kann. Diese Art von FTP-Servern werden anonymous FTP-Server genannt, da sie für jeden Benutzer auch ohne eine spezielle Berechtigung zugänglich sind. Am Anfang bei der Abfrage des User Namens gibt man entweder ftp oder anonymous ein. Als Paßwort muß meist die eigene EMail Adresse angegeben werden.
Der Dienst Usenet ist die Abkürzung für Users Network und stellt eine riesige Ansammlung von Diskussionsgruppen zur Verfügung. In den mehr als 10.000 existierenden Newsgruppen, und es werden immer mehr, diskutieren Millionen von Menschen überall auf der We lt. Beinahe für jedes Thema, das man sich vorstellen kann, existiert eine Newsgruppe. Man findet eine Menge nützlicher technischer Tips und Tricks aber auch die neuesten Witze oder eine Diskussionsgruppe über UFO Sichtungen.
Technisch gesehen werden die Artikel der verschiedenen Diskussionsgruppen mit dem Network News Transfer Protocol (NNTP) übertragen. Dabei tauschen benachbarte News-Server immer die neuesten Artikel miteinander aus. Nach einer bestimmten Ausbreitungszeit be findet sich ein neuer Artikel auf allen News-Servern im Internet. Es gibt aber auch lokale Diskussionsgruppen, die nicht über das ganze Internet verbreitet werden. Die Gruppe tu-graz.anzeigen.computer wird kaum einen Menschen in Amerika interessieren. Desh alb können Administratoren die News-Server so konfigurieren, daß lokale Gruppen nicht weiterverbreitet werden.
Einer der jüngsten Dienste im Internet ist das World Wide Web (WWW); veröffentlicht im Jahre 1991 von CERN(Centre Europèen de Recherches Nuclèaires, Genf). Jedoch bereits im April 1995 überholte WWW den bisherigen Spitzenreiter FTP und war somit innerhalb von nur 4 Jahren zum wichtigsten Dienst im Inte rnet geworden. Der Zugriff auf das WWW erfolgt mit einem Programm, welches Browser genannt wird.
Das World Wide Web, kurz WWW oder W3 wurde entwickelt, um unter nur einer Benutzeroberfläche die bisher existierenden Informationsquellen und Dienste des Internet einfach verwenden zu können. Entwickelt wurde dieses neuartige Informationssystem am Schweize r CERN (Centre Europèen de Recherches Nuclèaires) in Genf.
Im einfachsten Fall befinden sich diese Informationsquellen im lokalen Dateisystem eines Rechners. Zum Anzeigen der Daten wird nur ein geeignetes Programm (Browser) benötigt. Dieser Browser arbeitet dann als Filemanager mit integriertem Dateibetrachter, de r Inhalte von Dateien unterschiedlichster Formate darstellen kann. Seine wahre Stärke zeigt das System jedoch erst bei Verwendung der für WWW entworfenen Hypertextsprache HTML.
HTML (Hypertext Markup Language) ist eine Beschreibungssprache für Dokumente, die zusätzlich die Einbindung von Multi-Media Objekten und sogenannten Hyperlinks (Verbindungen) in das Dokument erlaubt. Hyperlinks sind Verweise innerhalb eines Dokumentes auf andere Hypertext Dokumente. Damit man Links von gewöhnlichem Text unterscheiden kann, werden sie vom Browser meistens in einer anderen Farbe oder unterstrichen dargestellt. Der Benutzer braucht mit der Maus nur einen solchen Link anzuwählen und sofort ersc heint das referenzierte Dokument auf dem Bildschirm. Hypertext Dokumente können aber auch Referenzen auf beliebige andere Datenformate enthalten. Wird zum Beispiel eine Postscript Datei referenziert, so holt sich der Browser die Datei vom Server und starte t dann ein für die Darstellung von Postscript geeignetes Programm.
Zum „weltweiten Netz“ wird das WWW, indem man den Computer mit dem Internet verbindet. Die HTML Dateien werden jetzt nicht mehr lokal, sondern über das Internet von einem WWW Server geladen. Hyperlinks können nun Daten, die sich auf WWW Servern irgendwo im Internet befinden, referenzieren. Auf diese Weise ist ein einheitlicher Zugriff auf alle bisher besprochenen Dienste möglich.
Bei der Adressierung eines Servers im Internet muß deshalb außer der Adresse auch noch zusätzlich der gewünschte Dienst, genauer gesagt, das zu verwendende Übertragungs-Protokoll, angegeben werden. Eine Adresse setzt sich deshalb aus folgenden Teilen zusam men:
Dienst://Serveradresse:Port/Pfad/Dokument
Dieser Parameter gibt den gewünschten Dienst an. Der Browser benötigt diese Angabe, um daraus das geeignete Übertragungsprotokoll und den richtigen Port zu bestimmen. Die folgende Tabelle zeigt die Schlüsselwörter für die besprochenen Dienste.
| Schlüsselwort | Dienst |
|---|---|
| file | Lokales Dateisystem |
| telnet | Telnet |
| mailto | |
| ftp | FTP |
| news | Usenet |
| http | World Wide Web |
Tabelle 2 - 1 WWW Protokolle
Die Serveradresse gibt wie im Abschnitt Adressierung im Internet beschrieben die Adresse des Servers an. Es kann dabei der Name des Servers oder direkt seine IP-Adresse angegeben werden. Außerdem ist eine explizite Angabe der gewünschten Portnummer möglich , da ein Server an einem beliebigen Port arbeiten kann. Die Portnummer wird dabei mit einem Doppelpunkt getrennt an die Adresse des Servers angehängt.
Der Pfad gibt wie bei einem lokalen Dateisystem den Pfad zu einem bestimmten Dokument von der Wurzel aus an. Dabei ist zu beachten, daß das UNIX konforme Divisionszeichen „/“ (Slash) als Trennzeichen für die Pfadangabe verwendet wird.
Dokument bezeichnet irgendeine beliebige Datei. Für die Dateierweiterungen gelten dabei die gleichen Regeln wie bei lokalen Dateisystemen. Index.html bezeichnet zum Beispiel ein HTML Dokument.
Eine Dokumentadresse sieht zum Beispiel folgendermaßen aus:
http://www.iaik.tu-graz.ac.at:80/PEOPLE/wplatzer.html
Mit HTML ist aber nicht nur die Präsentation von Hypertext Dokumenten möglich. Es funktioniert auch der umgekehrte Weg. Man kann mit HTML auch Dokumente für die Eingabe von Daten erstellen. Am Bildschirm erscheinen dann Eingabemasken, die wie Formulare aus zufüllen sind. Per Knopfdruck können die eingegebenen Daten dann wieder zum Server zurückgesendet werden.
Für den Transport der Daten ist das Hypertext Transfer Protocol (HTTP) [JG96] zuständig. Es ist auch auf dem Client/Server Prinzip aufgebaut und die Kommunikation zwischen Client und Server erfolgt über Port 80.
Eine HTTP Nachricht ist folgendermaßen aufgebaut:
Die erste Zeile bei einer Anfrage eines Browsers besteht aus der Anfrage-Zeile (Request-Line). Sie enthält die Methode, den Namen des Dokuments mit Pfad und die verwendete HTTP Protokoll Version. Die am häufigsten verwendete Methode ist GET. Sie dient zur Anforderung des adressierten Dokuments. Zum Beispiel:
GET /PEOPLE/wplatzer.html HTTP/1.0
Der Antwort des Servers beginnt mit der Status-Zeile (Status-Line). Sie enthält den Rückgabewert der Antwort und zeigt, ob die Anfrage beantwortet wurde oder ob ein Fehler aufgetreten ist. Das folgende Beispiel zeigt den Statuscode für eine erfolgreiche Be arbeitung der Anfrage:
HTTP/1.0 200 OK
Nach der Request Line folgen die sogenannten Header (Kopfzeilen). Sie dienen zur Beschreibung der Daten im Message Body und enthalten Informationen über Typ, Sprache, Zeichensatz, Kodierung, usw..
In jeder Zeile befindet sich genau ein Header. Nach dem Namen des Headers folgt ein Doppelpunkt und dann dessen Wert. CONTENT-TYPE: image/jpg zeigt zum Beispiel an, daß es sich bei den Daten um ein Bild im JPEG Format handelt.
Nach einer Leerzeile folgen am Ende der Nachricht schließlich die in den Headern beschriebenen Daten. Mit diesem System ist eine Übertragung aller beliebigen Datenformate möglich. Es muß nur der Wert des Headers CONTENT-TYPE: richtig gesetzt sein, da sonst vom Browser ein falsches Programm zur Bearbeitung der Daten gestartet wird.