Internet - Technologie und Anwendungen

Kapitel 1: Ursprung und Konzepte des Internets

Letzte Änderung: 8.10.98 von B. Tritsch

Überblick

Zurück zum Inhalt


Erste Schritte...

Warum werden Netzwerke und insbesondere das Internet von so vielen Anwendern genutzt? Die Gründe sind gerade für Firmen vielfältig:

Das Internet bietet sowohl firmenintern als auch weltweit eine Reihe von Diensten, die es für Benutzer sehr attraktiv machen. Darunter gehören unter anderem folgende:

Ein kleines Glossar soll helfen die gebräuchlichsten Begriffe der Internet-Technologie zu verstehen:

Aufbau eines Bytes:

Binär Dezimal Hexadezimal
0000 0001 1 1h
0011 0110 54 36h
1111 1111 255 FFh

Tabelle 1.1: Ein Byte in binärer, dezimaler und hexadezimaler Darstellung

Im folgenden soll das Internet als Netzwerktechnologie detailliert betrachtet werden.

Internet

Stichworte:

Das Internet ist im Grunde ein Zusammenschluß von vielen über die ganze Welt verteilte lokale Netze, die über das UDP- oder TCP/IP-Protokoll kommunizieren. Es hat seine Ursprünge in einem Forschungsprojekt Ende der 60er Jahre, als es in den USA aus dem DARPANET (Defense Advanced Research Projects Agency Network) entstand. Heute gehören auch das Milnet, das NASA Science Internet (NSI) sowie das NSFNet (seit 1995 bei America Online - AOL) hinzu.

Jeder Standard im Internet wird durch ein Dokument gebildet, das den Titel RFC (Request for Comments = Aufforderung zu Anmerkungen) trägt. RFCs gibt es seit 1969, sie sind Arbeitspapiere der Forschungs- und Entwicklergruppe des Internet. Gewöhnlich ist ein RFC die Beschreibung eines Protokolls, einer Prozedur oder eines Dienstes. Es kann jedoch auch ein Statusbericht oder eine Zusammenfassung von Forschungsdaten sein. Bis heute gibt es über 2000 veröffentlichte RFCs.

Netzwerk-Schichtenmodell

Stichworte:

Unabhängig von der Architektur der zugrundeliegenden Rechner ist die Netzkommunikation ein sehr komplexes und abstraktes Thema. Es betrifft Hardware genauso wie Protokolle oder gar Anwendungsprogramme, die entweder das Netz ausmachen oder es benötigen. Um dieses Thema besser zu strukturieren und damit leichter auf die erhöhten Anforderungen des Marktes reagieren zu können, entwickelte die "International Standardization Organization" (ISO) 1977 ein sogenanntes Referenzmodell für "Open Systems Interconnection", das ISO-OSI-Referenzmodell. Hierbei handelt es sich um ein Schichtenmodell, wobei die transportorientierten Funktionen in vier und die datenverarbeitungsorientierten Funktionen in drei Schichten unterteilt sind.

Die grundlegende Idee hinter einem Schichtenmodell ist, daß jede beteiligte Schicht einer darüberliegenden Schicht bestimmte Dienste anbietet. Damit schirmt sie die höheren Schichten von Details ab, wie die betreffenden Dienste realisiert sind. Dadurch ist es möglich, daß eine Schicht n des einen Computers mit der selben Schicht n eines anderen Computers kommuniziert. Die Regeln und Konventionen dieser Kommunikation werden als das Protokoll der Schicht n genannt.

osi.gif (29369 Byte)

Abbildung 1.1: Schichtenorientierte Kommunikation über das Netzwerk

In der Realität kommunizieren die Schichten n nicht miteinander. Jede Schicht reicht seine Daten und zusätzliche Kontrollinformationen an die direkt darunterliegende Schicht weiter bis die tiefste Schicht erreicht ist. Unter dieser Schicht liegt das physikalische Medium, durch das die echte Kommunikation stattfindet.

Zwischen einem Paar übereinanderliegender Schichten besteht eine definierte Schnittstelle (Interface). Das Interface bestimmt die Operationen und Dienste, die die untere der oberen Schicht anbietet. Ein Satz von Schichten und Schnittstellen wird dann die Netzwerkarchitektur genannt. Eine Liste von Protokollen, die von einem bestimmten System genutzt werden - ein Protokoll pro Schicht - wird Protocol Stack genannt. Typischerweise addiert jedes Protokoll bestimmte Kontrollinformationen (Header) zu den Daten, wenn sie von oben nach unten durch die Schichten gereicht werden. Diese sind für den Gegenpart beim Empfänger gedacht. Diese zusätzlichen Header werden beim Empfänger dann auch auf dem Weg zur obersten Schicht wieder entfernt.

Schichten können zwei verschiedenen Arten von Diensten nach oben bereitstellen. Die eine Art ist verbindungsorientiert und am ehesten mit einem Telefonsystem zu vergleichen. Man wählt den Partner an, kommuniziert mit ihm und trennt die Verbindung wieder. Die zweite Art ist verbindungslos und orientiert sich am Postsystem. Jede Nachricht wird mit einer vollständigen Adresse versehen und wird durch das System zum Empfänger geleitet. Hierbei kann es im Gegensatz zu verbindungsorientierten Diensten vorkommen, daß sich die Reihenfolge von verschickten Nachrichten durch unterschiedliche Verzögerungszeiten im System verändert. Jeder Dienst wird dabei durch die sogenannten Quality of Service charakterisiert. Diese Dienstequalität bezieht sich auf die Sicherheit der Übertragung und teilweise auch auf die Effizienz bezüglich der Geschwindigkeit.

Netzwerkkomponenten des Internets

Stichworte:

Institute, Behörden und Firmen vernetzen in immer stärkerem Maße ihre verwendeten Rechnerplattformen. Dies dient im wesentlichen zum leichteren Austausch wichtiger Daten und Information, der Nutzung von netzweiten Ressourcen (Drucker, Massenspeicher etc.) sowie der einfacheren Wartbarkeit von einer entfernten Konsole oder gar zur multimedialen Kommunikation. Die physikalische Ausdehnung dieser lokalen Netze (LANs = Local Area Networks) beschränkt sich in der Regel auf ein oder mehrere Gebäude in relativer Nähe (< 10 km, siehe auch Tabelle 1.1).

Distanz zwischen Prozessoren Prozessoren liegen im selben Beispiel
0,1 m Mainboard Multiprozessor-Computer
1 m System Computer-Cluster
10 m Raum LAN
100 m Gebäude LAN
1 km Campus LAN
10 km Stadt MAN
100 km Land WAN
1.000 km Kontinent WAN
10.000 km Planet "Internet"

Tabelle 1.1: Klassifizierung verbundener Prozessoren nach ihrer Entfernung

Die Unterscheidungskriterien von LANs sind

  1. ihre Größe
  2. ihre Übertragungstechnologie
  3. ihre Topologie

Die Größe von LANs ist beschränkt. Die Beschränkung ist bekannt und wird durch maximal erlaubte Verzögerungszeiten innerhalb des Netzwerks bestimmt. Typische Verzögerungszeiten liegen im Bereich von 10 Mikrosekunden.

Die Übertragungstechnologie gängiger LANs besteht zumeist aus einem Kabel, das alle Maschinen verbindet. Als Topologie ist daher entweder ein Bus oder ein Ring vorgegeben. Neuere Technologien fordern ein eigenes Kabel für jeden angeschlossenen Rechner, was zu einer Sterntopologie mit einem zentralen Sternverteiler (Hub) führt. Noch aufwendiger sind vermaschte Topologien.

netztopo.gif (19839 Byte)

Abbildung 1.2: Verschiedene Netzwerktopologien

Die verbreitetsten LANs sind Ethernet (Bus: 10 Mbit/s, 100 Mbit/s und 1 Gbit/s) und Token-Ring (Ring: 4 bzw. 16 Mbit/s). Diese Standards spezifizieren verschiedene Netzkabeltypen, -topologien und -zugriffe. Bei Ethernet kann jeder Rechner als Master zu jeder Zeit auf das Netzwerk senden. Gibt es hierbei einen Konflikt zwischen zwei gleichzeitig sendenden Rechnern, wartet jeder Rechner für eine über Zufallsgeneratoren bestimmte Zeit um dann wieder einen Sendeversuch zu starten. Bei Token Ring bestimmt ein im Netzwerk umlaufendes "Token" den sendenden Zugriff jedes Rechners.

Insbesondere das Ethernet spielt im Internet-Umfeld eine wichtige Rolle (wobei der Name von Xerox stammt und an den "Äther" - dem Kabel - erinnert, der nach der Lehrmeinung vor 1887 nötig war um Strahlung zu transportieren). Wesentlich ist beim Ethernet die Art zur Vermeidung von Kollisionen über ein spezielles Protokoll. Es sorgt dafür, daß bei einer Kollision beim Senden von Daten von zwei Rechnern die Transmission sofort unterbrochen wird. Die korrumpierten Daten werden verworfen und nach Zeiten, die von Zufallsgeneratoren bestimmt werden, beginnen die Rechner wieder aufs neue ihre Daten zu senden.

Die Kabelstandards, die dem 10 MBit/s-Ethernet zugrunde liegen, lassen sich in folgende Tabelle einordnen:

Name Kabel Maximale Segmentlänge Nodes pro Segment Vorteile
10Base5 Thick Coax 500 m 100 Gut für Backbones (Tranceiver-Kabel)
10Base2 Thin Coax 200 m 30 Billig (Bus)
10Base-T Twisted Pair (Cat. 3) 100 m 1024 Leicht zu warten (Hubs)
10Base-F Fibre Optics 2000 m 1024 Gut zwischen Gebäuden

Tabelle 1.2: Die gängigsten Arten von Ethernet-Kabeln im Bereich von 10 MBit/s

Um höhere Übertragungsraten im Ethernet zu erreichen, wurde der Ethernet-Standard erweitert. Das Resultat wurde offiziell 1995 eingeführt und wird zumeist Fast Ethernet genannt. Die Basisidee ist dabei sehr einfach: Das alte Paketformat die Schnittstellen und die prozeduralen Regeln werden beibehalten und nur die Bit-Zeit wird von 100 nsec auf 10 nsec reduziert. Weiterhin wurden die Vorteile der 10Base-T-Verkabelung als Designgrundlage genutzt. Die gängigen Kabelstandards für die Übertragung von 100 MBit/s sind daher wie in der folgenden Tabelle aufgeführt:

Name Kabel Maximale Segmentlänge Vorteile
100Base-T4 Twisted Pair (Cat. 3) 100 m Alter Kabeltyp, aber nur unidirektional
100Base-TX Twisted Pair (Cat. 5) 100 m Full Duplex bei 100 Mbps
100Base-FX Fibre Optics 2000 m Full Duplex bei 100 Mbps

Tabelle 1.3: Die gängigsten Arten von Ethernet-Kabeln im Bereich von 100 MBit/s

Neuere Bestrebungen gehen noch eine Größenordnung weiter: Gigabit-Ethernet. Bisher ist der zugehörige Standard jedoch noch nicht endgültig festgelegt.

Die elektrische Signale können auf den physikalischen Leitungen nur eine begrenzte Distanz zurücklegen, ohne Leistung in einem gewissen Rahmen zu verlieren. In LANs werden daher verschiedene Geräte genutzt, um die Signale zu regenerieren und mit anderen LANs oder Wide Area Networks (WANs) zu kommunizieren.

Um den Datenverkehr zwischen Firmen oder Filialen innerhalb von Städtegrenzen zu ermöglichen, wurden MANs (Metropolitan Area Networks) als die vergrößerte Ausgabe von LANs installiert. Ihre wichtigsten Vertreter sind FDDI (Fibre Distributed Data Interface) mit Transferleistungen von 100 Mbit/s und DQDB (Distributed Queue Dual Bus) mit skalierbaren Übertragungsraten von 34, 45 oder 140 Mbit/s.

Eine große Bedeutung auf dem Netzmarkt besitzen weltumspannende WANs (Wide Area Networks). Sie basieren in der Regel auf den physikalischen Leitungen, die von den nationalen Telekom-Unternehmen betrieben werden. Ein prominenter Vertreter einer physikalischen Netztechnologie ist ISDN (Integrated Service Digital Network, 128 kBit/s bis 2 Mbit/s). Eine neue Technologie für WANs, die jedoch auch für LANs und MANs eingesetzt werden kann, ist ATM (Asynchronous Transfer Mode), die Datentransferraten von 25, 50, 155 oder 622 Mbit/s erlaubt und speziell für zeit- und synchronisationskritische multimediale Datentypen geeignet ist.

Die Topologie der zugrundeliegenden WANs kann sehr unterschiedlich aussehen. Die Möglichkeiten reichen von einem Stern über einen Ring, einen Baum, einem Komplettverbund (n-zu-n) und gekoppelten Ringen bis hin zu vollkommen irregulären Netzen. Besonders komplex wird die Topologie dann, wenn auch kabellose Netzwerkteile durch Funkstrecken und Satelliten einbezogen werden.

Die Verbindung sehr vieler WANs über Gateways ergibt dann das Internetwork oder einfacher das Internet!

Client/Server-Architektur

Stichworte:

Wie Kulturen in zwei abgeschiedenen Ländern haben sich in den letzten Jahren die Netztechnologien für Personal Computer und Workstations entwickelt. Bei den Workstations dominieren die "offenen" Systeme, und Standards wurden zum Allgemeingut. Bei den PCs dagegen beanspruchten bisher Firmen wie Novell oder Banyan die Standards für sich alleine. Erst die Workgroup-Initiative, die von Microsofts Windows für Workgroups gestartet wurde, brachte diesen Markt wieder in Bewegung.

Mit Workgroup-Computing und Client/Server-Architekturen läßt sich eine systemübergreifenden Vernetzung realisieren. Neben UNIX-basierten Workstations wurden immer öfter PCs in ein bestehendes Netzwerk eingebunden. Hierdurch konnten sie auf deutlich mehr Ressourcen (Datenbanken, Massenspeicher, Drucker, etc.) zugreifen und mit anderen Rechnerbenutzern kommunizieren (Email). Daneben stellte sich für sie jedoch auch das Problem des "Teilen-müssens", d.h. die soziale Komponente kam mehr zum tragen, die in einem Netzsystem naturgemäß stärker betont wird als in einem autarken System.

Grundsätzlich wird im Netzbereich zwischen zwei Architekturen unterschieden: Peer-to-Peer- und Client/Server-Netze. Ersteres realisiert eine Punkt-zu-Punkt-Verbindung zwischen einzelnen Plattformen. Parallel zu seiner normalen Arbeit kann jeder Rechner seine Ressourcen den anderen Rechnern im Netz verfügbar machen sowie verfügbar gemachte Ressourcen von anderen Rechnern in Anspruch nehmen. Dies gilt für Ressourcen wie Dateien, ganze Verzeichnisse oder Dateisystemzweige, Drucker, Festplatten, CD-Laufwerke, etc.

Abbildung 1.3: Peer-to-Peer-Netz (Workgroup) und Client/Server-Netz

In einer Client/Server-Architektur bleiben bestimmte ressourcenintensive Aufgaben wie Datenverwaltung, Drucken, Email-Verwaltung oder Systemadministration auf den Server (Auftragnehmer) beschränkt. Die Clients (Auftraggeber) haben nur direkte Verbindung zum Server und dienen durch Anforderungen an seine Dienste als Interaktionseinheit. Der Netzverkehr ist dadurch im Gegensatz zu anderen Architekturen vergleichsweise gering. Der Server erfordert jedoch ein hohes Maß an Prozessorleistung, Festplattenkapazität, Hauptspeicherkapazität und Datendurchsatz. In der Regel kann der Server durch die hohen Anforderungen an seine Reaktionszeit auf Diensteanforderungen für keine anderen Aufgaben benutzt werden. Daher wird ein solches Netz erst ab mehr als zehn Benutzer sinnvoll.

Es existieren verschieden abgestufte Client/Server-Optionen, die in der untenstehenden Abbildung aufgezeigt werden. Sie unterscheiden sich hauptsächlich durch unterschiedliche Behandlung der verteilten Anwendung und der Datenhaltung. Sie implizieren verschiedene Leistungsfähigkeiten auf Seiten des Servers oder des Clients.

Abbildung 1.4: Unterschiedliche Client/Server-Konzepte

Internet - Intranet - Extranet

Stichworte:

Internet, Intranet und Extranet definieren sich wie folgt:

Pluspunkte für ein Intranet mit Internet-Technologie:

Der kleinste gemeinsame Nenner bei der Kommunikation zwischen Rechnern sind alphanumerische Zeichen. Die Menschheit hat im Bezug auf ihre Entwicklungsgeschichte erst in jüngerer Vergangenheit gelernt Text und Symbole für Kommunikationszwecke zu verwenden. Diese Entwicklung begann vor ca. 6000 Jahren in Mesopotamien, Ägypten, Sumer und Babylon. Dort wurden bedeutungsvolle Zeichen auf Tontafeln geritzt, die danach in der Sonne trocknen gelassen wurden. Nur Mitgliedern der herrschenden Klasse sowie Priestern war es zunächst erlaubt die piktographischen Zeichen zu schreiben und zu lesen.

Heutzutage sind Text sowie die Fähigkeit zu lesen und zu schreiben unerläßlich für die Wissensvermittlung. In den meisten heutigen Gesellschaften gehört das geschriebene Wort zu den wichtigsten Kulturgütern. Worte und Symbole in jeglicher Form, gesprochen oder geschrieben, sind das am weitesten verbreitete Kommunikationssystem

Bei der Repräsentation des geschriebenen Wortes auf einem Trägermedium wie Papier oder einem Computermonitor gibt es zwei wesentliche Unterscheidungsmerkmale: Zeichensatz und Schriftart. Schließlich muß auch die Verarbeitung eines Dokuments mit möglicherweise verschiedenen Zeichensätzen, Schriftarten und Seitenaufteilung (als logische oder Layout-Struktur) betrachtet werden. Dies wird unter dem Begriff formatierte Texte behandelt.

Der Zeichensatz ist die Menge der atomaren Elemente einer Schriftsprache, des Alphabets. Hierbei sind starke nationale Unterschiede feststellbar. Als Beispiele werden in der Tabelle 1.4 jeweils Auszüge aus dem deutschen und dem griechischen Zeichensatz aufgeführt.

Auszug aus dem deutschen Zeichensatz: ABCDEFGHIJabcdefghijÄÖÜäöü
Auszug aus dem griechischen Zeichensatz: ABCDEFGHIKLMNOPRSTabcdefg

Tabelle 1.4: Auszüge aus verschiedenen Zeichensätzen

In der westlichen Welt hat sich seit Beginn des Computerzeitalters ein Basiszeichensatz als Standard etabliert: der American Standard Code for Information Interchange (ASCII). Er basiert grundsätzlich auf der eindeutigen Zuordnung von jedem individuellen Buchstaben des amerikanischen Alphabets zu einer wiederum individuellen Folge von Nullen und Einsen, einem Bitmuster. In seiner ersten Form basierte jedes ASCII-Zeichen auf einem sieben Stellen langen Bitmuster (7-Bit-ASCII), womit maximal 128 Zeichen zugeordnet werden können. Später wurde das Bitmuster um eine Stelle erweitert (8-Bit-ASCII = 256 Zeichen), um auch Platz für Sonderzeichen (Umlaute, Buchstaben mit Akzenten, Graphiksymbole, griechische Zeichen) zu schaffen. Noch heute gilt der 7-Bit-ASCII-Zeichensatz als der kleinste gemeinsame Nenner beim Austausch von textueller Information.

ascii.gif (12163 Byte)

Abbildung 1.5: Zeichensatz unter Windows NT

Etwas neuer ist der American National Standard Institute (ANSI) Standard, der inzwischen von vielen Anwendungen unterstützt wird. Er basiert ebenfalls auf einem 8-Bit-Code und entspricht in den ersten sieben Bits im wesentlichen dem ASCII-Standard. Der ANSI-Standard unterscheidet sich dann jedoch stark in der Zuordnung der Sonderzeichen. Seine Stärke liegt in der vollständigen Unterstützung aller europäischen Sonderzeichen in der lateinischen Schrift. Dagegen wird das griechische Alphabet gar nicht mehr beachtet.

Neuere Aktivitäten im Bereich der Zeichensätze zielen auf einen globalen 16-Bit-Code. In den über 65.000 Zuordnungen lassen sich leicht neben den ASCII-, ANSI- und griechischen Zeichen auch ganze Zeichensätze aus dem Wachstumsmarkt Asien (z.B. Kanji- und Hindi-Zeichensätze) integrieren. Prominenter Vertreter dieser Strategie ist z.B. der Microsoft UNICODE, der in einer ersten Version seit 1993 in MS-Windows NT eingesetzt wird.

Aufgaben

  1. Warum werden Netzwerke und insbesondere das Internet von so vielen Anwendern genutzt?
  2. Was bedeuten die Begriffe LAN, MAN und WAN?
  3. Wählen Sie eine der untenstehenden Optionen: Was bedeutet die Abkürzung RFC, die für die Standardisierung im Internet sorgt?
  4. Nennen Sie drei verschiedene Netzwerktopologien?
  5. Wählen Sie eine der untenstehenden Optionen: Was bedeutet der ASCII-Standard?
  6. Erklären Sie den Unterschied zwischen Peer-to-Peer-Networking und Client/Server-Networking?
  7. Worin unterscheiden sich Internet und Intranet?

Zum nächsten Kapitel