Internet - Technologie und Anwendungen

Kapitel 11: Echtzeit-Multimedia im Internet

Letzte Änderung: 21.10.98 von B. Tritsch

Überblick

Zurück zum Inhalt


Echtzeit-Multimedia: Überblick

Stuichworte:

Die wachsende Verwendung von multimedialen Daten auf Netzen auch zur Echtzeitkommunikation bringt einen Wandel im typischen Gebrauch von Computern mit sich. Die bisher starke Trennung zwischen Computern und Telekommunikationseinrichtungen verschwimmt immer mehr durch die Integration von Kommunikationsmedien mit bequemem Zugriff auf multimediale Informationssysteme.

Das möglicherweise wichtigste Medium eines jeden Systems, das Mensch-zu-Mensch-Kommunikation unterstützt, ist Audio. Die meisten Beschwerden von Benutzern im Bezug auf Tele-Konferenzsystemen betreffen die Audioqualität. Untersuchungen haben gezeigt, daß mehr als die Hälfte der Information, die während einer Tele-Konferenzsitzung übertragen werden, verbaler Form sind. Daher fällt es den Benutzern besonders auf, wenn so eine wichtige Informationsquelle technische Schwachstellen aufweist. Ein Hauptgrund für viele Probleme mit der Audiokomponente ist die hohe Empfindlichkeit des menschlichen Ohrs im Bezug auf Fehler im "Timing". Hier sind die Hörorgane um Größenordnungen empfindlicher als die Augen. Verzögerungen und Gleichlaufschwankungen innerhalb eines gewissen Zeitrahmens (50 bis 200 Millisekunden), die bei Bildsequenzen problemlos ignoriert werden können, führen zu nicht akzeptablen Resultaten bei Audiosequenzen.

Mit Videokommunikation ist in einem multimedialen Kommunikationssystem die fortlaufende Sequenz von digitalen Videobildern gemeint. Sie werden möglichst in Echtzeit eingefangen, digitalisiert, übertragen und wieder dargestellt um einen adäquaten Kommunikationmechanismus bereitzustellen.

Große Probleme bereitet oft die scharfe Synchronisation von Audio- und Video-Datenströmen, die sogenannte Lippensynchronisation mit Versatzzeiten von Audio und Video von unter 80 ms. Die naheliegenste Lösung ist die Integration von Audio- und Videosignal in ein einziges Datenformat. Die Methode der kombinierten Verarbeitung von AV-Daten wird auch in der gleichen Weise bei neueren Versionen der Standard-Videoformate angewandt. So kann das Microsoft Video-for-Windows-Format AVI beispielsweise WAVE-Audiodateien direkt integrieren.

Eine andere, aufwendigere Methode ist es, die Synchronisation von getrennten Audio- und Videodatenströmen über hochgenaue Timer vorzunehmen. Problematisch ist hierbei die Anpassung von Quell- und Zielplattform im Bezug auf die Timer.

Obwohl die Audio/Videotechnologie (z.B. für Videoconferencing) immer billiger und leistungsfähiger wird, kann dies nicht in gleichem Maße für die digitale Telekommunikations-Infrastruktur gesagt werden. Zwar kann schnelle Netztechnologie verwendet werden (z.B. FDDI oder ATM), jedoch ist sie noch immer sehr teuer. Daher ist es speziell für Video von großer Bedeutung auch auf billigeren schmalbandigen Netzen wie dem Internet verfügbar zu sein.

Leistungsfähige Kompressions- und Dekompressionsalgorithmen, die in Echtzeit auf preisgünstiger Hardware oder gar in Software ausgeführt werden können, spielen aus diesen Gründen eine zentrale Rolle für Echtzeit-Audio/Video (RT-AV). Die AV-Sequenz wird in diesem Fall vor der Transmission über das Netz komprimiert oder kodiert und beim Empfang dekomprimiert oder dekodiert.

Da für Kommunikationszwecke der Echtzeitaspekt eine höhere Priorität besitzt als die hohe Auflösung der AV-Sequenzen oder die große Farbtiefe der Videobilder, ist auch ein verlustbehafteter Algorithmus akzeptabel. Videosequenzen mit Wiederholraten von ca. 10 Bildern pro Sekunde sowie einer räumlichen und farblichen Auflösung von ca. 150 x 150 Pixel bei 16 Graustufen gelten hierbei als vertretbar. Dies entspricht etwa einer unkomprimierten Datenrate von 112 kBytes/s (150 x 150 Pixel x 4 Bit/Pixel x 10 Bilder/s). Bei den Anforderungen an Audio kann festgestellt werden, daß Telefonqualität für die meisten Zwecke ausreicht. Die Sampling Rate beträgt dabei 8 kHz, die Sampling Size 8 Bits. Daraus resultiert eine Datenrate von 8 kBytes/s.

Video on Demand

Stichworte:

Video on Demand ist eine neue Anwendung für das Internet. Es kann mit einer Videothek verglichen werden. Ein Benutzer kann von zu Hause mit Hilfe der Fernsteuerung oder einer Set-Top-Box ein Video auswählen und es direkt starten. Das Video kommt von einem Video-Server und ein sehr leistungsfähiges Netzwerk. Dies gilt insbesondere in Anbetracht der Tatsache, daß jeder Benutzer das Video manchmal kurz anhalten und später fortsetzen möchte. Dies erfordert ein Verhalten des Video-Servers wie ein virtueller Videorekorder.

Die Video-Server müssen in der Lage sein, eine große Anzahl an Videos zu speichern und simultan abzuspielen. Die momentan verfügbare Gesamtzahl an Spielfilmen beträgt momentan ca. 65.000, was ein Gefühl für die potentielle Leitungsfähigkeit des Servers gibt. Ein normaler Spielfilm, der nach dem MPEG-2-Verfahren komprimiert wurde, braucht ca. 4 GB an Speicherplatz. Für alle Spielfilme bedeutet dies etwa 260 TB benötigter Speicher.

Eine solche Speichermenge kann durch verschiedenen Methoden realisiert werden:

  1. Die günstigste Methode wären Bänder, z.B. DAT mit bis zu 8 GB Speicherkapazität. Die Kosten würden dabei ca. 5 Dollar/GB, die Zugriffszeiten liegen nach Einlegen in ein Laufwerk ca. 10 msec.
  2. Eine Alternative zu Bändern sind CD-ROMs mit 640 MB Speicherkapazität (in Zukunft bis zu 4 GB). Sie sind sehr billig und zuverlässig, ihre Zugriffszeiten liegen jedoch bei ca. 100 msec.
  3. Eine schnellere Lösung sind Festplatten. Diese haben schnelle Zugriffszeiten (10 msec), hohe Transferraten (10 MB/s) und große Kapazitäten (über 10 GB). Sie sind daher gut für die Speicherung von Videodaten geeignet, jedoch auch relativ teuer. In Frage kommen hier auch sogenannte RAID-Systeme (Redundant Array of Inexpensive Disks), mit denen ein Film über mehrere Platten verteilt werden kann. Dadurch sind verbesserte Zugriffszeiten und erweiterte Sicherheitsoptionen möglich.
  4. Die schnellste aber auch teuerste Lösung ist RAM. RAM ist geeignet verschiedene Videoquellen zur selben Zeit an verschiedene Ziele zu schicken. Pro Film muß man aber mit sehr hohen RAM-Kosten (mehrere 1.000 Dollar) rechnen.

Das Herz eines Video-Servers ist die Software, die den Speicher verwaltet und die Datenströme in das Netzwerk einspeist. Sicherlich wird auch ein Puffer-Mechanismus auf der Empfängerseite greifen, damit der Datenstrom niemals abreißt.

MBone - Multicast Backbone

Stichworte:

Während die Industrie große Pläne für ein zukünftiges Video on Demand machen, hat die Internet-Gemeinde ohne große Publicity sein eigenes Multimedia-System implementiert: MBone. MBone (Multicast Backbone) kann man sich vorstellen wie ein Internet-Radio oder -Fernsehen. Entgegen Video on Demand, wo der Schwerpunkt auf das Abspielen von vorkomprimierten Videos liegt, wird MBone für die Verbreitung von Live-Audio und -Video in digitaler Form über die ganze Welt genutzt. MBone ist erst seit Anfang 1992 in Betrieb und daher noch Gegenstand aktueller Forschung.

Der meiste Aufwand bei MBone wurde bisher in die Multicast-Technik investiert, weniger in die Kodierung und Kompression der Videosequenzen. Multicast basiert dabei auf Datagramm-orientierter (UDP) Übertragung im Internet. Dafür wurde ein virtuelles Überlagerungsnetzwerk auf der Basis des Internet etabliert. Dabei werden spezielle Router benötigt, die MBone-Datenpakete über sogenannte Tunnels zwischen Inseln transportieren.

Gängige Echtzeit-Umgebungen

Stichworte:

Im folgenden sollen zwei Beispiele für Echtzeit-Multimedia-Umgebungen vorgestellt werden. Das erste ist für den Bereich Conferencing, das zweite für den Bereich Audio/Video on Demand.

Microsoft NetMeeting

NetMeeting soll nach Microsoft's Willen das "ultimative" Conferencing-Werkzeug darstellen. Es erlaubt Audio/Videokommunikation und beinhaltet ein Caht-Modul sowie ein Whiteboard.

Abbildung 12.1: Schnappschuß einer NetMeeting-Sitzung

Progressive Networks RealPlayer

Die Programme RealAudio und RealVideo von Progressive Networks erlauben das Laden und Bereitstellen von Audio und Video on Demand. Hierbei liegt die Audioqualität nahe an der CD und auch die Video-Option zeigt ruckfreie Sequenzen.

Abbildung 12.2: Der RealPlayer

Für die Bereitstellung von Audiosequenzen auf einem Server steht ein leistungsfähiges Audio-Konversionserkzeug zur Verfügung.

Abbildung 12.3: Der RealAudio Encoder

Analog zu Audio, steht auch für Videosequenzen ein spezieller Encoder zur Verfügung.

Abbildung 12.4: Der RealVideo Encoder

Aufgaben

  1. Welches menschliche Sinnesorgan ist im Bereich der zeitlichen Auflösung empfindlicher, das Augo oder das Ohr?
  2. Was ist die Bedeutung des Begriffs "Lippensynchronisation"?
  3. Was versteht man unter Video on Demand?
  4. Was ist MBone - Multicast Backbone?