INFORMATIK / INFORMATIQUE

Zeitschrift der schweizerischen Informatikorganisationen
Revue des organisation suisses d'informatique

Nr./No. 2 April/Avril 1995


World-Wide Web: Konzepte und Grundlagen

Louis Perrochon

Auf dem Internet, dem grössten, weltweiten Verbund von Netzwerken, steht seit wenigen Jahren ein neues Werkzeug zur Informationsvermittlung zur Verfügung: das World-Wide Web (W3, WWW). Das W3 besteht im wesentlichen aus verteilten Informationsservern, die Daten zum Abruf bereitstellen. Damit deckt es den Server-Teil einer weltweiten Client-Server-Umgebung ab. Für den Zugriff auf die Server sind Client-Programme (Browser genannt) notwendig, die lokal auf der Maschine des Benutzers installiert werden und für die Benutzerschnittstelle und Präsentation der Daten zuständig sind. Die gespeicherten Daten der Server werden dabei dem Benutzer als ein grosser Hypertext präsentiert: Durch einfaches Anwählen von Hyperlinks kann der Benutzer von einem Dokument zum anderen springen. Dokumente können dabei sowohl Texte als auch beliebige Bilder, Videos oder Töne sein.

Das Internet

Das Internet hat mehrere Wurzeln: zuerst kam der Wunsch des amerikanischen Verteidigungsministeriums, Computer räumlich weit zu verteilen und somit weniger angreifbar zu machen, kurz darauf die gemeinsame Nutzung von Hochleistungsrechnern durch verschiedene Hochschulen der USA, später das Bedürfnis nach kommerzieller Nutzung und heute die von der amerikanischen Regierung geforderte "Datenautobahn". Trotz (oder gerade wegen?) minimalster Koordination ist das Internet unterdessen zum grössten Computernetz der Welt geworden: mehrere Millionen Rechner sind heute angeschlossen.

Die Netze im Internet haben vor allem die verwendeten Übertragungsprotokolle gemeinsam. Diese werden gemeinhin unter dem Begriff TCP/IP zusammengefasst. Das eigentliche Internet Protocol (IP) liegt ungefähr auf Layer 3 des OSI 7-Schichten-Modells (ISO 7498: 1984), das Transmission Control Protocol (TCP) auf Layer 4. Darauf basierend stehen verschiedene Basisdienste zur Verfügung: Der praktischste Dienst ist wohl die elektronische Post (E-mail), die auch das Versenden von beliebigen Dokumenten erlaubt, wie beispielsweise gesprochenen Anmerkungen. Weitere wichtige Dienste sind der Dateitransfer (FTP), Diskussionsforen (News) und der Zugriff auf Datenbanken, Bibliotheken und Supercomputer (via Telnet). In den letzten Jahren erfolgte ein offensichtlicher Durchbruch in Sachen Benutzerfreundlichkeit: neue Dienste wie W3 können nun auch von Anwendern mit wenig Computerkenntnissen problemlos benutzt werden.

Aufgrund der nichtkommerziellen Nutzung in der Anfangsphase, sind vorläufig einige Voraussetzungen für einen breiten kommerziellen Einsatz des Internet nicht erfüllt. Beispielsweise sind sichere Übertragungsmechanismen, die kritische Daten, wie Kreditkartennummern, verschlüsselt übertragen, erst in der Aufbauphase. Doch seit kurzem drängen unzählige Firmen ans Internet. Sie alle gehen davon aus, dass die noch bestehenden Probleme nicht gravierend und in Kürze gelöst sind.

Dieser Artikel gibt eine kurze Beschreibung des W3 und der dazugehörigen Werkzeuge und Konzepte. Für den Erfolg des World-Wide Web war der richtige Mix mehrerer erfolgreicher Ansätze ausschlaggebend: Client-Server-Prinzip, eine systemunabhängige Dokumentenbeschreibungssprache, Hyperlinks, Multimedia, die Integration bestehender Dienste und ein Superangebot: alle notwendigen Programme und viele der angebotenen Daten sind gratis.

Im folgenden wird kurz auf die wichtigsten Konzepte eingegangen. Die verschiedenen Begriffe aus der Welt des Internets sind unter Stichwörter erklärt.

Client-Server

Beim konventionellen Zugriff auf zentrale Informationssysteme baut der Benutzer zuerst eine Verbindung mit einem Zentralrechner (Host) auf, die während der ganzen Sitzung erhalten bleibt. Der Host steuert darauf sämtliche Aspekte der Benutzerführung, was ihn dauernd belastet, obwohl er oft nur mit einfachen Mitteln arbeitet, z. B. mit einer nur zeichenbasierten Benutzerschnittstelle. Der Benutzer kommuniziert direkt mit dem Host, der eigene Computer ist nur ein Mittler. Trotzdem müssen Benutzercomputer und Host sorgfältig konfiguriert werden, damit auch alle Spezialtasten (z.B. Funktionstasten) wie erwartet funktionieren. Typische Beispiele dafür sind Bibliothekssysteme oder der Videotex-Dienst der PTT-Telecom, der immerhin mit rudimentärer Grafik aufwarten kann.

Im Gegensatz dazu betreibt der Benutzer beim Client-Server-Konzept lokal auf seinem Rechner ein Clientprogramm (häufig nur Client oder, speziell im Zusammenhang mit dem W3, Browser genannt). Dieser Browser übernimmt die gesamte Interaktion mit dem Benutzer und nutzt dazu die Möglichkeiten des lokalen Rechners voll aus (Grafik, Maus, etc.). Nur bei Bedarf wird kurzfristig eine Verbindung zum Server aufgebaut. Danach wird das Resultat einer solchen Anfrage für den Benutzer lokal aufbereitet. Der Server benötigt keine Informationen über die Möglichkeiten, Fähigkeiten oder Konfiguration des Benutzercomputers. Er stellt nur die gewünschte Information in Rohform zur Verfügung. Der Benutzer andererseits kommuniziert nur mit seinem eigenen Rechner.

Der Browser hat die Möglichkeit, wahlweise auf beliebige Server zuzugreifen. Er wählt aufgrund der Suchfrage denjenigen Server aus, der die verlangten Dokumente speichert, eröffnet eine Verbindung zu diesem Server, verlangt das gewünschte Dokument und wartet. Der Server wird das Dokument übertragen und die Verbindung schliessen. Der Benutzer bemerkt nichts davon. Für diese Kommunikation zwischen Browser und Server wurde für das W3 eigens ein Protokoll entwickelt, das Hypertext Transfer Protocol (HTTP).

Der Zugriff auf die Server des W3 ist von einer Vielzahl von Rechnertypen aus möglich, mit jeweils speziell angepassten, grafikorientierten Clientprogrammen. Das bekannteste dabei ist Mosaic. Mosaic wird oft die "Killer-Applikation" genannt, weil erst dessen Einführung Herbst 1993 den Boom des W3 einleitete. Aussagen wie "Das habe ich auf Mosaic gefunden" zeugen davon, dass viele Anwender nicht zwischen W3 und Mosaic unterscheiden. Neben einer Vielzahl von grafischen Browsern stehen auch Clientprogramme mit rein zeichenbasierter Schnittstelle zur Verfügung; die Funktionalität wird dadurch natürlich eingeschränkt.

Systemunabhängige Dokumentenbeschreibung

Zu W3 gehört eine eigene, auf SGML (Standard Generalized Markup Language) basierende Dokumentensprache namens HTML (Hypertext Markup Language). Diese erlaubt die Beschreibung von Textdokumenten unabhängig vom gewählten Ausgabegerät. Für die Darstellung auf dem Ausgabegerät ist der Browser zuständig, der dafür die Möglichkeiten des Benutzerrechners beliebig ausnützen kann. Sogar der Benutzer hat dort Einflussmöglichkeiten auf die Darstellung. Der Informationsanbieter braucht sich somit nicht um die Darstellung seines Dokumentes auf verschiedenen Benutzeroberflächen zu kümmern. Er beschreibt den Inhalt und überlässt die zweckmässige Darstellung dem Clientprogramm (Abbildung 2).

W3 ermöglicht jedoch nicht nur Lesezugriffe, sondern auch Informationsflüsse vom Benutzer zum Informationsanbieter. HTML stellt dafür Elemente zur Verfügung, mit welchen wichtige Eingabefelder systemunabhängig definiert werden können. Angeboten werden unter anderem aus grafischen Benutzeroberflächen bekannte Elemente wie Textfelder, Buttons, Listenfelder, Check- und Radiobuttons. Auf Anfrage eines Clientprogramms stellt der Server eine solche Eingabemaske dem entsprechenden Benutzer zu. Wie bei der Ausgabe von Dokumenten, ist auch bei Eingabemasken das Clientprogramm für deren Darstellung zuständig. Der Benutzer kann danach die Eingabemaske ausfüllen, und diese Angaben werden vom Clientprogramm an den Server zurückgeschickt. Mit diesen Mechanismen können via W3 auf einfachste Weise zum Beispiel Kundenbestellungen entgegengenommen werden.

Hyperlinks

Hypertextdokumente sind Textdokumente, die mit sogenannten Hyperlinks angereichert sind. Das sind automatisch arbeitende Verweise auf andere Textstellen oder Dokumente (Abbildung 1). Um dort weiterzulesen, muss der Leser nicht selber blättern, weil durch Anwählen des Hyperlinks direkt die gewünschte Textstelle angezeigt wird. Diese Art der Benutzerführung hat sich unter anderem im Ausbildungsbereich sowie bei Hilfesystemen (z.B. Microsoft-Hilfe unter MS Windows) und Nachschlagewerken (z.B. Lexika auf CD-ROM) bewährt. In diesen Fällen beschränken sich die Hyperlinks jedoch auf lokale Verweise innerhalb eines Dokumentes oder Systems.

In HTML sind weltweite Verweise mit Hyperlinks möglich (Abbildung 2). Dass diese Hyperlinks quer über den Globus verweisen, braucht den W3-Benutzer nicht zu kümmern. Für ihn besteht kein Unterschied zwischen lokalen und weltweiten Hyperlinks (bis auf allfällige Wartezeiten und Transportkosten). Verwendet werden sogenannte Universal Resource Locators (URL). Jedes unter W3 verfügbare Dokument hat damit eine eindeutige Adresse. Eine solche Adresse beginnt mit dem zu verwendenden Zugriffsprotokoll, gefolgt von weiteren für den Zugriff notwendigen Angaben, normalerweise dem Rechnernamen, dem lokalen Zugriffspfad und dem Namen der Datei. So hat die Einstiegsseite des SVI die URL <http://svifsi.ethz.ch/svifsi/top.html>. "http" bezeichnet das Zugriffsprotokoll, "svifsi.ethz.ch" ist der Name des Rechners, auf dem die Datei gespeichert ist und "/svifsi/top.html" enthält Zugriffspfad und Dateinamen. Die Begrenzer < und > gehören dabei nicht zur URL.

Multimedia

Im Zeitalter von Multimedia will der Benutzer häufig nicht nur Texte beziehen können, sondern auch stehende und bewegte Bilder sowie Sprache und Töne. Dies trägt heute zum Erfolg mancher Anwendung bei.

W3 unterstützt daher neben Zugriffenauf HTML-Textdokumente auch den Zugriff auf beliebige andere Dokumentformate. Dazu gehören auch reine Textdateien, PostScript-Dateien, Grafikdateien, etc. W3 zieht dafür sogenannte Viewers bei, Hilfsprogramme, die parallel zum Browser auf dem Benutzerrechner ablaufen und dort spezielle Dokumente darstellen können. Diese Viewers können direkt vom W3 beschafft werden, müssen jedoch vom Benutzer auf seinem Rechner installiert werden. Dadurch entsteht ein vollständig offenes System. Auch zukünftige Dokumentformate werden problemlos einzubinden sein. Ein vor kurzem eingeführter Viewer ist Acrobat-Reader der das als Postscript-Nachfolger gespeicherte Format PDF anzeigen kann.

Integration bestehender Dienste

In W3 wurden von Anfang an viele der existierenden Dienste des Internet integriert. Prinzipiell kann auf alles Bestehende zugegriffen werden: auf Programmbibliotheken (via FTP), Datenbanken (via Telnet), Information Retrieval Systeme (via Telnet), Dokumentationen (via FTP), etc. Dies ist möglich, weil URLs auch für andere Ressourcen definiert sind: "mailto:" definiert eine E-Mail-Adresse, die mit dem E-Mail-Protokoll bedient werden muss, "news:" eine Meldung in einer Newsgroup mit entsprechendem Zugriff. In einem HTML-Dokument kann auch ein Verweis auf <ftp://ftp.ethz.ch> stehen: Durch einen Mausklick wechselt der Benutzer damit von einem Text auf den FTP-Server der ETH Zürich. Es ist anzunehmen, dass schon heute ein grosser Teil der auf dem Internet frei verfügbaren Software via W3-Browser bezogen wird.

Schlussfolgerungen, Ausblick

Der Erfolg des W3 wird sich fortsetzen.Die Ausbreitung von W3 von den Informatikern zu den Anwendern in den verschiedensten Fachrichtungen deutet darauf hin, ebenso die starke Kommerzialisierung. Zur Verbreitung werden zusätzlich die neuen Entwicklungen im Bereich elektronisches Geld sowie Erweiterungen, wie die oben erwähnte sichere Benutzeridentifikation, beitragen. In Anbetracht der Energien, die heute in den USA in die "Datenautobahn" investiert werden, ist anzunehmen, dass die Anzahl der Benutzer stark ansteigen wird.

Doch auch Organisationen noch ohne Zugang zum Internet können W3 einsetzen. Der Betrieb von W3 ist in firmeninternen Datennetzen (wie zum Beispiel bei der Schweizerischen Bankgesellschaft, siehe Beitrag auf Seite 17) oder sogar auf einem einzelnen Rechner möglich.

Es ist deshalb zu erwarten, dass sich die grundlegenden Konzepte von W3 (Hyperlink-Schnittstelle und Client-Server-Betrieb) auch auf anderen Netzen und in neuen Anwendungsbereichen durchsetzen werden. Mit der zunehmenden Vernetzung der Privathaushalte werden Systeme in der Art von W3 ihren festen Platz im Alltag finden. Es lohnt sich deshalb, diese Entwicklungen im Auge zu behalten. Informatiker sollten ausserdem versuchen, aktiv daran teilzunehmen.

Literatur

Über das Internet und das W3 sind Dutzende von Büchern erschienen, die teilweise recht schnell veralten. Naturgemäss sind aktuelle Informationen primär online auf dem Internet selbst zu finden. Aktuelle Zusammenstellungen findet man z.B. in:

M. Scheller et al.: Internet: Werkzeuge und Dienste; von "Archie" bis "World Wide Web". Springer, 1994, 3-540-57968-0.

H. Hahn, R. Stout.: The Internet Yellow Pages. McGraw-Hill, 1994, 0-07-882023-5.

Tim Berners-Lee et al.: The World Wide Web, Communications of the ACM, Volume 37, Number 8, August 1994.

Résumé

Un outil nouveau est à disposition depuis peu d'années sur Internet, le plus important ensemble mondial de réseaux: le World-Wide Web (W3, WWW). Le W3 se compose essentiellement de serveurs d'information distribués qui mettent à disposition des données - ils forment ainsi la partie serveur d'un environnement client-serveur mondial. Des programmes-client (appelés browser), installés localement sur la machine de l'utilisateur, donnent l'accès aux serveurs et sont responsables pour l'interface-utilisateur et la présentation des données. Les données stockées du serveur y sont présentées à l'utilisateur comme un grand hypertext: l'utilisateur peut sauter d'un document à l'autre par simple choix d'un hyperlink. Ces documents peuvent être aussi bien des textes que des images, des vidéos ou des tons.

Louis Perrochon ist diplomierter Informatik-Ingenieur ETH. Zur Zeit arbeitet er an einer Dissertation im Bereich verteilte, heterogene, öffentliche Informationssysteme am Institut für Informationssysteme der ETH Zürich und betreut auch das öffentliche Departementsinformationssystem (DINIS) des Departements Informatik der ETH Zürich.

Adresse: Institut für Informationssysteme, ETH Zentrum, 8092 Zürich.
<mailto:Louis@perrochon.com> <http://www.perrochon.com/>


© 1995 SVI / FSI
Louis Perrochon, mailto:Louis@perrochon.com, http://www.perrochon.com/, November 1, 1996