previous next Up Title Contents

3.1 Überblick

Gegenwärtig gibt es eine große Anzahl von Diensten zur Ermittlung und Erschließung von Internetdokumenten. Sie unterscheiden sich sowohl in der Arbeitsweise als auch im Umfang und in den Inhalten. Versuche, die existierenden Dienste zu typologisieren, gibt es sowohl in verschiedenen Hilfs- und Startseiten [17] zur Suche als auch in diversen Texten (Tutorials [18], Texte zur Funktionsweise von Suchdiensten[19], vergleichende Studien[20]). Meist wird - mit unterschiedlicher Terminologie - zwischen verzeichnisbasierten, roboterbasierten Diensten und sog. Metasuchdiensten unterschieden. Darüber hinaus finden sich oft Gruppen für einzelne Dokumentarten oder Protokolle (Conte nennt Suche nach Emailadressen, in Newsgroups, Software Archives, Gopher Archives, What's New) oder für spezielle Fragestellungen und Informationsbedürfnisse (Arents unterscheidet Scientific information search, Background information search). Sullivan stellt Search Engines und Directories sog. Hybrid Search Engines gegenüber. Als solche werden Dienste bezeichnet, die neben der robotergenerierten Datenbank auch einen manuell erstellten Verzeichnisdienst anbieten (z.B. Infoseek, Excite). Becavac [1997, Kap. 2] unterscheidet zwischen der Suche in lokalen WWW-Servern / Gateways zu Datenbanken, Katalog- und verzeichnisbasierter Suche, robotbasierter Suche / Suchmaschinen, Hybriden Suchmaschinen, Metasuchmaschinen und Intelligenten / Mobilen Agenten. Babiak [S. 45ff, 81ff] nutzt die grundsätzlichen Kategorien Suchmaschinen und thematische Verzeichnisse und führt zusätzlich Besprechungsdienste ein, d.h. manuell erstellte Dienste, die Reviews anbieten und eine qualitative Bewertung bzw. Auswahl der Ressourcen vornehmen.

Die Unterscheidungen auf Hilfs- und Startseiten und in Tutorials sind meist anwendungsbezogen; die Dienste werden entsprechend dem Suchziel gruppiert. Andere Autoren, wie Sullivan, Becavac und Babiak, gruppieren entsprechend der Funktionsweise der Dienste, jedoch ist die Typologie oft nicht umfassend.

Eine sehr umfassende und systematische Typologisierung von Suchdiensten wird von T. Koch angeboten.[21] Sie existiert schon längere Zeit und wird in Bezug zu europäischen Projekten verwendet. Sie soll deshalb hier, unter Auslassung der beispielhaft für die einzelnen Gruppen erwähnten Dienste, wiedergegeben werden:

1 Indexes for all types of Web resources

2 Indexes for individual types of Web resources and/or other protocols

Grundsätzlich wird hier unterschieden zwischen Diensten, die alle Typen von WWW-Ressourcen nachweisen (1) und solchen, die sich auf einzelne Typen oder Protokolle beschränken (2). Die unter 2 genannten Ressourcentypen oder Protokolle sind oft über das WWW zugänglich, aber nicht an dieses gebunden. Sie sind nicht Thema der vorliegenden Arbeit. Innerhalb der WWW-Suchdienste wird zwischen kollektiven, öffentlichen und individuellen Diensten unterschieden. Diese Unterscheidung findet sich auch bei Becavac [1996, S. 196-200], dort server-basierte und client-basierte Suche genannt. Zur ersten Gruppe gehören über einen Server im Internet erreichbare Dienste. Bei einer Suche wird dabei auf eine Datenbank zurückgegriffen, die allen Benutzern zur Verfügung steht. Individuelle Dienste (1.2) dagegen werden vom Browser des Anwenders aus gestartet und durchsuchen von dort das WWW. Die Ergebnisse kommen nur dem jeweiligen Benutzer zugute.

Innerhalb von Collective/Public searching unterscheidet Koch wieder vier Kategorien. In zwei dieser Gruppen gibt es aber bisher wenige funktionierende Dienste, die in der Praxis von Bedeutung sind (1.1.C Achitectures for distributed searching und 1.1.D "Intelligent" agents). Ein Beispiel für die Nutzung von Centroids (1.1.C) sind die im Rahmen des britischen ROADS-Projektes entwickelten fachlichen Qualitätsdienste, die WHOIS++ und dessen Centroid-Funktionalität nutzen (vgl. 5.3.3). Combined/Simultaneous and collected indexes sind Dienste, die eine Schnittstelle für den gleichzeitigen Zugriff auf verschiedene WWW-Indices anbieten bzw. auf einer Seite den Zugang zu mehreren Suchdiensten ermöglichen. Die simultanen Dienste werden von anderen Autoren i.d.R. Metasuchdienste[22] genannt.

Die größte Gruppe unter den öffentlichen Suchdiensten bilden die unter 1.1.A genannten singular search engines. Sie werden wiederum aufgeteilt in 1.1.A.1 Robot based indexes und 1.1.A.2 List and template based indexes. Bei den robot based indexes wird mit automatisierten Methoden eine Datenbank erstellt, in der Internetdokumente indexiert werden. List and template based indexes beruhen hauptsächlich auf dem Eintrag der Ressourcen in Listen, entweder seitens der Informationsanbieter oder durch Mitarbeiter der Dienste. Es existieren einerseits Suchdienste, die auf manuellem Eintrag der Ressourcen beruhen und andererseits listenbasierte Verzeichnisse ohne Suchfunktion. Heute haben listenbasierte Dienste ausschließlich im Zusammenhang mit der Organisation der Ressourcen in hierarchischen Verzeichnissen Bedeutung. Sie werden daher oft als verzeichnisbasierte Dienste, directories u.ä. referiert. Da sie, zumindest zu einem gewissen Teil, manuell erstellt sind, wird im folgenden im Gegensatz zu roboterbasierten Diensten von manuell erstellten Diensten gesprochen. In der Praxis werden inzwischen häufig kleinere (teil-) manuell erstellte und z.T. auswählende Verzeichnisse in Verbindung mit roboterbasierten Suchdiensten angeboten.

Die in der vorliegenden Arbeit behandelten Dienste sind den kollektiven, öffentlichen Diensten (1.1) zuzuordnen. Die gegenwärtig bedeutenden Realisierungen aus dieser Kategorie sind dabei den Gruppen

zugeordnet.

Die Funktionsweise dieser Typen soll daher im folgenden näher beschrieben werden.


[17] s. z.B. Arents 1997; o.A.: InterNIC 1997 oder WWW-Suchseiten 1997;

[18] s. z.B. Becavac 1997, Kap. 2: Suchverfahren im WWW; Conte 1996; Karzauninkat 1998, Abschnitt: Welche Suchsysteme gibt es?; Morgan 1996

[19] s. u.a. Becavac 1996; Babiak 1997 sowie Sullivan 1997b: Kap.: How Search Engines Work

[20] s. z.B. Tomaiuolo 1996; Cohen 1997

[21] Koch 1977d
Die Typologie ist in praktischen Zusammenhängen als Grundlage für ein Verzeichnis existierender Suchdienste (Koch 1997b) entstanden. Daraus sind gewisse Inkonsistenzen in der Ausführlichkeit der einzelnen Gruppen zu erklären.

[22] In der vorliegenden Arbeit wird, wie auch in T. Kochs Typologie, von simulanen Suchdiensten gesprochen. Der Begriff Metasuchdienst ist m.E. nicht korrekt, da er in der üblichen Bedeutung von Meta einen Suchdienst bezeichnen müßte, der andere Suchdienste als Ergebnis hat, nicht jedoch Einzelressourcen.


previous next Up Title Contents