previous next Up Title Contents

5.2.1 Bedingungen präziser und erschöpfender Suche

Präzise Ergebnisse und die Möglichkeit erschöpfender Suchen sind Anforderungen, die für wissenschaftliche Informationsrecherchen besonders wichtig sind. Präzise Suchmöglichkeiten sind dann gegeben, wenn ein gezielter Zugriff nur auf diejenigen Dokumente in der Datenbank erfolgt, die eine Antwort auf die gestellte Frage geben.

Erschöpfende Suchmöglichkeiten können sich im Internet einmal auf alle darin vorhandenen Inhalte beziehen oder aber auf die in der Datenbank des entsprechenden Suchdienstes nachgewiesenen Informationen. Der umfassende Nachweis aller in einer bestimmten Datenbank enthaltenen Information zu einer Fragestellung wird im Online Information Retrieval mit der Größe Recall beschrieben, während die Präzision einer Suche mit dem Maß Precision angegeben wird. Harter definiert Recall als die Zahl der relevanten, nachgewiesenen Dokumente geteilt durch die Zahl aller relevanten Dokumente in einer Datenbank und Precision als die Zahl der relevanten, nachgewiesenen Dokumente durch die Zahl aller nachgewiesenen Dokumente. [83] Convey bezeichnet als maximalen Recall "the retrieval of every possible record which includes the concept"[84]. Beide Größen sind abhängig von der Indexierung und den Möglichkeiten des Information Retrieval.

Precision und Recall sind Quoten. Maximale Werte für beide Größen sind in der Praxis nicht erreichbar. Die Verbesserung eines Wertes geht immer auf Kosten des anderen. Precision ist immer subjektiv, da nur der Nutzer selbst bestimmen kann, welche gefundenen Dokumente für ihn relevant sind. Das Maß des Recall ist auch in traditionellen Datenbanken schwer prüfbar. Im Internet ist es überhaupt nicht meßbar, da die absolute Menge von Dokumenten zu einer Suchanfrage nicht ermittelbar ist. Die Möglichkeiten der Suchdienste, präzise und erschöpfende Suchen durchführen zu können, kann daher nur indirekt über die Methoden der Indexierung und des Information Retrieval ermittelt werden.

Bezogen auf das gesamte Internet ist die Möglichkeit erschöpfender Suche abhängig von der Vollständigkeit der Datenbank des entsprechenden Suchdienstes. Für erschöpfende Suchen sind daher die auswählenden, manuellen Suchdienste wenig geeignet. Roboterbasierte Suchdienste haben aufgrund ihrer Arbeitsweise eher die Möglichkeit, große Mengen der im Internet vorhandenen Informationen nachzuweisen. Eine Studie einer schwedischen Firma zum Deckungsbereich von Suchdiensten kam jedoch zu dem Ergebnis, daß nur jede vierte bis fünfte schwedische Site von den großen, roboterbasierten Suchdiensten gefunden wird.[85] Bessere Ergebnisse werden bei Seiten außerhalb der USA von den regionalen oder lokalen Diensten erbracht, doch auch der beste schwedische Suchdienst weist nur 49% des schwedischen WWW nach.

Ein ähnliches Ergebnis hinsichtlich des Deckungsbereiches entdeckte der Webmaster des Servers der Federation of American Scientists im März 1997. Er stellte fest, daß von den 6000 Seiten dieses Servers nur 10% in Alta Vista nachgewiesen waren. Alta Vista bestätigte dies und kommentierte "You will probably not see much more than that for any one domain."[86] Dies zeigt, daß auch die großen, roboterbasierten Suchdienste, die oft den Eindruck erwecken wollen, das WWW nahezu vollständig zu indexieren, sich nur auf Ausschnitte begrenzen. Aus mehreren vergleichenden Studien zu Internet-Suchdiensten geht zudem hervor, daß die Überlappungen zwischen den Ergebnissen einzelner Dienste relativ gering sind, was ein weiterer Hinweis auf die Lückenhaftigkeit der Dienste ist.[87] Daraus kann geschlußfolgert werden, daß für erschöpfende Suchen im Internet die Benutzung eines Suchdienstes nicht ausreichend ist. Selbst wenn alle Dienste benutzt werden, kann keine Vollständigkeit erreicht werden, da es immer Dokumente gibt, die nicht erfaßt werden, weil z.B. von keiner anderen Seite auf sie verwiesen wird. Um möglichst umfangreiche Ergebnisse zu erzielen, ist es notwendig, alle Suchdienste einzubeziehen, die den entsprechenden Bereich umfassen. Auch die Verwendung von simultanen Suchdiensten hilft hier nicht weiter, da bei diesen immer nur die ersten Treffer jedes berücksichtigten Einzeldienstes ausgegeben werden.

In den folgenden Abschnitten werden die Funktionalitäten der Dienste dargestellt, die zur Erhöhung von Precision bzw. Recall beitragen können. Aufgrund der unterschiedlichen Arbeitsweise von roboterbasierten und manuell erstellten Diensten werden beide Typen getrennt behandelt.


[83] Harter 1986, S. 157

[84] Convey 1989, S. 71

[85] Zackrisson 1997

[86] Pike 1997

[87] s. u.a.: Zorn 1996, Kap. Making Choices...; Page 1996; Zackrisson 1997


previous next Up Title Contents