previous next Up Title Contents

5.2.3 Manuell erstellte Suchdienste


5.2.3.1 Ausgangspunkt

Manuell erstellte Dienste sind durch die Einbeziehung intellektueller Entscheidungen bei der Auswahl und/oder Erschließung der Ressourcen charakterisiert, auch wenn dies in unterschiedlichem Umfang von den Diensten genutzt wird. Die Möglichkeiten präziser und umfassender Suche hängen damit vor allem von der Qualität der Auswahl und der Indexierung ab. Die bei den roboterbasierten Suchdiensten betrachteten Funktionalitäten des Information Retrieval spielen hingegen eine untergeordnete Rolle, da die manuell erstellten Dienste wesentlich kleiner sind und das Problem zu hoher Treffermengen daher nicht in gleichem Maße auftritt.

Manuell erstellte Dienste bieten zudem meist eine Strukturierung der Ressourcen in systematischen Verzeichnissen an. Der Zugang erfolgt vorrangig durch Browsing in diesen Verzeichnissen; die gezielte Suche spielt meist eine untergeordnete Rolle. Auf die Auswahlkriterien der Dienste wurde schon in Kap. 5.1 eingegangen, im folgenden sollen die verwendeten Indexierungsmethoden betrachtet werden.

5.2.3.2 Grad der Erschließung

Bei den manuell erstellten Nachweismitteln ist, im Gegensatz zu roboterbasierten Suchdiensten, nicht der Volltext der Dokumente indexiert. Daher sind die zur Beschreibung des Dokumentes vorliegenden Metadaten sowohl für die Suche in den Dokumentmengen als auch die Entscheidung über die Relevanz eines Dokumentes beim Browsing ausschlaggebend.

Diese Beschreibung kann von der ausschließlichen Verzeichnung des Titels über Kurzkommentare oder Inhaltsbeschreibungen, Reviews, Ratings bis hin zu professionell erstellten Abstracts, Klassifikationscodes und Schlagworten auf der Basis von kontrolliertem Vokabular reichen. Weitere Informationen können Angaben zum Herausgeber bzw. Autor, Erstellungsdatum, zur Größe, zu Zugangsbedingungen und zu Beziehungen zu anderen Dokumenten u.ä. sein.

Besonders bei einigen generellen Browsingdiensten beschränkt sich die Erschließung auf Minimalangaben. Diese werden teilweise von den Personen gemacht, die die Seiten beim Dienst anmelden, was zu unterschiedlicher Qualität der Angaben und Inkonsistenzen führt. In Yahoo!, Einet Galaxy, den WWW-Ressourcen der Infoseek Channels oder den deutschen Diensten DINO und Web.de sind z.B. nur die Titel und teilweise sehr knappe Kurzbeschreibungen des Inhalts vorhanden. Weitere Informationen über den Inhalt können nur aus der Einordnung in die Systematik gewonnen werden. Auch bei einer Suche in der Datenbank kann lediglich auf diese spärlichen Angaben zurückgegriffen werden, was zu eingeschränkten Treffermengen führt. Auf dieser Basis ist es oft nicht möglich, die Relevanz einer Ressource zu erkennen. Daneben erschweren Schwächen in der Konsistenz der Systematiken das Finden aller Dokumente zu einer Fragestellung.

Ausführlichere Angaben sind größtenteils wieder bei den fachlichen Qualitätsdiensten anzutreffen. Die in diesen Diensten nachgewiesenen Ressourcen sind mit aussagekräftigeren Beschreibungen versehen. Weiterhin werden Schlagworte vergeben, teilweise auf der Basis von kontrolliertem Vokabular. So sind die Schlagworte in EELS dem für Ingenieurwissenschaften etablierten Thesaurus von Engineering Information Inc. entnommen und die für den Nachweisdienst medizinischer Ressourcen OMNI den Medical Subject Headings (MeSH). Diese Dienste verwenden auch durchgängig etablierte Klassifikationen, z.T. abgewandelt oder umgestellt bzw. einen ausgewählten Bereich eines Klassifikationssystemes. So liegt dem Browsingverzeichnis in SOSIG in Ermangelung einer international etablierten Klassifikation für die Sozial- und Wirtschaftswissenschaften ein Auszug aus der Universal Decimal Classification (UDC) zugrunde. Das Klassifikationssystem dient entweder als Grundlage der Browsingstruktur oder zur inhaltlichen Beschreibung der Ressourcen mit Hilfe der Klassifikationscodes (s.u.).

Abbildung 7: Beschreibung der Dokumente in EELS (Stand: 17.1.1998)

Die weitere Erschließung ist bei den einzelnen Diensten unterschiedlich. In ADAM, einem Nachweisdienst für Kunstwissenschaft, Design und Architektur, sind die Ressourcen z.B. über die historische Periode und die geographische Region erschlossen[96] und im Ingenieurwissenschaftlichen Dienst EEVL über den Dokumenttyp.

Von den fachübergreifenden Diensten bieten NetFirst von OCLC und das NISS Directory of Networked Resources die weitestgehende Erschließung. NetFirst verwendet sowohl Deskriptoren auf der Basis der Library of Congress Subject Headings (LCSH) als auch Klassifikationscodes der Dewey Decimal Classification (DDC). Wenn sie aus dem Dokument hervorgehen, werden außerdem Angaben zu Autor, Herausgeber, der Name der Körperschaft, Publikationsort, Kontaktmöglichkeit, Zugriffsmethode sowie, abhängig von der Art der Quelle, weitere Informationen erfaßt. Das NISS-Verzeichnis nutzt die UDC als Browsingstruktur sowie zur Auszeichnung der Einzelressourcen und ermöglicht die Vergabe von LCSH-Deskriptoren. Darüber hinaus werden administrative Metadaten, wie Publikationstyp, Kontaktmöglichkeit, der Tag der Erfassung sowie die Emailadresse des Erfassers festgehalten. Beide Dienste bieten auch die Möglichkeit der gezielten Suche mit Hilfe der Klassifikationscodes oder der Schlagworte.

Ein Teil der allgemeinen WWW-Verzeichnisse, wie Yahoo!, Galaxy oder Magellan's Reviews, gewinnt den größten Teil der Dokumente durch Selbsteintrag der Seiten durch die Autoren. Auch viele andere manuelle Dienste ermöglichen die Selbstanmeldung von Seiten. Die Qualität der dabei gemachten Angaben ist hierbei sehr unterschiedlich. Selbst wenn die Dienste angeben, Redakteure zu beschäftigen, ist es aufgrund der vorgefundenen Angaben z.T. sehr zweifelhaft, ob diese mit der Beschreibung der Dokumente beschäftigt sind. Wird diese von den Autoren selbst vorgenommen, sind oft fehlende Konsistenz bei der Erstellung von Abstracts, der Vergabe von Deskriptoren oder der Einordnung der Dokumente in die Systematik die Folge. Dies beeinträchtigt sowohl die Such- als auch die Browsingmöglichkeiten. Wünschenswert, aber aufgrund der hohen Kosten bei den generellen Diensten nicht realisierbar, ist daher eine professionelle Erschließung, möglichst durch Spezialisten der jeweiligen Fächer. Dies wird am ehesten bei den fachlichen Qualitätsdiensten erreicht; EELS z.B. entsteht in einer Kooperation von Redakteuren aus ingenieurwissenschaftlichen Hochschulen und Instituten in Schweden unter Mitarbeit aus anderen nordischen Ländern. Die Qualität und Konsistenz der Indexierung kann durch detaillierte Richtlinien für die Autoren bzw. Redakteure erhöht werden. Ein sehr ausführliches Formular für die Anmeldung stellt z.B. das NISS-Verzeichnis zur Verfügung.[97] Neben grundsätzlichen Angaben zur Ressource werden auch die entsprechenden Klassifikationscodes der UDC (notwendig), der DDC (optional) sowie treffende Deskriptoren aus den LCSH (ebenfalls optional) abgefragt. In dieser Ausführlichkeit ist das Anmeldeformular allerdings eher für geschulte Mitarbeiter als für Laien sinnvoll nutzbar. Relativ ausführliche Formulare für die Selbstanmeldung bieten auch fachliche Qualitätsdienste, wie SOSIG[98] und OMNI[99], an.

5.2.3.3 Organisation der Daten

Die in den manuell erstellten Dienste nachgewiesenen Ressourcen sind fast ausschließlich in hierarchischen Verzeichnissen organisiert. Die Verzeichnisse sind nach verschiedenen Aspekten geordnet, wobei vier systematische Ordnungsprinzipien unterschieden werden können: die Verzeichnung nach Sachgebieten, nach Dokumenttyp, geographische oder chronologische Ordnung. Am häufigsten werden Systematiken nach Sachgebieten eingesetzt. Sie dienen dem gezielten Zugriff auf Dokumente ähnlichen Inhalts, helfen, Suchen einzugrenzen oder auszuweiten und stellen Dokumente in ihrem inhaltlichen Kontext dar. Der Nutzen dieser thematischen Verzeichnisse ist jedoch stark abhängig von der Art der gewählten Systematik. Es werden sowohl selbstentwickelte Systematiken als auch wissenschaftliche, etablierte Klassifikationen genutzt.

Die generellen Dienste, wie Yahoo!, Magellan's Web Reviews, Galaxy, die Channels von Infoseek, Excite, WebCrawler u.ä. verwenden größtenteils selbstentwickelte Systematiken. Auf der obersten Ebene steht meist eine überschaubare Anzahl von Sachgruppen, die sich i.d.R. auf populäre Themen beziehen. Der Unterhaltungscharakter der Angebote wird unterstrichen durch die grundlegenden Veränderungen, die es 1997 bei den manuellen Verzeichnissen der großen roboterbasierten Dienste Infoseek, Excite, WebCrawler gegeben hat. Die hierarchischen Systematiken, die ausgewählte und teilweise kommentierte und bewertete WWW-Ressourcen enthielten, wurden durch sogenannte Channels abgelöst. In diesen werden Teile des früheren Verzeichnisses zusammen mit thematisch passenden Werbeangeboten, Nachrichten und einzelnen Services angeboten. Die enthaltenen Ressourcen sind in den Infoseek Channels und dem Excite Web Guide nur noch teilweise manuell bearbeitet. Der Werbe- und Unterhaltungscharakter steht klar im Vordergrund. Die Channels dienen nicht der gezielten Informationssuche, sondern wollen Tips zu einzelnen Angeboten geben.

So werden in den Infoseek Channels die Hauptkategorien "Automotive, Business, Careers, Computer, Entertainement, The Good Live, Health, Internet, Kids & Family, News, Personal Finance, Real Estate, Shopping, Sports, Travel" angeboten.

Abbildung 8: Infoseek Channels (Stand: 17.1.1998)

Diese Sachgruppen entsprechen nicht den Wissenschaftsdisziplinen und haben auch nicht den Anspruch, das gesamte Gebiet des Wissens abzudecken. Gerade natur- aber auch sozialwissenschaftliche Ressourcen haben keinen Platz in der Systematik; die Kategorien sind rein pragmatisch nach den erwarteten Nutzerinteressen gebildet. Dies spiegelt gut die Zielgruppen der Dienste wider und korrespondiert oft mit den Auswahl- und Bewertungpraktiken der Ressourcen, bei denen Unterhaltungswert, Design und Innovativität die größte Rolle spielen. Die Systematiken sind mit den Diensten gewachsen, wie bei Yahoo![100], was zu Inkonsistenzen und fehlender Logik in der Ordnung führt, wenn die Einträge zunehmen.

Die ständigen Veränderungen in der Systematik ermöglichen zwar eine schnelle Anpassung an neue Interessengebiete und große Flexibilität, erschweren es dem Nutzer jedoch, Vertrautheit mit einem System zu gewinnen. Die Schwächen der selbstentwickelten Systematiken faßte T. Koch zusammen:

"Es herrschen Mängel in der Logik, der Hierarchie und Ausschöpfung der Kategorien, der Vollständigkeit, der Terminologie und der Art der internen Verknüpfungen und Mehrfachplazierungen, die eine korrekte und effiziente Nutzung meist unmöglich machen."[101]

Für die wissenschaftliche Informationssuche mit dem Anspruch präziser und erschöpfender Ergebnisse sind diese Dienste daher wenig geeignet.

Etablierte Klassifikationen haben Vorteile, die über den allgemeinen, bereits erwähnten Nutzen von Systematiken für den gezielten Informationsnachweis hinausgehen. Sie wurden oft über viele Jahre von kooperierenden Institutionen erstellt, gepflegt und aktualisiert. Dadurch wird eine relativ große Konsistenz innerhalb der Klassifikation erreicht; Revisionen führen selten zur Notwendigkeit, Ressourcen umzuklassifizieren. Sie bestehen unabhängig vom Inhalt der augenblicklich in einer Sammlung befindlichen Objekte. Durch die Verwendung von numerischen oder alphanumerischen, von spezifischen Sprachen unabhängigen Notationen bieten sie das Potential eines mehrsprachigen Zugangs und werden teilweise auch in verschiedenen Sprachen angeboten (z.B. DDC, UDC). Suche und Browsing kann datenbankübergreifend ermöglicht werden, wenn das gleiche Klassifikationssystem von mehreren Diensten genutzt wird oder es Konvertierungsmöglichkeiten zwischen den Formaten gibt. Etablierte Klassifikationen haben bei Wissenschaftlern und regelmäßigen Nutzern von Bibliotheken einen hohen Bekanntheitsgrad. Sie liegen oft in maschinenlesbarer Form vor. [102]

Suchdienste, die mit etablierten Klassifikationssystemen arbeiten, bieten eine bessere Suchunterstützung als selbstentwickelte Systematiken, da sie eine größere Konsistenz der Systematik aufweisen und logisch-hierarchisch aufgebaut sind. Inhaltlich zusammengehörende Informationen sind an der gleichen Systemstelle zu finden. Im Verzeichnis ist ein Browsing vom Allgemeinen zum Spezifischen möglich. Ein Kritikpunkt an etablierten Klassifikationen ist jedoch, daß sie zu unflexibel sind und Veränderungen in der Organisation der Wissenschaften zu langsam umsetzen.

Es gibt eine Reihe von Verzeichnissen, die etablierte Klassifikationen einsetzen. Meist kommen allerdings nur die obersten Hierarchieebenen zum Einsatz, wie bei der WWW Virtual Library, die nur die Hauptkategorien der Library of Congress Classification (LCC) verwendet, oder es werden nur diejenigen Kategorien angeboten, für die Ressourcen vorhanden sind (CyberStacks(sm) mit der LCC) bzw. die dem jeweiligen Fach bei fachspezifischen Diensten entsprechen. So nutzt SOSIG die sozialwissenschaftlichen Kategorien der UDC und Biz/ed verwendet einen Teil der DDC. Einige Dienste, wie z.B. BUBL Link, nutzen die Klassifikation nur als Grundlage für das Browsingverzeichnis, nicht zur Auszeichnung einzelner Ressourcen. Umgekehrt werden z.T. auch Klassifikationscodes für einzelne Dokumente vergeben, ohne daß die Klassifikation als Verzeichnis zum Browsing zur Verfügung gestellt wird (ADAM, früher bei NetFirst).

Eine Übersicht über Dienste, die etablierte Klassifikationen bzw. kontrolliertes Vokabular einsetzen, bieten McKiernan mit Beyond Bookmarks[103] sowie mit dem Stand von Januar 1997 der DESIRE Report über den Einsatz von Klassifikationsschemata[104]. Aus beiden Dokumenten geht hervor, daß die DDC die am häufigsten verwandte Klassifikation ist. Nationale Systematiken werden nur von wenigen Diensten eingesetzt (DutchESS verwendet nur die Nederlandse Basisclassificatie, Länkskafferiet basiert auf Sveriges Allmänna Biblioteksförenigs Classification System). Der Einsatz nationaler Klassifikationen ist im Internet nur sinnvoll, wenn die anvisierten Nutzer aus dem Land sind, in dem die Klassifikation angewandt wird und diese dort weit verbreitet ist. Einzelne Dienste nutzen international etablierte Klassifikationen für einzelne Fächer, wie die Mathematics Subject Classification (Materials Organized by Mathematical Classification von der American Mathematical Society), die Engineering Information (Ei) Classification Codes (EELS sowie stark abgewandelt EEVL) oder das Computing Reviews Classification System (ARIADNE). Ein Teil der Dienste, die Klassifikationen anbieten, haben einen sehr geringen Umfang. Insgesamt besteht die Tendenz, daß besonders Dienste, die sich hinsichtlich der genannten Zielgruppe und der Auswahl an wissenschaftliche Nutzer wenden, auch wissenschaftliche Klassifikationen einsetzen. Es existieren jedoch auch von öffentlichen Bibliotheken angebotene Zusammenstellungen von Internetquellen, die in diesen Bibliotheken gebräuchliche Klassifikationssysteme nutzen.[105]

Einige Potentiale etablierter Klassifikationsschemata, wie mehrsprachige Zugänge und die Integration von Systemen, die die gleiche Systematik verwenden, werden bisher bei den existierenden Diensten nicht genutzt.

5.2.3.4 Möglichkeiten umfassender Suchen

Manuell erstellte Internetverzeichnisse sind für umfassende Suchen wegen ihres relativ geringen Umfangs generell weniger geeignet. Besonders Dienste, die sich an wissenschaftliche Nutzergruppen wenden und eine entsprechende qualitative Auswahl und Erschließung der Ressourcen vornehmen, können jedoch wertvolle Hilfsmittel für den Einstieg in ein Thema und den Nachweis relevanter Qualitätsressourcen sein. Dies trifft in besonderem Maße auf die fachgebietsspezifischen Qualitätsdienste zu. Dienste, in denen die nachgewiesenen Dokumente intellektuell durch Abstracts, Klassifikationscodes und kontrolliertes Vokabular erschlossen werden, bieten die größten Möglichkeiten für präzise und erschöpfende Suchen innerhalb der Bestände der Datenbank. Eine gründliche intellektuelle Erschließung ist allerdings sehr kosten- und zeitintensiv. Sie ist bei den riesigen und ständig zunehmenden Mengen an Internetdokumenten daher immer nur für kleine Teile möglich.


[96] vgl. Bradshaw 1997a

[97] NISS Information Gateway Resource Description Template. Online: http://www.niss.ac.uk/resource-description/template.html (Stand: 9.12.1997)

[98] Submit a New Resource to SOSIG. Online: http://www.sosig.ac.uk/sosig/cgi/newurl.pl (Stand: 9.12.1997)

[99] Add a New Resource to OMNI. 25.11.1997. Online: http://omni.ac.uk/submit-url/ (Stand: 9.12.1997)

[100] vgl. Steinberg 1996, S. 111

[101] Koch 1996, Kap. 2

[102] Zur Rolle und dem Einsatz von Klassifikationssystemen bei Internetdiensten liegt ein sehr umfangreicher Bericht aus dem DESIRE-Projekt vor: DESIRE 1997e, Kap. 1.2

[103] McKiernan 1997

[104] DESIRE 1997e

[105] Z.B. verwendet der Systematisk Internetkatalog der Möndals Stadsbibliotek in Schweden das System der Sveriges Allmänna Biblioteksförening (SAB), welches in den schwedischen, öffentlichen Bibliotheken eingesetzt wird.


previous next Up Title Contents