previous next Up Title Contents

5.3.3 Kooperative Dienste

Offene Software, die ihren Anwendern erlaubt, in Zusammenarbeit kooperative Dienste anzubieten, sind z.B. Harvest und WHOIS++. Harvest ist eine Software für verteiltes Indexieren, die an der University of Colorado, Boulder entwickelt wurde.[107] Sie besteht aus verschiedenen Modulen. Der Gatherer sammelt Daten über Dokumente aus einem begrenzten Netzwerk oder einer Sammlung von WWW-Servern. Diese schickt er abhängig vom MIME-Typ zu Filtern, die die Indexierungsdaten extrahieren und in einem speziellen Austauschformat (SOIF: Summary Object Interchange Format) lagern. Dabei können auch Metadaten ausgenutzt werden, die diese Dokumente enthalten. Der Broker kontrolliert periodisch bei einer Anzahl Gatherer, ob neue Objekte produziert wurden. Er kann seine Objekte an andere Broker verteilen und kopieren. Das dritte Modul, das Suchsystem, ist nicht standardisiert. Es können verschiedene Suchsysteme verwendet werden. Durch eine abgestimmte Zusammenarbeit von Gatherern und Brokern bzw. von mehreren Brokern ermöglicht Harvest verteiltes Indexieren. Mehrere Indices können zu einem neuen Dienst zusammengefaßt werden, in diesem Sinne ist eine Integration mehrerer Datenbanken möglich. Abgesehen davon hilft Harvest durch das verteilte Einsammeln der Daten, die Netz- und Serverbelastungen zu reduzieren. Harvest wird vor allem für lokale Suchsysteme eingesetzt, aber auch von einigen verteilten Suchdiensten, wie dem MathN Broker, einem Suchdienst für deutsche, mathematische Informationen und dem Europe Physics Broker.

Ähnliches wie Harvest ermöglicht WHOIS++, ebenfalls eine Software, die dem verteilten Indexieren dient.[108] Sie ist der technische Nachfolger des WHOIS-Dienstes zum Nachweis von Internetnutzern. Es werden base level server und indexing server unterschieden. Die base level server enthalten die Indexate, die in standardisierten Formaten vorliegen, der indexing server Verweise auf andere indexing server oder base level server. Dazu werden sog. Centroids eingesetzt. Centroids enthalten konzentrierte Repräsentationen des invertierten Indexes der Einzeldatenbanken. Aufgrund dieser Informationen kann der Indexserver entscheiden, welcher base level server Objekte enthält, die auf eine Suchanfrage passen. Eine Suche wird daher nicht direkt in den verschiedenen base level servern durchgeführt, sondern zuerst in dem Indexserver, der die Centroids enthält. Dieser leitet die Anfrage dann zu den relevanten Diensten weiter. Auf dieser Basis kann durch Zusammenfügen mehrerer base level und indexing server ein verteilter, suchbarer Dienst gebildet werden.

WHOIS++ wird von den im Rahmen des britischen ROADS-Projektes[109] entwickelten fachlichen Qualitätsdiensten sowie von EELS genutzt. Auf der Basis der Centroid-Funktionalität wird der Testdienst CrossROADS zur gemeinsamen Recherche in den verschiedenen Diensten angeboten.

Andere Beispiele für geschlossene Integration sind Dienste für den gemeinsamen Nachweis von elektronischen und gedruckten Dokumenten. Dies betrifft den Nachweis von Internetdokumenten in Bibliothekskatalogen (z.B. im Gesamtkatalog des Südwestdeutschen Bibliotheksverbundes SWB[110] und im norwegischen Verbundkatalog BIBSYS[111]), von Artikeln aus elektronischen Zeitschriften in Onlinedatenbanken (z.B. in INSPEC) oder die Verbindung von Internet-Suchdiensten mit Volltextdatenbanken, die traditionelle Zeitschriftenartikel enthalten (Northern Light) u.ä. Da diese Realisierungen auf proprietären Lösungen beruhen, soll hier nicht näher darauf eingegangen werden.


[107] s. Harvest 1995

[108] s. Whois++ 1996 und Whois++ 1997

[109] s. ROADS 1997

[110] Zugang: http://swbv.uni-konstanzde/CGI/cgi-bin/opacform.cgi (Stand: 17.1.1998)

[111] Zugang: http://www.bibsys.no/search/pube (Stand: 17.1.1998)


previous next Up Title Contents