previous next Up Title Contents

5.3.2 Integration bei simultanen Suchdiensten

Die gleichzeitige und integrierte Suche in mehreren Nachweisdiensten für Internetdokumente wird gegenwärtig ansatzweise von simultanen Suchdiensten, wie MetaCrawler, Savvy Search, ProFusion u.a. angeboten. Da die von diesen Diensten gleichzeitig abgesuchten Datenbanken proprietäre Systeme sind, unterliegen die simultanen Suchdienste gewissen Beschränkungen. Dies beginnt bei der Auswahl der genutzten Einzeldienste, die relativ starr ist. Zum großen Teil werden die großen, roboterbasierten Dienste in die Suche einbezogen. Der deutsche Dienst MetGer sucht alle deutschen Suchdienste ab, gleichgültig welchen Typs. Savvy Search trifft eine Auswahl anhand des Dokumenttypes der gewünschten Ressourcen. Eine weitergehende Auswahl der Einzeldienste anhand der Fragestellung und der von den Einzeldiensten nachgewiesenen Inhalte ist nicht möglich. Die Suchmöglichkeiten selbst sind ebenfalls auf den kleinsten gemeinsamen Nenner beschränkt, da jeder Suchdienst eine eigene Syntax und eigene Suchfunktionalitäten verwendet. Die avancierteren Retrievalfunktionalitäten einzelner Dienste gehen bei den simultanen Suchdiensten verloren und es sind i.d.R. nur sehr einfache Stichwortabfragen möglich. Als Ergebnisse werden, meist getrennt nach Suchdienst, die höchstgerankten Treffer der Einzeldienste zurückgegeben. Teilweise werden diese zusätzlich ineinandergeordnet (MetaCrawler, ProFusion, MetaGer, wählbar bei Savvy Search) und von Dubletten befreit (wählbar bei MetaGer). Inference Find gruppiert die Ergebnisse unabhängig vom Herkunftssuchdienst nach Domains, um die Relevanzauswahl zu erleichtern. Da jeder Dienst eigene Rankingalgorithmen verwendet, die den simultanen Diensten nicht zugänglich sind, und da das Ranking auf die Inhalte der jeweiligen Datenbank bezogen ist, führt ein Ineinanderordnen der Ergebnisse aus den verschiedenen Diensten oft zu schlechten Rankingergebnissen. Ein gutes gemeinsames Ranking durch den integrierten Dienst könnte erreicht werden, wenn von den Einzeldiensten detailliertere Angaben zum Ranking bei der Suche mitgeliefert wurden. Ein Lösungsvorschlag für verteilte Suche in mehreren Datenbanken, die auf unterschiedlicher Software basieren können, wurde im August 1997 von Infoseek patentiert. Ein gemeinsames Ranking der Ergebnisse wir dabei vom Client auf der Basis der von den Einzeldiensten gelieferten Informationen durchgeführt. Dafür ist notwendig, daß von den teilnehmenden Suchdiensten Statistiken über die Anzahl des Vorkommens jedes einzelnen Suchbegriffes in jedem Ergebnisdokument veröffentlicht werden.[106]

Möglichkeiten besserer Integration ergeben sich durch die Verwendung von Software, die die verteilte Informationssuche unterstützt bzw. durch den Einsatz von Standards für das Einsammeln der Daten und das Information Retrieval.


[106] s. Infoseek 1997


previous next Up Title Contents