ZIB PaperWeb

Match- und Merge-Verfahren in der KOBV-Suchmaschine - Bibliothekarische Vorüberlegungen (in Vorbereitung)

SC 99-16 Monika Kuberek: Match- und Merge-Verfahren in der KOBV-Suchmaschine - Bibliothekarische Vorüberlegungen (in Vorbereitung)

Abstract: Die Recherche über die KOBV-Suchmaschine liefert Datensätze aus unterschiedlichen Bibliotheken. Damit der Nutzer nicht viele, unter Umständen lange Listen für jede einzelne Bibliothek durchblättern muss, werden die Datensätze in der KOBV-Suchmaschine einer Dublettenbehandlung (Match- und Merge-Verfahren) unterzogen. Ziel dieses Verfahrens ist es, dem Nutzer möglichst nur einen einzigen Datensatz mit allen zugehörigen Bestandsnachweisen aus den Bibliotheken anzuzeigen.
Das Papier beinhaltet die grundlegenden bibliothekarischen Vorüberlegungen zum Match- und Merge-Verfahren in der KOBV-Suchmaschine: Zunächst wird definiert, was unter einer Dublette überhaupt zu verstehen ist. Die Begriffe Dokument und Werk werden analysiert, die wesentlich sind füer die Entscheidung, welche Datensätze in der KOBV-Suchmaschine letztendlich zusammengeführt werden. Anhand umfassender Literaturrecherchen werden die zur Dublettenbehandlung herangezogenen bibliographischen Beschreibungselemente (Attribute) in verschiedenen MARC- und MAB-Datenbanken ermittelt und grundsätzliche Probleme beim Erkennen dubletter bibliographischer Datensätze aufgezeigt. Schliesslich werden Verfahren vorgestellt und diskutiert, wie die Attribute in das Match- und Merge-Verfahren eingebunden werden: bei nur einer Gewichtung (positiver Wert) und bei zwei Gewichtungen (positiver und negativer Wert). Auf dieser Basis werden Tabellen mit Werten für zwei unterschiedliche Gewichtungsverfahren in der KOBV-Suchmaschine entwickelt, die als Ausgangswerte für erste Testverfahren in den Match- und Merge-Algorithmus in der KOBV-Suchmaschine implementiert werden.
Keywords: Dublettenbehandlung, KOBV, KOBV-Suchmaschine, Kooperativer Bibliotheksverbund Berlin-Brandenburg, Match- und Merge-Verfahren
CR: H.0K, 4.0