SC 99-16 Monika Kuberek: Match- und Merge-Verfahren in der KOBV-Suchmaschine -
Bibliothekarische Vorüberlegungen (in Vorbereitung)
Abstract:
Die Recherche über die KOBV-Suchmaschine liefert
Datensätze aus unterschiedlichen
Bibliotheken. Damit der Nutzer nicht viele, unter
Umständen lange Listen für jede einzelne
Bibliothek durchblättern muss, werden die Datensätze in
der KOBV-Suchmaschine einer
Dublettenbehandlung (Match- und Merge-Verfahren)
unterzogen. Ziel dieses Verfahrens ist es,
dem Nutzer möglichst nur einen einzigen Datensatz mit
allen zugehörigen Bestandsnachweisen
aus den Bibliotheken anzuzeigen.
Das Papier beinhaltet die grundlegenden bibliothekarischen
Vorüberlegungen zum Match- und
Merge-Verfahren in der KOBV-Suchmaschine: Zunächst wird
definiert, was unter einer Dublette
überhaupt zu verstehen ist.
Die Begriffe Dokument
und Werk werden analysiert, die wesentlich sind füer
die Entscheidung, welche Datensätze in der
KOBV-Suchmaschine letztendlich zusammengeführt werden.
Anhand umfassender Literaturrecherchen werden die zur
Dublettenbehandlung herangezogenen
bibliographischen Beschreibungselemente (Attribute)
in verschiedenen MARC- und MAB-Datenbanken ermittelt und
grundsätzliche Probleme beim
Erkennen dubletter bibliographischer Datensätze
aufgezeigt. Schliesslich werden Verfahren
vorgestellt und diskutiert, wie die Attribute in das
Match- und Merge-Verfahren
eingebunden werden: bei nur einer Gewichtung (positiver
Wert) und bei
zwei Gewichtungen (positiver und negativer Wert). Auf
dieser Basis werden
Tabellen mit Werten für zwei unterschiedliche
Gewichtungsverfahren in der KOBV-Suchmaschine
entwickelt, die als
Ausgangswerte für erste Testverfahren
in den Match- und Merge-Algorithmus in der
KOBV-Suchmaschine
implementiert werden.
Keywords: Dublettenbehandlung,
KOBV,
KOBV-Suchmaschine,
Kooperativer Bibliotheksverbund Berlin-Brandenburg,
Match- und Merge-Verfahren
CR: H.0K, 4.0