previous next Up Title Contents

5.3.4 Offene Integration durch Anwendung von Standards


5.3.4.1 Metadaten

Die Verwendung von Standards ermöglicht eine offene und breite Integration, die keine vorherigen Übereinkommen der Partner voraussetzt. Bestehende Standards bzw. Konventionen in diesen Bereichen wurde in den vorigen Abschnitten schon erwähnt. Sie betreffen die Beschreibung der Dokumente durch Metadaten sowie das Information Retrieval.

Standardisierte Metadaten sind aus dem Bereich der Bibliothekskataloge bekannt. Die Verwendung von Standards ermöglicht hier die Fremddatenübernahme und die Integration von Katalogen. Diese Vorzüge sind auch für die standardisierte Beschreibung von Internetdokumenten gültig. Sie tragen außerdem, in Verbindung mit Information Retrieval Standards, dazu bei, die Suchmöglichkeiten diensteübergreifend zu verbessern. Besondere Bedeutung hat die Verwendung standardisierter Metadaten hinsichtlich der Integration verschiedener Dienste bei den manuell erstellten Suchdiensten. Diese haben die Möglichkeit einer intellektuellen Indexierung und können daher für die Erschließung der Dokumente Metadatenstandards besser nutzen. Die Standardisierung betrifft verschiedene Aspekte der Metadaten: die Semantik, d.h. die Definition der zu einem Metadatenformat gehörenden Elemente, und die Syntax, in der diese dargestellt werden. Weiterhin können die Inhalte der Beschreibung auf Standards beruhen, wie etablierten Klassifikationsschemata, Thesauri oder kontrolliertem Vokabular für die Bildung von Schlagworten.

Gegenwärtig sind verschiedene Metadatenformate für unterschiedliche fachliche Zusammenhänge bzw. verschiedene Zwecke (switching language, integrierte Dienste, verbesserte Suchpräzision, volle Unterstützung der Dokumentverwaltung etc.) im Einsatz.[112] Als genereller Standardvorschlag gewinnt das Dublin Core Elemtent Set (DC) immer größere Bedeutung.[113] Seit Dezember 1996 liegt die Version 1.0 vor, die aus 15 Elementen besteht. DC ist prinzipiell einfach gehalten, um Autoren von Dokumenten zur Beschreibung anzuregen. Die Grundelemtente können jedoch durch lokale Felder, sogenannte schemes und andere qualifier erweitert bzw. präzisiert und verfeinert werden. Mit Hilfe dieser schemes kann z.B. angegeben werden, auf welchem Klassifikationssystem ein verwendeter Code beruht oder in welcher Form eine Datums- oder Autorenangabe gemacht wurde. Um die Schaffung von DC-Metadaten durch die Autoren zu fördern, gibt es inzwischen mehrere Hilfsmittel auf Formularbasis[114] sowie in geringem Maße zum automatischen Extrahieren von DC-Metadaten aus HTML-Dokumenten[115].

Bisher gibt es nur wenige Suchdienste, die DC-Metadaten nutzen (s. Kap. 5.2). Auch bei den manuellen Diensten setzen bisher nur kleinere Nachweisdienste DC zur Beschreibung der Dokumente ein, wie der Deutsche Bildungsserver und die an der Stadt- und Universitätsbibliothek Göttingen im Rahmen ihrer Sondersammelgebiete erstellten Fachinformationsdienste MathGuide und GeoGuide. Gegenwärtig gibt es noch keine Realisierungen von Integrationen auf der Basis von DC, die Verwendung des Standards bietet aber gute Voraussetzungen dafür.

Die im Rahmen des ROADS-Projektes entwickelten fachlichen Qualitätsdienste sowie EELS beschreiben ihre Dokumente mit Hilfe von IAFA Templates, da zum Zeitpunkt ihres Entstehens DC noch nicht weit genug entwickelt war. IAFA Templates wurden ursprünglich zur Beschreibung von Dateien in FTP-Archiven entwickelt und werden von WHOIS++ genutzt. IAFA Template Metadaten werden bei den genannten Diensten im Zusammenhang mit dem WHOIS++- Protokoll für eine gemeinsame Suche in mehreren Datenbanken eingesetzt (s.o.) und außerdem nach DC und Z39.50 konvertiert. Dies ermöglicht eine vielseitige Integration mit anderen Diensten.

In einer Reihe bibliothekarischer Projekte werden Internetressourcen in MARC katalogisiert, einem bibliothekarischen Format, das in Bibliothekskatalogen und Bibliographien eingesetzt wird. Dies ermöglicht es, Internetressourcen in einem OPAC zusammen mit traditionellen Katalogposten zusammenzubringen, also den integrierten Nachweis von gedruckten und digitalen Dokumenten. Eines der Projekte, die MARC zur Beschreibung von Internetressourcen verwenden, ist INTERCAT, eine von OCLC koordinierte Datenbank, an der verschiedene Bibliotheken mitarbeiten. Die in INTERCAT nachgewiesenen Internetdokumente können dann von den Bibliotheken übernommen und in ihre Kataloge integriert werden. Sie werden in den WORLDCAT, einen von OCLC erstellten, sehr umfassenden Verbundkatalog für Dokumente verschiedener Medientypen (neben Büchern auch audiovisuelle Materialien, Musikalien u.a.) integriert.

Zwischen den verschiedenen Metadatenstandards kann durch die Möglichkeiten der Konvertierung Interoperabilität erreicht werden. Für die wichtigsten Metadatenformate existieren inzwischen Konvertierungtabellen, die eine Umwandlung der Formate erleichtern.[116]

5.3.4.2 Information Retrieval

Um die integrierte Suche in verschiedenen Diensten zu ermöglichen, bedarf es eines Standards für Information Retrieval. Gegenwärtig hat hier vor allem der ANSI/ISO-Standard Z39.50 praktische Bedeutung. Dies ist Netzwerkprotokoll für Suche und Retrieval von Datenbankinhalten, welches verbindungs- und sessionorientiert arbeitet und besonders für bibliographische und feldorientierte Datenbanken geeignet ist. Es erlaubt die Suche in entfernten, heterogenen Datenbanken über eine einheitliche Nutzerschnittstelle. Die aktuelle Version ist Z39.50-1995 (Version 3). Zum Organisieren der gemeinsamen Suche in mehreren Z39.50-Datenbanken ist die Kenntnis der jeweiligen Profile, Attribute und Austauschformate nötig, außerdem müssen semantische Angaben zu Feldinhalten bzw. den Inhalten der gesamten Datenbank vorhanden sein. All diese Definitionen gehören jedoch zum Standard, daher sind nur wenige Daten zur Verständigung zwischen den Systemen nötig.

Im bibliothekarischen Bereich gibt es inzwischen relativ viele Implementierungen von Z39.50. Bedeutende Nationalbibliotheken, wie die Library of Congress, die British Library, die National Library of Canada oder Die Deutsche Bibliothek bieten Z39.50-Schnittstellen für ihre Kataloge an, ebenso die Mehrzahl der deutschen Bibliotheksverbundsysteme und zahlreiche andere Bibliothekskataloge. Auch große Anbieter von Online-Datenbanken, wie Knight Ridder, SilverPlatter, DIMDI oder FIZ Karsruhe stellen Z39.50-Schnittstellen für ihre Datenbanken bereit.

Der Zugriff auf diese Datenbanken im WWW erfolgt über WWW - Z39.50 Gateways. Sie bieten ein einheitliches Suchinterface und ähnliche Funktionalitäten für verschiedene Datenbanken. Ein zentraler Gateway ist der der Library of Congress[117], über den neben den eigenen Datenbanken über 70 weitere amerikanische und internationale Datenbanken, zumeist OPACs, erreichbar sind.

Indirekt ermöglicht Z39.50 auch die simultane Suche in mehreren Datenbanken, auch unterschiedlicher Art. Dies ist jedoch nicht in Z39.50 angelegt, sondern setzt wieder spezielle Gateways voraus. Beispiele für experimentelle Realisierungen solcher Gateways zur simultanen Suche sind Europagate[118] und der Gateway der Deutschen Bibliothek[119]. Die Einbeziehung von Suchdiensten für Internetquellen setzt voraus, daß diese über eine Z39.50-Schnittstelle verfügen. Dies ist bisher nur bei wenigen Diensten der Fall, wie EELS und dem Nordic Web Index.


[112] Einen umfassenden Überblick über die im Internet verwendeten Metadaten und ihre Vor- und Nachteile bietet DESIRE 1997c

[113] Der Name resultiert aus dem im März 1995 von OCLC und NCSA veranstalteten Metadata Workshop, auf dem das DC Element Set entwickelt wurde. Vgl. Weibel 1995 sowie o.A.: DC 1997

[114] s. z.B. Dublin Core Metadata Template. 17.11.1997. Online: http://www.lub.lu.se/cgi-bin/nmdc.pl (Stand: 8.12.1997) und Dublin Core Metadaten-Generator des Bibliotheksservice-Zentrums Baden-Württemberg. Version 1, 23.09.1997. Online: http://www.swbv.uni-konstanz.de/wwwroot/metadata/tp_dc00.html (Stand: 9.12.1997)

[115] DC-dot, A Dublin Core Generator. Online: http://www.ukoln.ac.uk/metadata/dcdot/, Java-Version: ftp://ftp.ukoln.ac.uk/metadata/tools/dcdot/java/ (Stand: 9.12.1997)

[116] s. Metadata 1997

[117] Library of Congress WWW/Z39.50 Gateway. Online: http://lcweb.loc.gov/z3950/gateway.html (Stand: 9.12.1997)

[118] Die simultane Suche ist möglich unter: http://europagate.dtv.dk/cgi-bin/egwcgi/egwirtcl/mtargets.egw oder http://gungner.ub2.lu.se/cgi-bin/egwcgi/egwirtcl/mtargets.egw (Unterschiede in den einbezogenen Diensten). Einstiegsseite Europagate: http://europagate.dtv.dk (Stand: 9.12.1997)

[119] Die Deutsche Bibliothek - Z39.50 Gateway. Online: http://z3950gw.dbf.ddb.de/. Simultaner Zugriff auf mehrere Datenbanken über "Globale Suche" innherhalb der entsprechenden Kategorie (DBV-OSI-Verbund, Europäische OPACs, Sonstige OPACs). (Stand: 9.12.1997)


previous next Up Title Contents