Das WebDOC-Projekt ist ein erster Versuch von
PICA, die neuen Realitäten des Internet auf der Basis des World Wide Web für den Dienst am Kunden einzubeziehen. Diese Testphase sagt nur vorläufig
etwas aus über zukünftige Angebote oder Arbeitsweisen, die sehr stark dem technischen Wandel unterliegen werden und den internationalen Datentausch
einbeziehen, wobei wir wieder bei der leidigen Formatfrage sind. Nicht nur MAB und MARC, auch RAK und AACR2 stehen auf dem Prüfstand und werden
um Anpassungen für den Datentausch nicht herumkommen.
Das REUSE-Projekt wird dazu hoffentlich brauchbare Ergebnisse liefern. REUSE ist ein Projekt der SUB Göttingen, des Göttinger Bibliotheksverbundes und
OCLCs zur Untersuchung der Möglichkeiten/ Schwierigkeiten bei der maschinellen Übernahme von amerikanischen Titelaufnahmen ins MAB-Format
unter Berücksichtigung von RAK-WB. Monika Münnich und Dr. Barbara Tillett von der Library of Congress haben dazu auf dem Erlanger Bibliothekartag
vorgetragen4.
Der "Dublin Metadata Core Element Set" von OCLC und dem National Center for Supercomputing Applications (NCSA)5 kann ein weiterer
Schritt auf dem Weg sein, den Datenaustausch in Zukunft zu erleichtern. Hier wird versucht, mit der Festlegung von Elementen zur Beschreibung von
Online Dokumenten - die universell verständlich ist und von den Autoren und Informationsanbietern selbst erledigt werden kann -, ihre Auffindbarkeit im
Internet zu erleichtern.
Doch heute geht es hier um unsere aktuellen Erfahrungen mit der Katalogisierung von Internet-Dokumenten.
RAK-NBM - die RAK-Mitteilung Nr. 16 ist auf dem DBI-Server inzwischen zugänglich und von der EG-RAK authorisiert - hat dafür inzwischen
eine Grundlage6 geschaffen, die wir alle auf ihre Brauchbarkeit und Umsetzung in die Praxis prüfen werden. Bisher hat ja kaum eine Bibliothek Erfahrung mit
dem Umgang von elektronischen Dokumenten im Fernzugriff. Zwar haben viele Bibliotheken auf ihrer Homepage Links zu elektronischen Dokumenten
angelegt, doch sind diese Dokumente nicht im "normalen" Katalog (OPAC etc.) erfaßt und suchbar.
Ein Problem sind die URLs (Uniform Resource Locator) der Dokumente. Die URLs sind die Adressen, also quasi die Standortsignaturen der Dokumente.
Es kommt öfters vor, daß eine solche Adresse sich ändert. Wenn eine Bibliothek auf ihrer Homepage einen Link auf diese Adresse gesetzt hat, erfährt
sie nicht ohne weiteres, daß die URL sich geändert hat. Wer kann schon regelmäßig diese Adressen prüfen? OCLC hat für sein Intercat-Projekt
einen Versuch mit PURLs (Permanent Uniform Resource Locator) gestartet, doch inwieweit sich das bewährt, muß abgewartet werden.
Für alle, die sich auch für das OCLC-Projekt "Aufbau eines Katalogs von Internet Ressourcen - Intercat" (Building a catalog of internet ressources -
Intercat) interessieren, verweise ich auf die Homepage : http://www. oclc.org /oclc/man/catproj/catcall.htm. Dort erfahren Sie mehr dazu.
Ich beschränke mich hier auf unser WebDOC-Projekt, d.h. auf die Katalogisierung von elektronischen Dokumenten für den WebCAT.
PICA startete im vergangenen Jahr mit WebDOC ein internationales Projekt zur Katalogisierung und Bereitstellung von elektronischen Dokumenten
auf der Basis von Katalogisaten aus dem niederländischen PICA-Verbund und dem Göttinger PICA-Verbund für das World Wide Web. Diese Integration
von Verbundsystem und World Wide Web über eine Software-Brücke ist bisher einmalig.
An dem Projekt sind z.Zt. 8 Bibliotheken in den Niederlanden beteiligt: die Königliche Bibliothek Den Haag sowie die Universitätsbibliotheken Amsterdam,
Groningen, Limburg, Nijmegen, Rotterdam,Twente, Utrecht.
Die deutschen Partnerbibliotheken sind die SUB Götttingen, UB/TIB Hannover, BIS Oldenburg, SUB Hamburg gemeinsam mit dem Regionalen
Rechenzentrum der Universität Hamburg, und die Gesamthochschulbibliothek Kassel .
Als erster Verlag arbeitet Kluwer an dem Projekt mit und bietet die Artikel seiner Zeitschriften an. Mit weiteren Verlagen laufen Verhandlungen.
PICA hat außerdem eine Vereinbarung mit der Research Libraries Group in USA abgeschlossen, den WebDOC-Service gemeinsam anzubieten.
Die WebCAT-Server sollen die Nachweise in USA und den Niederlanden jeweils spiegeln (d. h. soviel wie Kopieren) und somit noch besser und
schneller verfügbar machen.
Mit dem WebDOC-Projekt bietet PICA einen "Katalog" elektronischer Dokumente an, die es dem Benutzer erlauben werden, diese Dokumente
direkt von den entsprechenden lokalen Bibliotheksservern abzurufen. Das Projekt wird bis 1997 laufen.
Alle elektronischen Dokumente, die eine Bibliothek beschafft, werden im PICA-Verbundkatalog katalogisiert. Die Dokumente werden auf dem lokalen Dokumentserver der Bibliothek gespeichert. Der Zugriff auf den zentralen Katalog der elektronischen Dokumente (WebCAT) erfolgt über WWW-Browser wie Netscape oder Mosaic. Der Zugriff auf die Dokumente selbst kann je nach den Lizenzmodalitäten, die vereinbart werden, gesteuert werden.
Ein Teil der Dokumente wird kostenpflichtig sein (z.B. die Volltext-Artikel des Kluwer-Verlags oder die Angebote der UB/TIB Hannover), andere
Dokumente werden frei zur Verfügung gestellt. Ein Account- und Lizenz-Server registriert die kostenfreie oder kostenpflichtige Verfügbarkeit der
Dokumente ebenso wie den Zugang des Endnutzers und seines Kontostands. Jeder Benutzer erhält einen Pincode (ähnlich wie bei der Kreditkarte)
und kann nach Wahl Dokument-Kopien auf Vorrat kaufen (d.h. man zahlt auf sein "Benutzer-"Konto" ein).
Auf jeden Fall ist die Suche und der Zugang zum Abstract des Dokumentes kostenfrei. Erst der direkte Zugang zu einem Dokument wird je nach
Vereinbarung ggf. zu Kosten führen. Die Kosten für den Zugang zum Volltext werden von den einzelnen Projekt-Partnern selbst bestimmt.
Ein entscheidender Vorteil gegenüber den derzeitigen Suchmöglichkeiten im WWW besteht in der Katalogisierung der elektronischen Dokumente,
die den direkten Zugriff über eine sachliche Erschließung (Basisklassifikation) auf inhaltlich zusammengehörende Dokumente ermöglichen, oder die
Recherche nach allen Artikeln einer bestimmten elektronischen Zeitschrift. Auch die Auswahl und somit die Bewertung der Dokumente ist ein Qualitätsfaktor.
WebDOC Deutschland
Die deutschen Projektpartner haben z.T. definierte Pläne für die Einbringung von elektronischen Dokumenten:
Das BIS Oldenburg wird seine Verlagsproduktion bearbeiten und auf den Server laden, die UB/TIB Hannover will die deutschen Forschungsberichte
umsetzen und auf dem Server (gegen Entgelt) verfügbar machen, die SUB Göttingen wird Literatur zu den Sondersammelgebieten Buch und
Bibliothekswesen sowie Reine Mathematik anbieten, die (teilweise) nur noch im Internet verfügbar ist. Neu ist eine Vereinbarung mit der Universität,
auch Publikationen der Institute (d.h. auch Dissertationen) in das WebDOC-Projekt einzubeziehen.
Hamburg will noch im Sommer aktiv werden, Kassel wird folgen.
SUB Göttingen
In der SUB Göttingen wurde für das WebDOC-Projekt eine Arbeitsgruppe geschaffen, in der der WebDOC-Projektleiter (Dr. Wilfried Enderle), einige
Fachreferenten, der Leiter der Erwerbung, Mitarbeiter aus der Dienststelle Mikroformen und Neue Medien, der Zeitschriftenstelle, der Tausch- und
Dissertationsstelle und der Titelaufnahme zusammenarbeiten.
Eine Harmonisierung der Arbeitsplatzausstattung auf Hardware- und Software-Ebene mußte erfolgen, um die PCs "webfähig" zu machen.
Die Schulung der Mitarbeiter für das Internet war zwar generell bereits durch die Gesellschaft für wissenschaftliche Datenverarbeitung geschehen,
umfaßte aber nicht die Integration aller möglichen "Werkzeuge" oder "Tools". Das erfolgte mehr oder weniger durch "Learning by doing", was auch
Frust-Situationen schaffte. Wir standen manchmal vor einem Problem und wußten nicht, wie es zu lösen war, wenn der Ansprechpartner fehlte.
Geschäftsgang
Der Geschäftsgang für diese Dokumente ist natürlich noch im Teststadium.
Die Auswahl der Dokumente geschieht durch die Fachreferenten. Sie prüfent das Internet-Angebot und legen die Prioritäten für den Zugang bzw.
die Bereitstellung fest, d.h.
Bei der Beschaffung dieser Dokumente spielen folgende Faktoren eine Rolle:
Die entsprechende Software zum Lesen dieser Formate ist für die Projektpartner vom FTP-Server von PICA in Leiden abrufbar.
Wie schon erwähnt, bereitet die Beschaffung der Dokumente aus USA erhebliche Schwierigkeiten, wenn es sich um WWW-Dokumente
handelt, da die Zugänge tagsüber überlaufen sind. Hier kann man nur morgens früh gut arbeiten.
Auf manchen Servern liegen die Dokumente nur vorübergehend und werden dann abgeräumt oder verschoben. Das kann zu unliebsamen
Überraschungen führen, wenn man nicht sofort zugreifen kann.
Die Werkzeuge für das Entpacken und Lesen der Dokumente müssen installiert sein, damit die Dokumente weiter bearbeitet werden können.
Die ersten Tests laufen in der Dienststelle Mikroformen und Neue Medien, d.h. hier wurden anhand von Adressen und Nachrichten des
Erwerbungsleiters Dokumente vor allem per E-Mail, aber auch via FTP beschafft. Über das World Wide Web haben wir bisher nur sehr wenig
für WebDOC heruntergeladen.
Abonnements oder Ähnliches gibt es im Internet noch selten, jedenfalls läuft das bei den kostenlosen Angeboten nicht wie gewohnt. Bei einigen
Zeitschriften wird man nach ca. 4-6 Monaten aufgefordert, die Subskription zu bestätigen bzw. erneut auszuführen, doch das ist nicht die Regel.
Der Aufwand für die Beschaffung dieser Dokumente ist für die Bibliothek sehr groß und zeitaufwendig.
Die Archivierung der Dokumente ist eine schwierige Frage und für unsere Bibliothek auch noch nicht gelöst:
Katalogisierung
Die niederländischen Partner und die deutschen Partner katalogisieren jeweils in ihrem eigenen Zentralsystem nach ihrem jeweiligen Regelwerk.
Die Daten werden anschließend (aus Deutschland offline) in den WebCAT überführt .
Für die Katalogisierung von Online Resources, wie es bei PICA heißt, wurden spezielle Richtlinien erstellt. Die für beide Länder verbindliche Fassung
ist die englische Version der "Guidelines for the cataloguing of electronic documents" vom August 1995. Ich habe daraus eine deutsche Version
erstellt "Richtlinien für die Katalogisierung von elektronischen Dokumenten" (1. Vorläufige Fassung Januar 1996). Im März 1996 erschien eine neue
niederländische Version der Richtlinie, deren Änderungen (vor allem die Verkürzung der Zugangsadresse auf die URL) inzwischen in das Update der
deutschen Richtlinie vom Mai 1996 aufgenommen wurden.
Anhand dieser Richtlinien haben wir unsere ersten Versuche der Katalogisierung unternommen, zusammen mit den Kolleginnen aus Hannover und Oldenburg.
Das Rechenzentrum Hamburg und auch die GH Kassel waren zu diesem Zeitpunkt noch mit der Klärung der technischen Fragen (Server, Personal usw.)
beschäftigt.
Ein Einführungs-Workshop in das WebDOC-Projekt und die WebCAT-Katalogisierung fand im Februar 1996 in Hannover unter Leitung von
Francien van Bohemen statt, die seit Dezember 1995 Projektleiterin ist. Viele Fragen konnten geklärt werden, aber viele werden sich noch in der
Zukunft stellen. Bei der Kgl. Bibliothek in Den Haag - sie hat das Konzept für WebDOC mit entwickelt - wurde ein "Helpdesk" für Katalogisierungsfragen
eingerichtet, der schon oft befragt wurde.
Für WebDOC ist die Katalogisierungssprache englisch, d.h. auch die Abstracts, die möglichst jedem Dokument beigegeben werden, sollten auf englisch
vorliegen. Ist das nicht möglich, kann man auch auf deutsche zurückgreifen. Jedes Dokument sollte über ein Abstract verfügen, das dem Benutzer
Auskunft darüber gibt, ob das Dokument für ihn relevant ist oder ob er darauf verzichten kann. Zumindest englische Stichworte sollten vorhanden sein.
Die PICA-Philosophie bedingt immer die (Bestell-)Katalogisierung im Zentralsystem. Daran werden auf lokaler Ebene die Daten für die Erwerbung und
Aufstellung usw. angehängt. Das geschieht auch für WebDOC-Dokumente.
Wenn die Dokumente vorliegen, werden sie auf dem Server der SUB zwischengespeichert. Für die Titelaufnahme wird ein Ausdruck mit den relevanten
Daten erstellt. Nach der Inventarisierung werden die Dokumente auf eine Export-Datei verschoben. Studentische Hilfskräfte setzen die Dokumente für
den WWW-Server der Gesellschaft für wissenschaftliche Datenverarbeitung Göttingen (GWDG, wird von der Universität und den Max-Planck-Instituten
gemeinsam betrieben) um, auf den sie anschließend geladen werden. Die Katalogisate werden vorerst ca. wöchentlich offline an den WebCAT-Server in
Leiden geschíckt.
Bei der Katalogisierung im GBV -Zentralsystem legen wir die RAK-NBM zugrunde. Diese Titel werden bisher nicht im Lokalsystem angezeigt. Sie werden offline für den zentralen WebCAT selektiert, der für die WebDOC-Partnerbibliotheken zugänglich ist. Es gibt daher für diese Dokumente noch keine ISBD-Anzeige für den OPAC. Folglich sind auch einige Festlegungen aus RAK-NBM hier nicht nachzuvollziehen, da der WebCAT anderen Bedingungen unterliegt.
RAK-NBM für Online-Dokumente zielt vor allem auf folgende Punkte:
RAK-NBM § 115: Informationsquellen
Bei Computerdateien im Fernzugriff werden herangezogen:
- der Eröffnungsbildschirm, sowie
- andere interne, zur Vorlage gehörende Informationsquellen.
Bei elektronischen Dokumenten im Internet erhält man als erstes den sogenannten "Eröffnungsbildschirm", der teilweise durchaus wie das Titelblatt einer
Papierausgabe gestaltet wird, aber nicht immer. Deshalb muß man häufig auch auf die anderen internen Quellen zurückgreifen.
RAK-NBM § 131a : Allgemeine Materialbenennung
Dafür hat PICA in der Kategorie 0500 (Bibliographische Gattung und Status) den Code "O" für Online Resources eingeführt.
RAK-NBM § 161a : Systemvorraussetzungen
Die Systemvoraussetzungen sind für alle Verbünde neu. PICA hat dafür eine eigene Fußnote (4251) eingerichtet, die allerdings für WebCAT
nicht ausgewertet wird, da alle Projektpartner die entsprechenden Systemvoraussetzungen für den Zugang zu den Dokumenten implementiert haben.
Die Angabe zum Zugang (Internet oder WWW) wird bei diesem Projekt ebenfalls automatisch vorausgesetzt. Für die spätere ISBD-Darstellung im
OPAC werden diese Hinweise am besten vom System generiert.
RAK-NBM §§ 697-699: Haupt- und Nebeneintragungen
Nach den NBM-Regeln erhalten Online-Dokumente die Haupteintragung unter dem Sachtitel (ausgenommen sind davon fortlaufende Sammelwerke),
d.h. Verfasser werden zu beteiligten Personen. Für die Recherche im WebCAT spielt das keine Rolle, da alle Personen suchbar sind.
Mehrbändige Werke
Bei mehrbändigen Werken kollidieren die deutschen RAK-Regeln mit den US-MARC-Anwendungen der amerikanischen Bibliotheken, denn US-MARC
kennt unsere hierarchische Struktur bisher nicht. Hier besteht Regelungsbedarf, nicht nur im Rahmen des WebDOC-Projektes (ab Herbst 1996 werden
die RLG-Bibliotheken in den USA mitarbeiten!), sondern generell für den zukünftigen internationalen Datentausch. Das REUSE-Projekt wird dazu ca
Ende 1996 Ergebnisse bringen, doch werden wir für WebDOC kaum auf die Umsetzung dieser Ergebnisse warten können.
Das bedeutet: im Rahmen dieses Projektes werden mehrbändige Werke mit Stücktiteln unter den Stücktiteln katalogisiert werden müssen...!
Bisher haben wir solche Publikationen zurückgestellt, doch das ist keine Dauerlösung. Wir hoffen, daß spätestens zum Ende des Projektes 1997
die entsprechenden Gremien zu praktikablen Entscheidungen gekommen sind.
In Göttingen katalogisierten wir bisher kostenlose Dokumente aus dem Internet: Monographien, Zeitschriften und Zeitschriftenartikel. Zu jedem Typ folgt ein Beispiel.
Monographien
An Monographien haben wir erst wenige Titel erfaßt, da wir ja die Masse der Preprints mit den
herkömmlichen Möglichkeiten nicht bewältigen können.
Beispiel Monographie
Zeitschriften
Wir haben in den letzten Wochen auch einige Zeitschriften katalogisiert, und zwar handelt es sich um
Beispiel Zeitschrift
Beispiel Zeitschriftenartikel
Preprints
Die unendliche Masse der Preprints, die hier natürlich vor allem im Bereich der Reinen Mathematik vorliegen, können nicht in herkömmlicher Form
katalogisiert werden, dafür fehlen die personellen Ressourcen. Hierfür werden andere Wege gesucht werden müssen.
WebCAT7
Mit WebCAT haben wir einen internationalen "Katalog" oder besser einen Titeldatennachweis, der nicht auf RAK-Regeln aufgebaut ist.
Die niederländischen Bibliotheken katalogisieren nach ihren Regeln, die Research Libraries Group-Bibliotheken nach AACR2, wir nach RAK-NBM.
Der WebCAT bietet folgende Suchschlüssel:
Göttinger Beispiele im WebCAT:
Monographie
Anlage 1: From Webspace to cyberspace
Zeitschrift
Anlage 2: Newsletter on serials pricing issues
Zeitschriftenartikel
Anlage 3: Videokonferenzen in Bibliotheken
Ausblick
Zusammenfassend möchte ich Probleme, Wünsche und Folgerungen nennen, die sich aus unserer bisherigen Arbeit im Projekt ergeben haben.
Als ein großes Problem bei der Einbeziehung von Internet-Dokumenten in den Bestand der Bibliothek erweist sich der Zeitaufwand, besonders
bei der Auswahl und Beschaffung, aber auch bei der Katalogisierung. Manche Abstracts sind sehr lang (Schreibfehler!), wenn sie fehlen, müssen sie
erstellt werden oder zumindest Stichwörter zum Inhalt (in Englisch) angegeben werden. Ein weiteres großes Problem ist die Frage der Sicherung bzw.
dauerhafte Archivierung der Dokumente.
Natürlich kamen auch sofort Wünsche auf, um die Arbeit zu erleichtern. Einige davon lassen sich möglicherweise schon bald erfüllen oder
sind bis Ende des Projektes realisiert:
Qualitätssicherung , d.h. Auswahl, Ordnung, Angebot, sind immer noch die klassischen Aufgaben der Bibliothek. Von diesen Qualitätsmerkmalen wird sich keine Bibliothek trennen, also wird sie versuchen, sie auch für ihr Angebot aus dem Internet umzusetzen. Das WebDOC-Projekt wird uns dafür eine große Hilfe sein.
Monika Cremer, SUB Göttingen