slanted W3C logo

HarCon: eine integrierte Monitoringumgebung für OAI-PMH-Quellen

Cloud Screenshot



Christoph Broschinski, <broschinski@uni-bielefeld.de>

Einführung

BASE bezieht seine Metadaten aus diversen externen Quellen, beispielsweise Publikationsserver an Hochschulen und Instituten, Online-Journals, Aggregationsdienste.

Protokoll zum Zugriff auf Quellen: OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)

Wichtigste Funktion: Abruf von Metadaten aller Dokumente, die die Quelle vorrätig hält (Records)

BASE: Jede Quelle wird einmal pro Woche geharvestet.

Quellen-Management

Anspruch von BASE: Alle Quellen werden intellektuell ausgewählt und geprüft.

=> Werkzeuge zur Unterstützung erforderlich!

BASE-Admin-DB (Seit 2007)

Harvest Watcher (oai_stat) >>>

Problem: Harvest Watcher ist technologisch mittlerweile veraltet.

=> Implementierung eines Nachfolgesystems.

HarCon

HarCon (Harvest Console) >>>

Datenaustausch mit OpenAire

Naheliegende Idee: Austausch von Informationen, um Quellen-Metadaten zu verbessern.

Probleme

Problem 1: Unterschiedliche Metamodelle in Bezug auf Quellen

=> Erfordert teilweise komplizierte SQL-Arithmetik!

Problem 2: Matching

Wie können die gleichen Quellen in BASE und OpenAire eindeutig einander zugeordnet werden?

Beispiel: InterDisciplines. Journal of History and Sociology

Plattform Quellenname Basic URL Website Ansprechpartner
InterDisciplines. Journal of History and Sociology http://www.inter-disciplines.de/index.php/index/oai http://www.inter-disciplines.de/ interdisciplines@uni-bielefeld.de
InterDisciplines. Journal of History and Sociology http://www.inter-disciplines.de/bghs/index.php/index/oai http://www.inter-disciplines.de/bghs/index.php/indi/index interdisciplines@uni-bielefeld.de

Beispiel: Digitale Sammlungen

Plattform Quellenname Basic URL Website Ansprechpartner
OAI Frontend http://ds.ub.uni-bielefeld.de/viewer/oai http://ds.ub.uni-bielefeld.de/ support@intranda.com
Digitale Sammlungen der Universitätsbibliothek Bielefeld http://ds.ub.uni-bielefeld.de/viewer/oai http://ds.ub.uni-bielefeld.de/viewer/ artur.nold@uni-bielefeld.de

Folgerungen

Ergebnis: Matching über bestehende Metadaten funktioniert nicht.

Lösung: Es muss ein persistenter Identifier für Quellen verwendet werden, der eine langfristige und eindeutige Zuordnung ermöglicht.

In OpenAire bereits vorhanden: Jede Quelle hat ein Feld 'ID'

In BASE: Bis vor Kurzem keine Verwendung von externen Identifiern.

=> Implementierung eines Matching-Systems in HarCon >>>

Als Ergebnis des Matchings bleiben OpenAire-Quellen übrig, die nicht mit einem Gegenstück in BASE verknüpft werden konnten.

=> Anreicherung mit zusätzlichen Metadaten und Generierung einer "Vorschlagsliste" zur Übernahme der entsprechenden Quellen in BASE. >>>

Zusammenfassung

  • Heute:
  • Nächste Woche:



    Danke für ihre Aufmerksamkeit!