slanted W3C logo

Normalisierung von Lizenzinformationen in OAI-Metadaten: Ein Beitrag zur Verbesserung der Open-Access-Statusanzeige in wissenschaftlichen Suchmaschinen

Cloud Screenshot

Christoph Broschinski, <broschinski@uni-bielefeld.de>




Einführung

BASE Logo

BASE: Bielefeld Academic Search Engine (https://base-search.net), seit 2004 entwickelt und betrieben von der Universitätsbibliothek Bielefeld

Quellen

Open Access in BASE - bisheriger Stand

Pie Chart OA old
oa legend greenOpen Access (26.219.640 Dokumente)
oa legend greyUnbekannt (62.607.610 Dokumente)

Problem: "Echter" Open Access-Anteil liegt deutlich höher (60-70%, bekannt aus regelmäßigen Stichproben)

Grund: Bisherige Auswertung von OA-Status ausschließlich auf Quellen-Ebene ("reine" OA-Quellen/OAI-Sets)

Neuer Ansatz: Individuelle Normalisierung

Seit Mitte 2015: Lizenzinformationen werden auf der Artikelebene für jedes Dokument einzeln klassifiziert

Beispiel für dc:rights-Inhalte aus BASE:

Neuer Ansatz: Individuelle Normalisierung (2)

Ziel: Normalisierung (Abbildung auf ein festes Vokabular) der Inhalte des DC-Elements "dc:rights". Vorgehensweise:

Frage: Auf welche Zielkategorien soll normalisiert werden?

Individuelle Normalisierung: Beispiele

dc:rights Normalisierung
möglich?
Nachnutzung/Lizenz Open Access
"info:eu-repo/semantics/openAccess" Ja Ja
"Open Access" Ja Ja
"The Public Domain Mark (PDM)" Ja PDM Ja
"local access" Ja Nein
"Es gilt das UrhG" Nein Unbekannt
"Alle Rechte vorbehalten" Nein Unbekannt
"Volltextzugriff: nur innerhalb des Universitäts-Campus" Ja Nein
"CC-BY-NC-ND 4.0" Ja https://creativecommons.org/licenses/by-nc-nd/4.0 Ja
"Aquest document està subjecte a una llicència Creative Commons: Reconeixement – No comercial – Compartir igual" Ja https://creativecommons.org/licenses/by-nc-sa Ja

Ergebnisse: Gesamtbestand

Änderungen im Suchmaschinen-Index von BASE durch Rechtenormalisierung (Gesamtdaten, 88.827.250 Dokumente aus 4052 Quellen)


Ohne dc:rights-Normalisierung
Pie Chart all before
Mit dc:rights-Normalisierung
Pie Chart all after

Ergebnisse: Deutschland

Änderungen im Suchmaschinen-Index von BASE durch Rechtenormalisierung (Land: Deutschland, 11.287.385 Dokumente aus 304 Quellen)


Ohne dc:rights-Normalisierung
Pie Chart de before
Mit dc:rights-Normalisierung
Pie Chart de after

Ergebnisse: Schweiz

Änderungen im Suchmaschinen-Index von BASE durch Rechtenormalisierung (Land: Schweiz, 1.666.187 Dokumente aus 27 Quellen)


Ohne dc:rights-Normalisierung
Pie Chart ch before
Mit dc:rights-Normalisierung
Pie Chart ch after

Ergebnisse: Österreich

Änderungen im Suchmaschinen-Index von BASE durch Rechtenormalisierung (Land: Österreich, 158.246 Dokumente aus 21 Quellen)


Ohne dc:rights-Normalisierung
Pie Chart at before
Mit dc:rights-Normalisierung
Pie Chart at after

Ergebnisse: Dänemark

Änderungen im Suchmaschinen-Index von BASE durch Rechtenormalisierung (Land: Dänemark, 705.973 Dokumente aus 15 Quellen)


Ohne dc:rights-Normalisierung
Pie Chart dk before
Mit dc:rights-Normalisierung
Pie Chart dk after

Zusammenfassung und Empfehlungen

Normalisierung von dc:rights-Feldinhalten in BASE seit Mitte 2015, dadurch:


Pie Chart gross

Empfehlungen an Repository-Verwalter:

  1. Das Feld dc:rights sollte unbedingt ausgefüllt werden.
  2. Die Inhalte sollten mindestens standardisiert und bevorzugt maschinenlesbar sein (info-repo-Vokabular, Lizenz-URIs).
    Hinweis: dc:rights darf auch mehrfach vorkommen, um beispielsweise einen natürlichsprachlichen und einen maschinenlesbaren Rechtevermerk anzubringen.
  3. Auch Hinweise wie Closed Access oder Restricted Access sind hilfreich und sollten vermerkt werden - "Negative" Information ist immer noch sehr viel besser als gar keine Information.

Letztes Diagramm...

bar chart european countries

Danke für ihre Aufmerksamkeit!