slanted W3C logo

Datenqualität im OpenAPC-Kerndatensatz

Christoph Broschinski





Danksagung

Jetziger Stand des OpenAPC-Datensatzes:

Vielen Dank an alle, die zu diesem Ergebnis beigetragen haben!

Anreicherung

Eine wichtige Komponente zur Sicherstellung der Datenqualität in OpenAPC ist die automatische Anreicherung von Metadaten aus externen Quellen:

institutionperiodeurodoiis_hybridpublisherjournal_full_titleissnissn_pissn_eissn_llicense_refin_crossrefpmidpmciduturldoaj
Bamberg2013137210.2147...FALSEDove Medical...Journal of...1178-7090NA1178-70901178-7090http://creative...TRUE2378...PMC3...ut:00020...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2376...PMC3...ut:00033...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2384...PMC3...ut:00033...NATRUE

Anreicherung

Eine wichtige Komponente zur Sicherstellung der Datenqualität in OpenAPC ist die automatische Anreicherung von Metadaten aus externen Quellen:

institutionperiodeurodoiis_hybridpublisherjournal_full_titleissnissn_pissn_eissn_llicense_refin_crossrefpmidpmciduturldoaj
Bamberg2013137210.2147...FALSEDove Medical...Journal of...1178-7090NA1178-70901178-7090http://creative...TRUE2378...PMC3...ut:00020...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2376...PMC3...ut:00033...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2384...PMC3...ut:00033...NATRUE

Crossref

Anreicherung

Eine wichtige Komponente zur Sicherstellung der Datenqualität in OpenAPC ist die automatische Anreicherung von Metadaten aus externen Quellen:

institutionperiodeurodoiis_hybridpublisherjournal_full_titleissnissn_pissn_eissn_llicense_refin_crossrefpmidpmciduturldoaj
Bamberg2013137210.2147...FALSEDove Medical...Journal of...1178-7090NA1178-70901178-7090http://creative...TRUE2378...PMC3...ut:00020...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2376...PMC3...ut:00033...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2384...PMC3...ut:00033...NATRUE

Crossref

Europe Pubmed Central

Anreicherung

Eine wichtige Komponente zur Sicherstellung der Datenqualität in OpenAPC ist die automatische Anreicherung von Metadaten aus externen Quellen:

institutionperiodeurodoiis_hybridpublisherjournal_full_titleissnissn_pissn_eissn_llicense_refin_crossrefpmidpmciduturldoaj
Bamberg2013137210.2147...FALSEDove Medical...Journal of...1178-7090NA1178-70901178-7090http://creative...TRUE2378...PMC3...ut:00020...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2376...PMC3...ut:00033...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2384...PMC3...ut:00033...NATRUE

Crossref

Europe Pubmed Central

ISSN Organisation

Anreicherung

Eine wichtige Komponente zur Sicherstellung der Datenqualität in OpenAPC ist die automatische Anreicherung von Metadaten aus externen Quellen:

institutionperiodeurodoiis_hybridpublisherjournal_full_titleissnissn_pissn_eissn_llicense_refin_crossrefpmidpmciduturldoaj
Bamberg2013137210.2147...FALSEDove Medical...Journal of...1178-7090NA1178-70901178-7090http://creative...TRUE2378...PMC3...ut:00020...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2376...PMC3...ut:00033...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2384...PMC3...ut:00033...NATRUE

Crossref

Europe Pubmed Central

ISSN Organisation

Web of Science

Anreicherung

Eine wichtige Komponente zur Sicherstellung der Datenqualität in OpenAPC ist die automatische Anreicherung von Metadaten aus externen Quellen:

institutionperiodeurodoiis_hybridpublisherjournal_full_titleissnissn_pissn_eissn_llicense_refin_crossrefpmidpmciduturldoaj
Bamberg2013137210.2147...FALSEDove Medical...Journal of...1178-7090NA1178-70901178-7090http://creative...TRUE2378...PMC3...ut:00020...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2376...PMC3...ut:00033...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2384...PMC3...ut:00033...NATRUE

Crossref

Europe Pubmed Central

ISSN Organisation

Web of Science

DOAJ

Vorteile:

Anreicherung

Eine wichtige Komponente zur Sicherstellung der Datenqualität in OpenAPC ist die automatische Anreicherung von Metadaten aus externen Quellen:

institutionperiodeurodoiis_hybridpublisherjournal_full_titleissnissn_pissn_eissn_llicense_refin_crossrefpmidpmciduturldoaj
Bamberg2013137210.2147...FALSEDove Medical...Journal of...1178-7090NA1178-70901178-7090http://creative...TRUE2378...PMC3...ut:00020...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2376...PMC3...ut:00033...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2384...PMC3...ut:00033...NATRUE

Crossref

Europe Pubmed Central

ISSN Organisation

Web of Science

DOAJ

Vorteile:

Fragen:

Persistenz der Anreicherung

Persistenz der Anreicherung

institutionperiodeurodoiis_hybridpublisherjournal_full_titleissnissn_pissn_eissn_llicense_refin_crossrefpmidpmciduturldoaj
Bamberg2013137210.2147...FALSEDove Medical...Journal of...1178-7090NA1178-70901178-7090http://creative...TRUE2378...PMC3...ut:00020...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2376...PMC3...ut:00033...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2384...PMC3...ut:00033...NATRUE

Nach der Erstanreicherung unveränderlich

Auch nach der Erstanreicherung regelmäßig aktualisiert

Persistenz der Anreicherung

institutionperiodeurodoiis_hybridpublisherjournal_full_titleissnissn_pissn_eissn_llicense_refin_crossrefpmidpmciduturldoaj
Bamberg2013137210.2147...FALSEDove Medical...Journal of...1178-7090NA1178-70901178-7090http://creative...TRUE2378...PMC3...ut:00020...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2376...PMC3...ut:00033...NATRUE
Bamberg201396010.3389...FALSEFrontiers...Frontiers in...1664-1078NA1664-10781664-1078NATRUE2384...PMC3...ut:00033...NATRUE

Nach der Erstanreicherung unveränderlich

Auch nach der Erstanreicherung regelmäßig aktualisiert

Fragen:

Automatische Tests

Durch ein Test-Framework werden Fehler und Inkonsistenzen im OpenAPC-Datensatz ausfindig gemacht. Dazu durchläuft jeder Eintrag eine Reihe von Prüfungen:

Syntax:

Semantik/Inhalt:

Build Status

Problem: Kostendefinition

Aktuelle Definition der im Feld euro gemeldeten Beträge:

Problem: Kostendefinition

Aktuelle Definition der im Feld euro gemeldeten Beträge:

Frage:

Qualitätssicherung bei Kosten?

Mögliche Ansätze zur automatisierten Kostenprüfung:

Mögliche Implementierung einer Kostenprüfung:

Qualitätssicherung bei Kosten?

Mögliche Ansätze zur automatisierten Kostenprüfung:

Mögliche Implementierung einer Kostenprüfung:

Fragen:

Verschiedenes

1. Bei Analysen von OpenAPC-Daten muss berücksichtigt werden, dass der Bezugspunkt für Kosten immer die Entität "Journal" sein muss.

2. Möglichkeit, Datenmeldungen mit README-Dateien zu erweitern, könnte noch mehr genutzt werden.

3. Thema "Global South": APC-Daten stammen bislang ausschließlich aus Europa, USA und Kanada.