Momentan liegen die OpenAPC-Daten ausschließlich in Form des Kerndatensatzes vor.
Vorteile des Kerndatensatzes (CSV-Datei):
Nachteile:
Beispiele für mögliche Auswertungsszenarien:
Problem: Jede dieser Fragen ist ohne eine Weiterverarbeitung und Analyse der CSV-Datei mit Zusatzsoftware (z.B. Excel) kaum zu beantworten!
Die hypothetischen Auswertungsszenarien sind sehr ähnlich zu Fragestellungen, die in der Wirtschaft bei der Analyse von Geschäftsdaten auftreten (Business Intelligence/Reporting)
Etablierter Lösungsansatz aus der Wirtschaftsinformatik: OLAP (Online Analytical Processing)
Die OLAP-Theorie im Ultraschnelldurchlauf...
...und die Praxis im Fall von OpenAPC:
OLAP-Eigenschaft | Anzahl | OpenAPC-Element |
---|---|---|
Würfel | 1 | OpenAPC-Kerndatensatz |
Dimensionen | 5 | institution, period, publisher, journal_full_title, doi |
Zellen | 6638 | Einzelner Artikel |
Aggregatorfunktionen | 3 | APC-Summe, APC-Durchschnitt, Artikelanzahl |
Für OpenAPC wurde ein OLAP-Dienst als Webserver aufgesetzt und mit dem beschriebenen Würfel-Modell ausgestattet.
Mithilfe des OLAP-Servers können die eingangs beschriebenen Fragestellungen leicht beantwortet werden:
Der OLAP-Server bietet einen sehr schnellen und funktionalen, analytischen Zugang zu den OpenAPC-Daten.
Problem: Auch OLAP ist nicht intuitiv von Laien bedienbar und auch wenig geeignet, um sich einen schnellen Überblick zu verschaffen.
Lösung: OLAP als Backend für eine webbasierte Visualisierung der OpenAPC-Daten.
Vorteile:
Übersicht:
Zugriffsmodalität | Datenverfügbarkeit | Tools benötigt? | Übersichtlichkeit | Zeitaufwand für Antworten | Zielgruppe |
---|---|---|---|---|---|
CSV-Datei | Vollständig | Ja | Sehr gering | Sehr hoch | Experten |
OLAP-Server | Reduziert | Nein (aber möglich) | Gering | Niedrig | Experten |
Treemap-Visualisierung | Reduziert | Nein | Gut | Mittel | Allgemeinheit |