Ermittlung von OpenAccessKennzahlen Ein Bericht aus der Praxis
Ermittlung von Open-Access-Kennzahlen – Ein Bericht aus der Praxis Eva Bunge | Open-Access-Tage 2017 | 13. 09. 17 [1] 1
1 - Kontext 2 Vorgehen 3 - Daten 4 - Fazit Bildquellen: [2], [4], [5], [6] Open-Access-Tage 2017 | Eva Bunge 2
1 - Kontext 1. 1 – Problemstellung Ermittlung von OA-Kennzahlen für Beantragung eines Publikationsfonds [TU Berlin] → Keine verwertbare Universitätsbibliografie Ermittlung von OA-Kennzahlen für das Land Berlin [OA-Strategie des Senats] → Institionenübergreifende Analyse, keine gemeinsame Bibliografie oder Datenformate [2] Open-Access-Tage 2017 | Eva Bunge 3
1 - Kontext 1. 2 – Input Neun Berliner Universitäten und Hochschulen 16 Datenbanken mit Affiliationssuche 34. 143 Artikeldaten ~ 210 MB [2016] [3] Open-Access-Tage 2017 | Eva Bunge 4
1 - Kontext 1. 3 – Output Finde Artikel: gesamt / gold /hybrid / grün / Korrespondenzautorschaft an Berliner Institution Verteilung der OA-Artikel auf Verlage Grobe Abschätzung der APCs Ausführliche Tabelle, in der die Artikel mit allen zusätzlichen Informationen aufgelistet sind * Alle hier präsentierten Zahlen sind noch vorläufig / unbereinigt und dienen reinen Illustrationszwecken. Sie sind in keiner Weise endgültig. Open-Access-Tage 2017 | Eva Bunge 5
2 - Vorgehen 2. 1 – Skript in Python 2. 7 Liest Datenbankdateien ein Erstellt Tabelle mit detaillierten Informationen & gibt vorläufige Ergebnisse aus [4] Kein Skript kann perfekt sein – Daten müssen stellenweise manuell bereinigt werden Open-Access-Tage 2017 | Eva Bunge 6
2 - Vorgehen 2. 2 – Funktionsweise Datenbanken einlesen • Format vereinheitlichen Hybrid / Grün OA identifizieren Dubletten entfernen • DOI-Abgleich • Titel/Autor-Abgleich Gold-OA identifizieren • Via oa. DOI • ISSN-Abgleich mit DOAJ Qualitätskontrolle APCs abschätzen • Händisch • DOAJ oder Erfahrungswerte Open-Access-Tage 2017 | Eva Bunge Affiliationen identifizieren • Korrespondenzautorschaft • Erstautor/in Fehlende ISSNs ergänzen • Via Cross. Ref Ergebnisse ausgeben • Nachbearbeiten 7
3 - Daten 3. 1 – Vollständigkeit Anzahl gefundene vs. tatsächliche Artikel: ca. ± 1 % – 9 % [Zahlen für TU Berlin 2013/14] Artikel mit DOI: ca. 89 % Artikel mit ISSN/e. ISSN: ca. 98 % Affiliationsangabe: in ca. 99 % der Fälle [5] Eindeutige Korrespondenzautorschaft: ca. 86 % * Alle Werte für Skriptversion 09/17 | Auswertung für 2016 | um Dubletten bereinigt Open-Access-Tage 2017 | Eva Bunge 8
3 - Daten 3. 2 – Ein paar Worte zur Korrespondenzautorschaft Annahme: In der Regel zahlen Korrespondenzautoren/-autorinnen die APCs Wenn keine Korrespondenzautorschaft angegeben, nehme Erstautor/-in: ca. 14 % der Fälle Auswertung: Korrespondenzautorschaft = Erstautorschaft in ca. 64 % der Fälle Also: in ca. 5 % der Fälle ist die verwendete Korrespondenzautorschaft inkorrekt Platz des Korrespondenzautors in der Autorenliste 7000 63, 7 % Anzahl Artikel 6000 5000 4000 3000 Platz des Korrespondenzautors in der Autorenliste (N = 9466) 24, 4 % 2000 1000 3, 4 % 1, 2 % 0, 6 % 0, 8 % 5, 9 % 0 1 letzter 2 3 4 Verortung in der Autorenliste 5 andere Open-Access-Tage 2017 | Eva Bunge * Alle Werte für Skriptversion 09/17 | Auswertung für 2016 | um Dubletten bereinigt 9
3 - Daten 3. 3 – Datenquellen Reihenfolge des Einlesens einer Datenbank in das Skript beeinflusst Zuordnung zur Datenquelle Datenbanken mit vollständigen/leicht zu verarbeitenden Metadaten bevorzugt Mit nur drei Datenbanken können schon ca. 92 % der Publikationen gefunden werden. Aber: Fachspezifisch! Verteilung der Publikationen auf Datenquellen (N = 11017) 2% 4% 6% Web of Science (n = 8730) 8% Scopus (n = 920) Pub. Med (n = 482) Inspec (n = 244) * Alle Werte für Skriptversion 09/17 | Auswertung für 2016 | um Dubletten bereinigt 79% Open-Access-Tage 2017 | Eva Bunge Andere (n = 641) 10
3 - Daten 3. 4 – Datenbanken & Formate 16 Datenbanken mit 5 verschiedenen Formaten. Allein von 2016 nach 2017 haben zwei Datenbanken ihre Formate geändert. Zwei Exportformate derselben Datenbank enthalten nicht unbedingt identische Informationen. Hinterlegte Formate für DOI, ISSN, Datum etc. unterscheiden sich oft stark. 12 Datenbanken werden via RIS-Format eingelesen. Eigentlich standardisiert, aber: affiliations title authors DOI ISSN year publisher journal corr. Auth TEMA C 1 T 1 A 1 IEEE TI AU Pro. Quest AD T 1 AU BSC N 1 T 1 AU Geo. Ref AD TI A 1 DO DO DO L 3 DO SN Y 1 PB JO SN PY PB JF SN Y 1 PB JO SN PY PB JO JO CAB M 1 T 1 A 2 SN Y 1 JF CINAHL AD T 1 AU EBSCO N 1 T 1 AU DO L 3 DO SN Y 1 PB JO AD SN Y 1 PB JO Embase M 1 T 1 A 1 SN Y 1 PB JF AD LISA AD T 1 AU Scopus AD TI AU DO DO SN PY PB JF SN PY PB T 2 N 1 Sport. Discus N 1 T 1 AU SN Y 1 JO Zuordnung der Metadaten auf die RIS-Felder verschiedenen Datenbanken Open-Access-Tage 2017 | Eva Bunge 11
4 - Fazit 4. 1 – Erkenntnisse Die Vollständigkeit einer guten institutionellen Bibliografie kann das Skript nicht ersetzen. Es können jedoch innerhalb einer gewissen Fehlertoleranz gute Ergebnisse erzeugt werden. Viele Datenbanken liefern Metadaten in ausreichendem Umfang. Knackpunkte: korrekter Datenimport, Zuordnung Affiliationen & Korrespondenzautorschaft Je mehr Arbeit man in die Nachbearbeitung stecken kann, desto genauer werden die Ergebnisse. [6] Open-Access-Tage 2017 | Eva Bunge 12
4 - Fazit 4. 2 – Offene Fragen Welche Möglichkeiten haben wir, die verfügbaren Daten zu verbessern? (z. B. ORCID, standardisierte Affiliationsangaben, …) Welche Standards zur Erfassung von OAPublikationen verwenden wir? (Zeit zwischen Erst-/Zweitveröffentlichung, Lizenzen für hybride Publikationen, …) Zählweise | Berücksichtigung von Mehrfachaffiliationen [7] Daten für die Geisteswissenschaften sind besonders lückenhaft – bis jetzt nur Zeitschriftenartikel berücksichtigt. Wie geht man damit um? Welche potentiellen Datenquellen? Open-Access-Tage 2017 | Eva Bunge 13
Kontakt Eva Bunge (ORCID: 0000 -0002 -5587 -5934) Deutsches Museum, Bibliothek http: //www. deutsches-museum. de/bibliothek/ e. bunge@deutsches-museum. de Tel. : 089 2179 420 Vielen Dank für Ihre Aufmerksamkeit! [1] Open-Access-Tage 2017 | Eva Bunge 14
Skript Das Skript kann auf Git. Hub gefunden werden: (https: //github. com/tuub/oa-eval) Stand 13. 09. 17: Die aktuelle Version (genutzt für die Analyse der Berliner OA-Kennzahlen 2016) ist im Branch ‚Dev‘ zu finden. Die dazugehörige Dokumentation wird in den nächsten Wochen aktualisiert. Das Skript lässt sich an die eigenen Bedürfnisse anpassen, eine entsprechende Anleitung wird bereitgestellt. Open-Access-Tage 2017 | Eva Bunge 15
Bildquellen [1] Image Credit: Foto Deutsches Museum [2] Chiffriermaschine Enigma M 4, http: //digital. deutsches-museum. de/item/2017 -398/, Deutsches Museum, 09. 2017. CC-BY-SA Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4. 0 International Lizenz, https: //creativecommons. org/licenses/by-sa/4. 0/ [3] Bilder zu Punkt 1 & 2: Screenshots von main. py in tuub/oa-eval (https: //github. com/tuub/oa-eval) das unter der BSD 3 -clause "New" or "Revised" License (https: //github. com/tuub/oa-eval/blob/master/LICENSE) lizenziert ist [4] Zwei-Spezies-Rechenmaschine, Brüning, "Resulta-BS 7", http: //digital. deutsches-museum. de/item/1991 -442/, Deutsches Museum, 09. 2017. CC-BY-SA Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4. 0 International Lizenz, https: //creativecommons. org/licenses/by-sa/4. 0/ [5] Erstes Rastertunnelmikroskop, IBM, Nachbildung, http: //digital. deutsches-museum. de/item/1993 -432/, Deutsches Museum, 09. 2017. CC-BY-SA Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4. 0 International Lizenz, https: //creativecommons. org/licenses/by-sa/4. 0/ [6] Planetarium in Armillarsphäre, kopernikanisch, von Desnos, Paris , http: //digital. deutsches-museum. de/item/44701/, Deutsches Museum, 09. 2017. CC-BY-SA Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4. 0 International Lizenz, https: //creativecommons. org/licenses/by-sa/4. 0/ [7] Spiegelteleskop von Newton, Nachbildung, http: //digital. deutsches-museum. de/item/62004/, Deutsches Museum, 09. 2017. CC-BY-SA Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4. 0 International Lizenz, https: //creativecommons. org/licenses/by-sa/4. 0/ Lizenz Inhalte sind, sofern nicht anders gekennzeichnet, lizenziert unter Creative Commons Namensnennung 4. 0 International. https: //creativecommons. org/licenses/by/4. 0 Open-Access-Tage 2017 | Eva Bunge 16
- Slides: 16