Bibliotheek Project RDM Ondersteuning Data organiseren beschrijven Basistraining
Bibliotheek – Project RDM Ondersteuning Data organiseren & beschrijven Basistraining voor informatiespecialisten
Waarom organiseren & beschrijven? § Het menselijk geheugen is feilbaar § Aan elk dienstverband komt een eind § Steeds hetzelfde uitleggen gaat vervelen RDMO Data organiseren & beschrijven 2
Doel van organiseren & beschrijven Oorsprong, structuur en inhoud van een dataset zijn te allen tijde begrijpelijk voor iedereen RDMO Data organiseren & beschrijven 3
Testvraag Wat heeft iemand die niet bekend is met jouw data nodig om jouw data te kunnen vinden, beoordelen, begrijpen en hergebruiken? RDMO Data organiseren & beschrijven 4
Temperatuur: 32, 3 Temperatuur waarvan? Eenheid? Fahrenheit? Celsius? Wanneer? Gemeten? Berekend? Hoe? Waar? (Hoe) is de apparatuur geijkt? Waarmee gemeten? RDMO Data organiseren & beschrijven 5
Organiseren RDMO Data organiseren & beschrijven 6
Nut van organiseren § Bestanden eenvoudig terugvinden (tijd besparen) § Lopend en afgerond werk van elkaar scheiden (overzicht houden) § Master-bestanden en werkbestanden van elkaar scheiden (verlies van bestanden voorkomen) RDMO Data organiseren & beschrijven 7
Do’s § Geef (sub)mappen duidelijke namen § Beperk aantal niveaus in hiërarchie § Beschrijf structuur in een readme. txt RDMO Data organiseren & beschrijven 8
Don’ts § (Sub)mappen naar onderzoekers noemen § Identificatie van bestanden afhankelijk maken van de map waarin ze staan § Organisatie laten bepalen door software waaruit bestandsstructuur niet te exporteren is RDMO Data organiseren & beschrijven 9
Piled Higher and Deeper by Jorge Cham http: //www. phdcomics. com/comics/archive. php? comicid=1531 Bestandsnamen RDMO Data organiseren & beschrijven 10
Goede bestandsnamen § maken bestanden vindbaar § helpen om (versies van) bestanden van elkaar te onderscheiden § voorkomen verwarring bij het delen van bestanden RDMO Data organiseren & beschrijven 11
Mogelijke bouwstenen § Korte beschrijving van inhoud § Maker of aanduiding meetinstrument § Aanmaak-, opname- of publicatiedatum § Versienummer § Projectnummer en/of naam van onderzoeksgroep RDMO Data organiseren & beschrijven 12
Praktische tips § Maak bestandsnamen relevant en kort (ca. 25 tekens) § Gebruik in bestandsnamen geen speciale tekens § Gebruik _underscores_ in plaats van spaties RDMO Data organiseren & beschrijven 13
Praktische tips § Vermeld een datum in de bestandsnaam op steeds dezelfde manier (jjjjmmdd / jjmmdd) § Afkortingen of initialen in de bestandsnaam? Noteer de betekenis in een readme. txt RDMO Data organiseren & beschrijven 14
Versiebeheer § Opeenvolgende versies? Gebruik nummers (v 01, v 02 etc. ) i. p. v. aanduidingen als “concept” of “def” § Verschillende versies van zelfde bestand? Duid aan in de bestandsnaam (bv. ‘tb’ voor thumbnail) § Eventueel: software voor versiebeheer (SVN) RDMO Data organiseren & beschrijven 15
Testvraag Bevat de bestandsnaam de informatie die nodig is om het bestand te identificeren, ongeacht waar het bestand is opgeslagen? RDMO Data organiseren & beschrijven 16
Voorbeeld. . /Research Data Management/Tweede opzet voor de cursus januari 2014. docx wordt RDMO Data organiseren & beschrijven 17
Voorbeeld. . /Research Data Management/Tweede opzet voor de cursus januari 2014. docx beter: . . /201401_RDMCursusopzet_v 02. docx. . /201401 RDMCursusopzetv 02. docx RDMO Data organiseren & beschrijven 18
Bestanden hernoemen § Bulk Rename Utility (Windows) § Renamer 4 Mac (Mac) § Renamer (Mac) § PS Renamer (Windows, Mac, Linux) RDMO Data organiseren & beschrijven 19
Metadata Dan Cohen is Executive Director van de Digital Public Library of America (DPLA) https: //twitter. com/dancohen/status/431440078951682049 RDMO Data organiseren & beschrijven 20
Metadata: functies § Vindbaar maken: metadata bieden de bouwstenen die de zoekfunctie van een repository nodig heeft § Citeerbaar maken: metadata leveren de elementen voor een citatie van een dataset RDMO Data organiseren & beschrijven 21
Soorten metadata § Beschrijvend: identificatie, locatie, classificatie § Technisch: bestandsformaten, instellingen van apparatuur, gebruikte soft- of hardware § Administratief: eigendomsrechten, licentie § Gebruik: toegangsrechten, embargo § Behoud: checksums, migratie, conversie RDMO Data organiseren & beschrijven 22
Wanneer metadateren? § Over het algemeen toegekend bij delen, publiceren en/of archiveren van data § Embedded metadata: automatisch in bestand opgeslagen (≠ garantie bij verplaatsen bestand) RDMO Data organiseren & beschrijven 23
http: //www. flickr. com/photos/surfannemiek/3038325213/ RDMO Data organiseren & beschrijven 24
http: //www. flickr. com/photos/surfannemiek/3038325213/meta RDMO Data organiseren & beschrijven 25
RDMO Data organiseren & beschrijven 26
Standaarden § Generiek: Dublin Core, Data. Cite § Vakspecifiek: o. a. Data Documentation Initiative (DDI, Social Sciences) § Standaarden van repository’s en data portals Doorzoekbaar overzicht op website DCC RDMO Data organiseren & beschrijven 27
Dublin Core® Metadata Initiative (DCMI) Contributor Format Rights Coverage Identifier Source Creator Language Subject Date Publisher Title Description Relation Type RDMO Data organiseren & beschrijven 28
RDMO Data organiseren & beschrijven Voorbeeld ontleend aan https: //library. uoregon. edu/datamanagement/metadata. html 29
Zoekfunctie RDMO Data organiseren & beschrijven 30
Data. Cite properties M = mandatory, R = recommended, O = optional Alternate. Identifier (O) Geo. Location (R) Resource. Type (R) Contributor (R) Identifier (M) Rights (O) Creator (M) Language (O) Size (O) Date (R) Publication. Year (M) Subject (R) Description (R) Publisher (M) Title (M) Format (O) Relate. Identifier (R) Version (O) RDMO Data organiseren & beschrijven 31
Data. Cite properties Meer voorbeelden op http: //schema. datacite. org/meta/kernel-3/index. html RDMO Data organiseren & beschrijven 32
Standaard kiezen § Welk type data verzamelt de onderzoeker? § Wat is gebruikelijk in vakgebied of onderzoeksgroep? § Waar gaat de data gedeponeerd worden (= wat wil en kan repository)? RDMO Data organiseren & beschrijven 33
Uitdaging De informatie die een onderzoeker over zijn of haar dataset heeft, vertalen naar de metadatavelden die gebruikt worden in een repository Vaak zijn veel meer velden mogelijk en vooraf door de onderzoeker gewenst dan uiteindelijk worden ingevuld en gebruikt bij zoeken (= FLUOR-ervaring) RDMO Data organiseren & beschrijven 34
http: //library. stanford. edu/research/data-management-services/data-bestpractices/creating-metadata/metadata-tools-comparison Metadata: gereedschap RDMO Data organiseren & beschrijven 35
Documentatie RDMO Data organiseren & beschrijven 36
(Meta)data vs documentatie § Data § Metadata: beschrijving van data voor computers § Documentatie: beschrijving van data voor mensen RDMO Data organiseren & beschrijven 37
(Meta)data vs documentatie - voorbeeld § Data antwoorden op vragen § Metadata maker van vragenlijst, datum van afname vragenlijst etc. § Documentatie vragenlijst zelf, beschrijving van gehanteerde methode etc. RDMO Data organiseren & beschrijven 38
Documenteren op drie niveaus § Onderzoeksproject: context, methodologie, instrumenten § Dataset of database: relatie tussen bestanden § Bestand: inhoud en structuur van individuele bestanden (variabelen, codes etc. ) RDMO Data organiseren & beschrijven 39
Testvraag Wat heeft iemand die niet bekend is met jouw data nodig om jouw data te kunnen beoordelen, begrijpen en hergebruiken? RDMO Data organiseren & beschrijven 40
De praktijk… Edinburgh University Data Library [Data Library]. (2012, May 4). MANTRA – John Mac. Innes – Data documentation in secondary data analysis. Retrieved from http: //youtu. be/Ebaiwg 08 CW 8 RDMO Data organiseren & beschrijven 41
Informatiebronnen Digital Curation Centre (DCC), Resources for digital curators: Disciplinary Metadata http: //www. dcc. ac. uk/resources/metadata-standards Dublin Core® Metadata Initiative User Guide http: //wiki. dublincore. org/index. php/User_Guide Data. Cite Metadata Schema http: //schema. datacite. org/meta/kernel-3/index. html Stanford University Libraries, Metadata tools http: //library. stanford. edu/research/data-management-services/data-best-practices/creatingmetadata/metadata-tools RDMO Data organiseren & beschrijven 42
Colofon Presentatie: Mariëtte van Selm | selm@uva. nl Beeld, tenzij anders vermeld bij afbeelding: Jørgen Stamp | http: //www. digitalbevaring. dk/ M. van Selm, RDM Ondersteuning - basistraining voor informatiespecialisten, lesmateriaal sessie 4. Februari 2014. Dit werk is gelicenseerd onder de licentie Creative Commons Naamsvermelding-Gelijk. Delen 4. 0 Internationaal RDMO Data organiseren & beschrijven 43
- Slides: 43