U vraagt wij scannen Grootschalig digitaliseren van archivalia

  • Slides: 19
Download presentation
U vraagt, wij scannen Grootschalig digitaliseren van archivalia op verzoek van de klant Marc

U vraagt, wij scannen Grootschalig digitaliseren van archivalia op verzoek van de klant Marc Holtman Stadsarchief Amsterdam VGI Studiemiddag 12 sep 2008

De aanleiding Online inventarissen Sinds 2004 zijn alle inventarissen van het SAA online via

De aanleiding Online inventarissen Sinds 2004 zijn alle inventarissen van het SAA online via website beschikbaar Alle inhoud is geïndexeerd door zoekmachines zoals Google Het zoeksysteem werd al meteen na lancering intensief gebruikt Zijn we nu klaar?

De Archiefbank “Waar zijn de plaatjes? ” Inventarissen zijn vanuit het oogpunt van de

De Archiefbank “Waar zijn de plaatjes? ” Inventarissen zijn vanuit het oogpunt van de gebruiker beperkt Voor inzage in de stukken moet nog steeds een bezoek worden gebracht aan de studiezaal De meest gestelde vraag van onze gebruikers was dan ook “Waar zit de knop om de plaatjes te bekijken”?

De Archiefbank “Waar zijn de plaatjes? ” In 2006 hebben we besloten om die

De Archiefbank “Waar zijn de plaatjes? ” In 2006 hebben we besloten om die knop te ontwikkelen Oftewel, de Archiefbank: Een systeem voor het raadplegen en downloaden van archivalia via het web De eerste versie is in juli 2007 gelanceerd Op dit moment bevat de Archiefbank meer dan 5. 000 scans En zij er 25. 000 geregistreerde Archiefbank gebruikers

U vraagt Digitaliseren op verzoek van de klant Het SAA beheert 32 kilometer archief

U vraagt Digitaliseren op verzoek van de klant Het SAA beheert 32 kilometer archief Waar dus mee te beginnen? Uit een onderzoek naar aanvragen van originelen op studiezaal blijkt: er zijn geen publieksfavorieten Hoeveel tijd kost het om 32 km archief te digitaliseren? In de Archiefbank stelt de 1 gebruiker daarom de prioriteiten in digitalisering meter archief = 7. 000 scans Bij een productie van 10. 000 scans per week Alle openbare inventarisnummers kunnen voor digitalisering worden aangevraagd is na 431 jaar elk stuk gedigitaliseerd Als we alle aanvragen voor digitalisering kunnen verwerken dan kunnen we concluderen dat er geen achterstand is in digitalisering en dat de doelstelling dat de gebruiker stukken digitaal kan raadplegen is gehaald

U vraagt Korte levertijd De levertijd moet zo kort als mogelijk zijn Dit kan

U vraagt Korte levertijd De levertijd moet zo kort als mogelijk zijn Dit kan alleen maar worden gerealiseerd wanneer aan twee voorwaarden wordt voldaan: 1. Een gestroomlijnd, efficiënt georganiseerd werkproces voor grootschalige digitalisering 2. Een snelle, gebruikersvriendelijke webapplicatie

U vraagt Lage kosten Archiefonderzoek loopt al snel in de tientallen, tot honderden documenten

U vraagt Lage kosten Archiefonderzoek loopt al snel in de tientallen, tot honderden documenten De gebruiker zal dus vaak een groot aantal scans nodig hebben De prijs moet in het verlengde liggen van de prijs van eenvoudige kopie op studiezaal Dit betekent dat de productiekosten zo laag als mogelijk moeten blijven He, betalen voor scans? probleem ontwikkeld, met raadplegen We hebben daarom een nieuw. Het werkproces met van scans van archivalia is dat een kwaliteit “minder dan leesbaar” geen nut heeft En méér dan leesbaar ook niet Grootschaligheid en kwaliteit afgestemd op het gebruiksdoel als uitgangspunten Het SAA stelt levering van een reproductie via het web gelijk aan levering van een kopie op studiezaal Voorbeeld aanvragen Maar wat vindt het publiek hiervan? Bijvoorbeeld Aad en Jan?

Wij scannen Voor archiefonderzoek via het web De scans gemaakt in dit reproductieproces zijn

Wij scannen Voor archiefonderzoek via het web De scans gemaakt in dit reproductieproces zijn gemaakt voor raadplegen door de gebruiker En NIET als a substituut voor de originelen Conservering van de originelen blijft de belangrijkste zorg Toch heeft digitalisering natuurlijk wel een conserveringsfunctie: de originelen hoeven het depot in principe niet meer te verlaten

Wij scannen Een breed spectrum aan documenttypen De documenten die in dit proces worden

Wij scannen Een breed spectrum aan documenttypen De documenten die in dit proces worden gedigitaliseerd zijn Klein en groot formaat (tot formaat krant) Losse en vastbladige eenheden Kaartsystemen Oud en modern materiaal Laag en hoog contrast documenten Tekst, en tekst en beeld Hybride vormen Voor alle documenttypen geldt dezelfde kwaliteitsstandaard

Wij scannen Met een kwaliteitsstandaard gebaseerd op het gebruiksdoel Om de kosten zo laag

Wij scannen Met een kwaliteitsstandaard gebaseerd op het gebruiksdoel Om de kosten zo laag als mogelijk te houden volgt de kwaliteitsstandaard uit het gebruiksdoel Raadplegen van gedigitaliseerde archivalia via het scherm of in print De kwaliteitsstandaard luidt als volgt Informatie leesbaar in het origineel moet leesbaar zijn in de scan Een punt op de i moet als zodanig herkenbaar zijn Reproductie papierstructuur en exacte kleurreproductie niet van hoogste belang Prijsvergelijking (gemiddeld) Foto : 2 – 4 Euro Archivalia, Metamorfoze: 0, 65 Euro Archivalia, Archiefbank: 0, 20 Euro

Wij bewaren Geen aparte, ongecomprimeerde scans Om ook de opslagkosten zo laag als mogelijk

Wij bewaren Geen aparte, ongecomprimeerde scans Om ook de opslagkosten zo laag als mogelijk te houden slaan we geen ongecomprimeerde bestanden op Kleurruimte RGB Bittdiepte 8 bits per kanaal Curve (“contrast”) zodanig dat de scans op zowel een beeldscherm als print leesbaar zijn Opslagformaat JPEG Compressie kwaliteit 10 (Photoshop)

Wij bewaren Geen aparte, ongecomprimeerde scans Dit resulteert in een scan met: Een relatief

Wij bewaren Geen aparte, ongecomprimeerde scans Dit resulteert in een scan met: Een relatief kleine bestandsgrootte Uitstekende leesbaarheid op scherm en print Genoeg flexibiliteit De scans worden opgeslagen in ons interne digitaal depot én op de webserver (alle images zijn online beschikbaar) Op de webserver worden afgeleiden gemaakt voor inzoomen en contrastfilter voorbeeld

Het reproductieproces Ontwikkeling van het reproductieproces Er zijn nauwelijks richtlijnen en best practices voor

Het reproductieproces Ontwikkeling van het reproductieproces Er zijn nauwelijks richtlijnen en best practices voor grootschalige digitalisering Wij hebben een reproductieproces ontwikkeld waarin we ongeveer 10. 000 scan per week op basis van klantaanvragen (plus aanvulling eigen selecties) kunnen verwerken Maar ook grootschalige digitalisering op projectbasis volgt dit proces Bovendien hebben we in-huis een workflowsysteem ontwikkeld dat optimaal aansluit op de bestaande systemen en procedures

Uitgangspunten Uitgaan van bestaande metadata Het complete inventarisnummer wordt altijd gescand Constante productie (10.

Uitgangspunten Uitgaan van bestaande metadata Het complete inventarisnummer wordt altijd gescand Constante productie (10. 000 scans, +/- 1, 4 meter) Identificatie op basis van orderbonnen

Uitgangspunten Uitgaan van bestaande metadata Het complete inventarisnummer wordt altijd gescand Constante productie (10.

Uitgangspunten Uitgaan van bestaande metadata Het complete inventarisnummer wordt altijd gescand Constante productie (10. 000 scans, +/- 1, 4 meter) Identificatie op basis van orderbonnen Betekenisloze bestandsnamen

Archiefbank aanvraag Beheersystemen Orderbon Order A 03764 Filename registration A 03764000001 12 digits Order

Archiefbank aanvraag Beheersystemen Orderbon Order A 03764 Filename registration A 03764000001 12 digits Order number Archief 195 Order Invnr 836 A 03764 Serial number A 03764000001 Barcode Scanning order Range: A 03764000001 – A 03764999999 Import Scanrapport A 03764000001 A 03764000004 A 03764000001 A 03764000002 A 03764000003 A 03764000004 A 03764000002 A 03764000005 A 03764000003 Na registratie komt de betekenis van het ordernummer te vervallen We kunnen daarom spreken van betekenisloze bestandsnamen

Uitgangspunten Uitgaan van bestaande metadata Het complete inventarisnummer wordt altijd gescand Constante productie (10.

Uitgangspunten Uitgaan van bestaande metadata Het complete inventarisnummer wordt altijd gescand Constante productie (10. 000 scans, +/- 1, 4 meter) Identificatie op basis van orderbonnen Betekenisloze bestandsnamen Eenvoudige voorbewerking Geen kwetsbaar of op onconventionele wijze verpakt materiaal Scanning is uitbesteed Intensieve samenwerking met digitaliseerder

Conclusies Grootschalig digitaliseren van archivalia voor lage kosten en met een korte levertijd is

Conclusies Grootschalig digitaliseren van archivalia voor lage kosten en met een korte levertijd is mogelijk wanneer: De kwaliteit van de scans, compressie en bestandsformaat zijn afgestemd op het gebruiksdoel Het reproductieproces is gestroomlijnd, efficiënt is georganiseerd, en geautomatiseerd waar mogelijk De back- en frontofficesystemen gebruikersvriendelijk zijn en optimaal aansluiten op de behoeften van klant en medewerker

En tenslotte… De Archiefbank is genomineerd voor de Computable “ICT project van het jaar”

En tenslotte… De Archiefbank is genomineerd voor de Computable “ICT project van het jaar” Award De andere kandidaten zijn grote commerciële giganten Degene met de meeste stemmen wint Help ons daarom om deze prijs te winnen en breng uw stem uit: http: //www 2. computable. nl/computableawards/stem/