Sknnimine ja digiteerimine lihtsate vahenditega Koit Saarevet DAB
Skännimine ja digiteerimine lihtsate vahenditega Koit Saarevet DAB nõunik/projektijuht 18. juuni 2008 1
Koolituse eesmärk 1. Anda ülevaade digimise olemusest, kasudest, probleemidest 2. Anda mingi praktiline ettekujutus, kuidas digimine välja näeb 3. Vastata küsimustele, mis kuulajatel varasemas praktikas tekkinud 2
Kava 1. Digimisest üldiselt – – 2. 3. 4. n Mis on digiteerimine? Milleks digiteerida ehk digi eelised Digimisprojekti juhtimine Tekstidokumentide digimine Praktilised näited Küsimused (mitte ainult lõpus, vaid kogu aeg) 3
Mõistete seletus 1: digiteerimine n n n Digitaliseerimine = digiteerimine = digimine = ingl k digitizing = ingl k digitalizing Reaalset maailma kirjeldavate pidevate signaalide (mõõtmistulemuste) viimine mittepidevale arvulisele kujule, võimaldamaks nende kasutamist arvutis. Objekti, kujutise, dokumendi või signaali esitamine kindla hulga punktide või proovide kaudu. Analoogsignaalid on pidevalt muutuvad, seda nii signaali võimalike väärtuste arvu osas antud ajahetkel kui ka ajaperioodis võimalike ajahetkede arvu osas. Digitaalsed signaalid on mittepidevad nende mõlema nüansi osas ja seega tähendab digiteerimine originaalsignaalist teatava lähenduse loomist, mis kunagi ei esita originaali täielikult. 4
Mõistete seletus 2: skännimine n n n Skäneerimine = skaneerimine = skännimine = ingl k scanning Kitsamalt: paberkandjal või filmilindil esitatud teksti, jooniste, fotode vm ainese digiteerimine skänneri (lameskänner, raamatuskänner vmt) abil. Laiemalt: Ingl k scan tähendab millegi käsitlemist järjestikku samm-sammu haaval. Iga digiteerimisprotsess eeldab olemuslikult sellist teguviisi, seega on skänneerimine digiteerimise sünonüüm. 5
OSA 1: DIGITEERIMISEST ÜLDISELT Analoogne ja digitaalne n Analoogsignaal – – – pidevatoimeline lõpmatu arv olekuid, mida saab igal ajahetkel mõõta enamik looduslikke protsesse on pidevatoimelised http: //et. wikipedia. org/wiki/Analoogsignaal n Digitaalsignaal ehk arvsignaal – mittepidev ehk diskreetne – kindel arv olekuid kindlatel ajahetkedel – esitamiseks kasutatakse arvkoodi, enamasti kahendehk binaarkoodi http: //et. wikipedia. org/wiki/Digitaalsignaal 6
Analoog- ja digisignaali erinevused n n Digi saab kopeerida kadudeta, analoogi praktiliselt mitte (n helikasseti kopeerimisel on koopia alati hoomatavalt kehvem originaalist, CD kopeerimisel aga kvaliteet ei muutu). Andmekandja füüsilise ja moraalse aegumise tõttu on aga kopeerimine vältimatu. Digi on hästi otsitav (n täisteksti otsing eraamatust) 7
Analoog- ja digisignaali erinevused n n Digi on kiiresti navigeeritav (n arvutis mp 3 kuulates saab liuguriga hetkeliselt loo sees soovitud kohta hüpata) Digi on korraga kasutatav pea piiramatule hulgale, piiriks vaid arvutisüsteemi võimsus (n Saaga kirikuraamatuid kasutab korraga keskmiselt 70 -100 inimest, samas kui kogu Rahvusarhiivis on alla 30 mikrofilmilugeri ja ühest filmist reeglina vaid 1 -2 koopiat) 8
Digitaalse probleemid 1 n Digiteerimisprotsessis tekib põhimõtteline (st vältimatu) kvaliteedikadu 9
Digitaliseerimise protsess n Analoogsignaal 10
Digitaliseerimise protsess n Määrame mõõteintervalli 11
Digitaliseerimise protsess n Mõõdame signaali väärtused valitud intervalliga 12
Digitaliseerimise protsess n Määrame väärtuste mõõtmise astmed 13
Digitaliseerimise protsess n Ümardame mõõdetud väärtused lähima astmeni ja saamegi digitaalsignaali 14
Infokadu digiteerimisel t n Algne analoogsignaal t n Digiteerimisel saadud signaal 15
Digitaalse probleemid 2 n n Ka digimaailmas tekitab enamik töötlusi pöördumatuid moonutusi Järjestikuste töötluste puhul moonutused summeeruvad 16
Moonutused (infokadu) töötlemisel n Algne digitaalne kujutis (1 punkti laiused jooned 80 kordse suurendusega) n Sama kujutis pööratud 2° paremale. Ühtlane must on kohati muutunud halltoonideks 17
Moonutuste summeerumine 1 n Töötlusele olemuslikud moonutused + võimalikud töötlusvead akumuleeruvad Aeg 18
Moonutuste summeerumine 2 Töötlus 1 2 Töötlus 3 Töötlus 4 Back to the Future, Remco Verdegem, ettekanne konverentsil Tools & trends in Digital Preservation, 1. -2. 11. 2007 Haag http: //www. kb. nl/hrd/congressen/toolstrends/presentations/Verdegem. pdf 19
OSA 2: DIGIMISPROJEKTI JUHTIMINE Olulised aspektid n n n n Digiteerimisprojekti planeerimine Digiteerimise allikmaterjali väljavalimine Digiteerimise ettevalmistamine Originaalide käitlemine Digiteerimisprotsess Digitaalsete tagatiskoopiate säilitamine Metaandmed Publitseerimine Heade tavade käsiraamat, MINERVA projekt, 2004 http: //www. kul. ee/webeditor/files/headetavadekasiraamat. doc 20
MINERVA soovituste teine variant n Technical Guidelines for Digital Cultural Content Creation Programmes (MINERVA 2004) http: //www. minervaeurope. org/structure/workinggr oups/servprov/documents/techguid 1_0. pdf n Sisaldab viiteid igat soovitust süvitsi käsitlevatele dokumentidele 21
Kulud 1: Mahuprognoos n Realistliku saamiseks teha pilootprojekt ja ise järgi proovida, mitte uskuda masina spetsifikatsiooni – N: Zeutschel Omniscan 10000 TT teeb paberite järgi ühe kaadri 5 sekundiga, tegelikkuses aga kulub keskmiselt 12, kuna pole arvestatud tööasendi taastamisele kuluvat aega 22
Kulud 2: Digiteerimisvahendid n Digiteerimise riistvara – – n skänner arvuti valgustid (vajalikud fotoaparaadi kasutamisel) statiivid, dokumendi aluslauad, töölauad Digiteerimise tarkvara – skännimistarkvara (peab olema masstööle optimeeritud, n oskama failidele järjest nimesid panna) – tekstituvastus (tasuta vahendid on viletsad, soovitan Fine. Readerit, hind u 2700 EEK) – kasutuskoopiate masstootmine tagatisfailidest 23
Kulud 3: Failide hoidmine ja kasutamine n Salvestusruum – A 4 dokument 256 halltooniga 300 dpi resolutsioonil on pakkimata kujul 8 MB. Kui kuus digida 10 000 kaadrit, siis kulub 80 GB. Selle hoidmine näiteks serveriketastel võib maksta mitutuhat krooni. – Heli ja video puhul on mahud veel 10 (heli) ja 100 (video) korda suuremad n Kasutuskeskkond – tarkvara loomine – serveri ja võrgu ülalhoid 24
Kulud 4: Palgad n Skäneerija – soovitatavalt tükitöö – plaani täitmise boonused n n IT spetsialist Projektijuht 25
Dokumenteerimine n Arhiivikirjelduste tekitamine – mõistlik on kirjeldusi hoida teatmestus ja seostada digitud kujutised teatmestuga viitekoodide kaudu n Digiteerimise metaandmete kasutamine – Protsess tuleb korralikult dokumenteerida – Juhiseid vt n http: //www. ra. ee/digiaken/uploads/rameta. pdf n Failide nimetamine – kaose vältimiseks ja veebipõhiste kasutuskeskkondade loomiseks peavad failinimed olema süstemaatilised – vt n “RA digiteerimise tehnilised põhimõtted” (väljatrükk jaotusmaterjali lõpus) 26
Üldist n Tagatis- ja kasutuskoopia erinevus – tagatis teha võimalikult moonutusvaba ja mõistlikult kõrge kvaliteediga – kasutuskoopia genereerida tarkvara abil automaatselt (kvaliteet vastavalt hetkevajadustele, vajadusel töödelda ja ilustada) n Tööjuhend tegijale – masina operaator peaks töö käigus võimalikult vähe mõtlema ja otsuseid langetama 27
OSA 3: TEKSTIDOKUMENTIDE DIGIMINE Skänneritüübid n Lameskänner + odav – dokument tuleb paigaldada nägu allpool, seega ei sobi räbaldunud või paksu köitega originaalidele n Fotoaparaat + + – n lihtne kasutada ja üsna odav väga lai formaadivalik (saab ka A 0 teha) hea tulemuse saamiseks vaja statiive, valgusteid, objektiive jm abivahendeid Raamatuskänner + kiire ja vastupidav + originaali mitte rikkuv valgus – väga kallis (150 000 – 2, 5 mln EEK) 28
Skänneri valiku kriteeriumid n n Originaalide väärtus ja seisund: kui palju võib valgust peale lasta Resolutsiooni vajadus – tekstidokumentide puhul 300 dpi, fotode ja negatiivide puhul oluliselt kõrgem (vt “RA digiteerimise tehnilised põhimõtted” (väljatrükk jaotusmaterjali lõpus) n Värvivajadus – osa raamatuskännereid on halltoonides, mis on tekstidokumendile OK, aga fotodele ei kõlba n Planeeritav töömaht (kaadrit aasta kohta) 29
Skännerite võrdlus Liik Odav universaalne lameskänner Mudel Hind EEK A 4 Kiirus Eluiga (kaadreid) Epson Perfection V 200 Photo 900. - 3 lk/min 10 000 Lameskänner foto-dele, Epson Perfection 2400 -6400 dpi 3200 Photo 1500. - 3 lk/min 30 000 Lameskänner foto-dele, Epson Expression 2400 -6400 dpi 10000 XL 30 000. - 3 -5 lk/min 100 000 Automaatsöötjaga Epson GT-30000 dokumendiskänner 600 x 1200 dpi 40 000. - 30 lk/min 600 000 Professionaalne raamatuskänner Zeutschel Omni. Scan 10000 TT 800 000. - 5 lk/min >1 000 NB: Näites on peamiselt Epsoni mudelid, kuna HP ja Canon pole eluea andmeid avaldanud 30
OSA 4: PRAKTILINE TÖÖ 31
- Slides: 31