YSAsta YSOon konversion suunnittelu Osma Suominen 8 5

  • Slides: 28
Download presentation
YSAsta YSOon konversion suunnittelu Osma Suominen 8. 5. 2017

YSAsta YSOon konversion suunnittelu Osma Suominen 8. 5. 2017

YSAsta YSOon hyödyt ja tavoitteet 1. 2. 3. 4. Monikielisyys ja rikastettu termistö Pysyvät

YSAsta YSOon hyödyt ja tavoitteet 1. 2. 3. 4. Monikielisyys ja rikastettu termistö Pysyvät koneluettavat tunnisteet Käsitetaso Linkittyvyys Lisätoiveet ja rajoitteet: ● Tietueiden pituus/toisteisuus ei saisi kasvaa ainakaan kohtuuttomasti ● Kuvailu jatkossakin mahdollista sekä suomeksi että ruotsiksi

Siirtymän osa-alueet 1. YSAn, Allärsin ja YSOn tarpeettomien eroavaisuuksien eliminointi, jotta muunnos sujuisi mahdollisimman

Siirtymän osa-alueet 1. YSAn, Allärsin ja YSOn tarpeettomien eroavaisuuksien eliminointi, jotta muunnos sujuisi mahdollisimman kivuttomasti a. YSAn/Allärsin monimerkitysten käsitteiden täsmentäminen b. Turhien YSOn jakojen poisto c. Paikkojen lisääminen YSOon 2. Tekninen tuki YSOlla kuvailulle a. Kuvailukäytäntöjen ja -työkalujen uudistaminen: kuvaillaan jatkossa pelkästään YSOlla b. YSOn julkaiseminen MARC-auktoriteettitietueina MARC-pohjaisia järjestelmiä varten c. Uuden kuvailutavan edellyttämät tekniset ominaisuudet, mm. 0 -osakentän (URI) automatiikka 3. Olemassaolevien bibliografisten tietueiden konversio (tämän kokouksen pääaihe)

Testikonversiot 2016

Testikonversiot 2016

Aineistot Fennica ● ● Melinda 1% satunnaisotos: 9993 tietuetta Tarkasteltiin vain 650 -kenttää ($2=ysa)

Aineistot Fennica ● ● Melinda 1% satunnaisotos: 9993 tietuetta Tarkasteltiin vain 650 -kenttää ($2=ysa) ○ ○ 3723 tietuetta joilla on 650 -kenttä (37%) Keskimäärin 4, 9 ysa-asiasanaa per tietue ● ● 1‰ satunnaisotos: 9114 tietuetta Tarkasteltiin 650 -kenttää ($2=ysa/allars) ○ ○ 2378 tietuetta joilla 650 $2=ysa (26%) Keskimäärin 4, 3 ysa-asiasanaa per tietue 516 tietuetta joilla 650 $2=allars (5, 7%) Keskimäärin 3, 2 allars-asiasanaa per tietue

Prosessi 650 -kentässä $2=ysa Hae YSAsta asiasana ei ei Onko ketjutettu? Hae YSAsta a-osakentän

Prosessi 650 -kentässä $2=ysa Hae YSAsta asiasana ei ei Onko ketjutettu? Hae YSAsta a-osakentän asiasana Löytyikö YSAsta? kyllä Hae YSAsta asiasanaketju ei Löytyikö YSAsta? kyllä Mihin termiin osui? käytettävään Hae YSOsta vastaava käsite Löytyikö YSOsta? ei korvattuun kyllä yksi Montako YSOkäsitettä? monta Valmis

Havaintoja ● Fennica/YSA osalta konversio on melko ongelmaton ○ ○ Ei ketjuja Lähes 99%

Havaintoja ● Fennica/YSA osalta konversio on melko ongelmaton ○ ○ Ei ketjuja Lähes 99% YSA-termeistä vastaa täsmälleen yhtä YSO-käsitettä ● Melindassa selvästi haastavampi tilanne ○ ○ Noin ⅓ ketjuja sekä YSAn että Allärsin osalta Selvästi enemmän (n. 2%) termejä, joita ei oikeasti ole YSAssa/Allärsissa

Mitä tehdään Melindan ketjuille?

Mitä tehdään Melindan ketjuille?

Jätetään ennalleen? Ennen Jälkeen 650 7 |a papyrologia |x kreikan kieli |2 ysa 650

Jätetään ennalleen? Ennen Jälkeen 650 7 |a papyrologia |x kreikan kieli |2 ysa 650 7 |a papyrukset |x varhaiskeskiaika |z Bysantti |2 ysa Ketjutetut ja ketjuttamattomat asiasanat päätyisivät aivan erilaisiksi. Ketjutetut YSAlla, ketjuttamattomat YSOlla ilmaistuna.

Muunnetaan vain a-osakenttä; jätetään YSA-ketju Ennen Jälkeen 650 7 |a papyrologia |x kreikan kieli

Muunnetaan vain a-osakenttä; jätetään YSA-ketju Ennen Jälkeen 650 7 |a papyrologia |x kreikan kieli |2 ysa 650 7 |a papyrologia |2 yso |0 http: //www. yso. fi/onto/yso/p 8713 650 7 |a papyrukset |x varhaiskeskiaika |z Bysantti |2 ysa 650 7 |a papyrukset |2 yso |0 http: //www. yso. fi/onto/yso/p 21820 Pakko(? ) säilyttää myös alkuperäinen ketju, koska muuten tietoa hukkuu.

Muunnetaan koko ketju; URI vain a-osakentälle? Ennen Jälkeen 650 7 |a papyrologia |x kreikan

Muunnetaan koko ketju; URI vain a-osakentälle? Ennen Jälkeen 650 7 |a papyrologia |x kreikan kieli |2 ysa 650 7 |a papyrologia |x kreikan kieli |2 yso |0 http: //www. yso. fi/onto/yso/p 8713 650 7 |a papyrukset |x varhaiskeskiaika |z Bysantti |2 ysa 650 7 |a papyrukset |x varhaiskeskiaika |z Bysantti |2 yso |0 http: //www. yso. fi/onto/yso/p 21820 Säilyttää koko ketjun, mutta vain termeinä. 0 -osakentän URI ei siis kerro koko totuutta. ARTO tekee näin?

Muunnnetaan koko ketju; kaikille osille URI? Ennen Jälkeen 650 7 |a papyrologia |x kreikan

Muunnnetaan koko ketju; kaikille osille URI? Ennen Jälkeen 650 7 |a papyrologia |x kreikan kieli |2 ysa 650 7 |a papyrologia |0 http: //www. yso. fi/onto/yso/p 8713 |x kreikan kieli |0 http: //www. yso. fi/onto/yso/p 684 |2 yso 650 7 |a papyrukset |x varhaiskeskiaika |z Bysantti |2 ysa 650 7 |a papyrukset |0 http: //www. yso. fi/onto/yso/p 21820 |x varhaiskeskiaika |0 http: //www. yso. fi/onto/yso/p 12352 |z Bysantti |0 http: //www. yso. fi/onto/ysa/Y 101044 |2 yso URIen tallentaminen haastavaa (voiko 0 -osakenttää toistaa näin? ) Monissa ketjuissa on mukana paikannimiä, mutta YSOssa ei vielä ole paikkoja.

Puretaan koko ketju? Ennen Jälkeen 650 7 |a papyrologia |x kreikan kieli |2 ysa

Puretaan koko ketju? Ennen Jälkeen 650 7 |a papyrologia |x kreikan kieli |2 ysa 650 7 |a papyrologia |2 yso |0 http: //www. yso. fi/onto/yso/p 8713 650 7 |a kreikan kieli |2 yso |0 http: //www. yso. fi/onto/yso/p 684 650 7 |a papyrukset |x varhaiskeskiaika |z Bysantti |2 ysa 650 7 |a papyrukset |2 yso |0 http: //www. yso. fi/onto/yso/p 21820 650 7 |a varhaiskeskiaika |2 yso |0 http: //www. yso. fi/onto/yso/p 12352 650 7 |a Bysantti |2 ysa |0 http: //www. yso. fi/onto/ysa/Y 101044 Poliittisesti haastava päätös. Paikannimien kanssa samantyyppiset (ohimenevät) ongelmat kuin edellisessä ratkaisussa.

Mitä tehdään Allärs-aiheille?

Mitä tehdään Allärs-aiheille?

Vaihdetaan ruotsinkieliseen ALLFO-termiin? (rekisteröidään tätä varten sanastokoodi “allfo”) Ennen Jälkeen 650 7 |a dikter

Vaihdetaan ruotsinkieliseen ALLFO-termiin? (rekisteröidään tätä varten sanastokoodi “allfo”) Ennen Jälkeen 650 7 |a dikter |2 allars 650 7 |a lyrik |2 allars 650 7 |a dikter |2 allfo |0 http: //www. yso. fi/onto/yso/p 24644 650 7 |a lyrik |2 allfo |0 http: //www. yso. fi/onto/yso/p 1365 650 7 |a runot |2 ysa 650 7 |a runot |2 yso |0 http: //www. yso. fi/onto/yso/p 24644 Termit pysyvät samankielisinä kuin alkuperäisissä tietueissa. Jos tietue oli kuvailtu sekä YSAlla että Allärsilla, konversion jälkeen molemmat kuvailut on esitetty YSOlla, mutta eri tavoilla ja mahdollisesti toisteisesti. 0 -osakentän URIen avulla on kuitenkin mahdollista havaita toisteisuus,

Käytetään ruotsinkielistä termiä ja kielikoodia? (ei rekisteröidä erillistä sanastokoodia) Ennen Jälkeen 650 7 |a

Käytetään ruotsinkielistä termiä ja kielikoodia? (ei rekisteröidä erillistä sanastokoodia) Ennen Jälkeen 650 7 |a dikter |2 allars 650 7 |a lyrik |2 allars 650 7 |a dikter |2 yso |9 <LNG>swe |0 http: //www. yso. fi/onto/yso/p 24644 650 7 |a lyrik |2 yso |9<LNG>swe |0 http: //www. yso. fi/onto/yso/p 1365 650 7 |a runot |2 ysa 650 7 |a runot |2 yso |9<LNG>fin |0 http: //www. yso. fi/onto/yso/p 24644 Termit pysyvät samankielisinä kuin alkuperäisissä tietueissa. Jos tietue oli kuvailtu sekä YSAlla että Allärsilla, konversion jälkeen molemmat kuvailut on esitetty YSOlla, mutta eri tavoilla ja mahdollisesti toisteisesti. 0 -osakentän URIen avulla on kuitenkin mahdollista havaita toisteisuus, Kielikoodille ei ole virallista paikkaa 650 -kentässä, joten tässä käytetty paikallisesti määriteltävää 9 -osakenttää.

Käytetään aina pelkkää suomenkielistä termiä? Ennen Jälkeen 650 7 |a dikter |2 allars 650

Käytetään aina pelkkää suomenkielistä termiä? Ennen Jälkeen 650 7 |a dikter |2 allars 650 7 |a lyrik |2 allars 650 7 |a runot |2 yso |0 http: //www. yso. fi/onto/yso/p 24644 650 7 |a lyriikka |2 yso |0 http: //www. yso. fi/onto/yso/p 1365 650 7 |a runot |2 ysa Ruotsinkieliset termit katoavat tietueista kokonaan. (tuskin hyväksyttävä lopputulos esim. Åbo Akademin kannalta) Päällekkäisyydet YSA/Allärs-kuvailussa tulevat eliminoiduiksi.

Käytetään sekä suomen- että ruotsinkielisiä termejä? Ennen Jälkeen 650 7 |a dikter |2 allars

Käytetään sekä suomen- että ruotsinkielisiä termejä? Ennen Jälkeen 650 7 |a dikter |2 allars 650 7 |a lyrik |2 allars 650 7 |a runot |2 yso |0 http: //www. yso. fi/onto/yso/p 24644 650 7 |a lyriikka |2 yso |0 http: //www. yso. fi/onto/yso/p 1365 650 7 |a runot |2 ysa 650 7 |a dikter |2 allfo |0 http: //www. yso. fi/onto/yso/p 24644 650 7 |a lyrik |2 allfo |0 http: //www. yso. fi/onto/yso/p 1365 Kaikkiin tietueisiin tulisi sekä suomen- että ruotsinkieliset YSO-termit. Päällekkäisyys eliminoidaan, mutta samat aiheet esitetään kahteen kertaan. Rikastus kahdelle kielelle pitäisi automatisoida, jotta tieto pysyy yhdenmukaisena. Kielten erottelu voidaan tässäkin vaihtoehdossa tehdä joko sanastokoodilla (yso/allfo, kuten yllä) tai kielikoodilla (9 -osakenttä).

Jätetäänkö YSA- ja Allärs-aiheet tietueisiin?

Jätetäänkö YSA- ja Allärs-aiheet tietueisiin?

Ei jätetä, jos konversio onnistui häviöttömästi Ennen Jälkeen 650 7 |a runot |2 ysa

Ei jätetä, jos konversio onnistui häviöttömästi Ennen Jälkeen 650 7 |a runot |2 ysa 650 7 |a runot |2 yso |0 http: //www. yso. fi/onto/yso/p 24644 650 7 |a papyrologia |x kreikan kieli |2 ysa 650 7 |a papyrologia |2 yso |0 http: //www. yso. fi/onto/yso/p 8713 Jos päätetään, että YSOlla ei ketjuteta, ketjujen tapauksessa joudutaan tietueisiin jättämään myös alkuperäiset YSA/Allärs-aiheet, koska niitä ei pysty häviöttömästi esittämään YSOlla

Jätetään aina Ennen Jälkeen 650 7 |a runot |2 ysa 650 7 |a runot

Jätetään aina Ennen Jälkeen 650 7 |a runot |2 ysa 650 7 |a runot |2 yso |0 http: //www. yso. fi/onto/yso/p 24644 650 7 |a papyrologia |x kreikan kieli |2 ysa 650 7 |a papyrologia |2 yso |0 http: //www. yso. fi/onto/yso/p 8713 Tietueiden koko kasvaa reilusti

Miten konversio toteutetaan käytännössä eri tietokantoihin?

Miten konversio toteutetaan käytännössä eri tietokantoihin?

Konversiotyökalu Voisi olla esim. Java-ohjelma (executable JAR), jolle annetaan MARC-tietueita: java -jar YSO-convert. jar

Konversiotyökalu Voisi olla esim. Java-ohjelma (executable JAR), jolle annetaan MARC-tietueita: java -jar YSO-convert. jar input. mrcx output. mrcx Kansalliskirjasto(? ) tuottaisi työkalun ja ohjeistuksen käyttöön. Konversio pitäisi toteuttaa mahdollisimman samanaikaisesti kaikkiin tietokantoihin.

Replikoinnin vaikutukset Jos konversiota ei tehdä samaan aikaan kaikissa Melinda-kirjastoissa, miten replikointi toimii, kun

Replikoinnin vaikutukset Jos konversiota ei tehdä samaan aikaan kaikissa Melinda-kirjastoissa, miten replikointi toimii, kun paikalliskannassa on YSAa/Allärsia ja Melindassa YSOa? Pitäisikö replikointisääntöihin lisätä automaattinen konversio YSOon?

Kiitos http: //tinyurl. com/ysa-yso-suunnittelu

Kiitos http: //tinyurl. com/ysa-yso-suunnittelu