TEI Cvetana Krstev TEI Text Encoding Initiative n

  • Slides: 58
Download presentation
TEI Cvetana Krstev

TEI Cvetana Krstev

TEI — Text Encoding Initiative n n Inicijativa za obeležavanje teksta www. tei-c. org

TEI — Text Encoding Initiative n n Inicijativa za obeležavanje teksta www. tei-c. org Projekat su 1987. godine otpočele tri asocijacije: q q q n ACH — Association of Computer in the Humanities ALLC — Association of Literary and Linguistic Computing ACL — Association for Computational Linguistics Kao rezultat rada na ovom projektu objavljene su 1994. godine preporuke za obeležavanje i razmenu elektronskih tekstova Guidelines for Electronic Text Encoding and Interchange.

Šta je TEI? DTD, XML Schema, jezik za obeležavanje, preporuke za n U toku

Šta je TEI? DTD, XML Schema, jezik za obeležavanje, preporuke za n U toku rada na projektu je odlučeno da je SGML pogodan obeležavanje. . . n n okvir za razvoj TEI projekta. Najopštije govoreći, dok je SGML sredstvo za definisanje jezika za obeležavanje, TEI je trebalo da definiše jedan takav jezik, koji bi se po potrebi mogao prilagođavati i dopunjavati, za potrebe istraživanja u oblasti “društvenih nauka”. Tekstovi u mašinski čitljivom obliku koji su namenjeni istraživanju samo ponekad obeležavaju njegov mogući, ili budući, izgled, već obično sadrže mnogo drugih različitih informacija, kao što su bibliografske informacije, informacije o logičkoj strukturi teksta, informacije koje se tiču semantičkih i lingvističkih elemenata unutar teksta. TEI je 2002. godine u potpunosti prešao na XML.

TEI danas n Važeće su preporuke: q q n n n P 5: Guidelines

TEI danas n Važeće su preporuke: q q n n n P 5: Guidelines for Electronic Text Encoding and Interchange Version 3. 1. 0. Last updated on 15 th December 2016 TEI zajednica je formulisala preporuke i pravila, a ne standard, za obeležavanje dokumenata, jer se smatra da naučnicima treba ostaviti slobodu odlučivanja šta će obeležiti u tekstu, tj. šta je za njih važno. Vrlo širok asortiman mogućnosti za kodiranje teksta je predstavljen u TEI Preporukama, tako da ovaj dokument ne treba shvatiti ako udžbenik već kao referensnu literaturu. Savladavanje kompletnog TEI je veoma zahtevno, ali za mnoge potrebe i nije neophodno kompletno znanje TEI.

TEI Lite n n n Zato je napravljen jedan podskup TEI šeme kodiranja koji

TEI Lite n n n Zato je napravljen jedan podskup TEI šeme kodiranja koji je nazvan TEI Lite, i koji trenutno opisuje 145 elemenata. http: //www. tei-c. org/release/doc/tei-p 5 exemplars/html/tei_lite. doc. html Na početku je bio zamišljen kao lak uvod u TEI i vrsta didaktičkog materijala, ali je od njegovog nastanka 1995. postao najpopularnija kastomizacija TEI jer se pokazalo da pokriva potrebe “ 90% TEI zajednice u 90% slučajeva”.

TEI moduli n n n TEI preporuke specifikuju 503 elementa i 210 atributa koji

TEI moduli n n n TEI preporuke specifikuju 503 elementa i 210 atributa koji su organizovani u module. Neki od ovih modula su obavezni, a neki se uključuju po potrebi, i tako svaki korisnik dobija svoj jezik za obeležavanje. TEI definiše 21 modul: q q TEI infrastruktura – u njoj se definišu zajednički tipovi podataka i klase koje se koriste za definisanje elemenata i atributa u drugim modulima; TEI header – zaglavlje TEI (više kasnije)

TEI moduli (2) q q q q Elementi koji se mogu javiti u svim

TEI moduli (2) q q q q Elementi koji se mogu javiti u svim tipovima dokumenata – paragrafi, liste elemenata, citati, uredničke intervencije, unakrsne reference, bibliografske reference, itd. Pretpostavljena struktura dokumenta – opisuje prednji deo dokumenta, centralni deo (telo) i zadnji deo dokumenta. Reprezentacija nestandardnih karaktera i glifova Poezija (stihovi) Tekstovi namenjeni izvođenju (drama) Transkripcija govora Rečnici Opis rukopisa

TEI moduli (3) q q q Reprezentacija primarnih izvora Kritički aparat Imena, datumi, ljudi

TEI moduli (3) q q q Reprezentacija primarnih izvora Kritički aparat Imena, datumi, ljudi i mesta Tabele, formule, grafikoni Jezički korpusi Povezivanje, segmentacija i poravnavanje – za složene unakrsne reference Jednostavni analitički mehanizmi – za povezivanje s analizom i interpretacijom teksta Struktura svojstava Grafovi, mreže i drveta Pouzdanost i odgovornost – koliko je pouzdano TEI kodiranje i ko je odgovoran Elementi za dokumentaciju

Kako se od ovih modula formira kastomiziran (prilagođen) TEI jezik? n n n Da

Kako se od ovih modula formira kastomiziran (prilagođen) TEI jezik? n n n Da bi se koristi TEI za obeležavanje teksta, korisnici moraju da obezbede korišćenje TEI prostora imena (http: //www. tei-c. org/ns/1. 0) i da se pridržavaju zahteva testualnog modela koji TEI predlaže. Da bi se obezbedila ova usklađenost, preporučuje se povezivanje TEI tekstova sa formalnom reprezenatcijom ovog tekstualnog modela. Formalne strukturne gramatike TEI komaptibilnog model a se mogu izraziti na različite načine, a nazivaju se TEI šeme. q q q n n Ti načini su Document Type Definition (http: //www. w 3. org/TR/REC-xml/#dtdoctype), W 3 C XML Schema (http: //www. w 3. org/XML/Schema), RELAX NG schema language (http: //www. relaxng. org/). Ne postoji jedinstvena TEI šema već se očekuje da korisnik izabere elemente i atribute iz njemu potrebnih modula i da ih eventualno dopuni i promeni tamo gde je potrebno. Posebna je pogodnost što se ovaj apstraktni tekstuelni model i sam može izraziti kao TEI tekst, korišćenjem elemenata dokumentacije iz za to namenjenog modula.

Minimalna TEI kastomizacija <TEI xmlns="http: //www. tei-c. org/ns/1. 0" xml: lang="en"> <tei. Header> Obavezni

Minimalna TEI kastomizacija <TEI xmlns="http: //www. tei-c. org/ns/1. 0" xml: lang="en"> <tei. Header> Obavezni element svakog TEI dokumenta <file. Desc> <title. Stmt> <title>A TBE customisation</title> <author>The TBE Crew</author> </title. Stmt> <publication. Stmt><p>for use by whoever wants it</p> </publication. Stmt> <source. Desc><p>created on Thursday 24 th July 2008 10: 20: 17 AM by the form at http: //www. tei-c. org/Roma/</p> </source. Desc> </file. Desc> </tei. Header>

Minimalna TEI kastomizacija (2) <text> <front> </front> <body> Obavezni element svakog TEI dokumenta <div.

Minimalna TEI kastomizacija (2) <text> <front> </front> <body> Obavezni element svakog TEI dokumenta <div. Gen type="toc"/> Specifikacija TEI šeme <p>My TEI Customization starts with modules tei, core, header, and textstructure</p> <schema. Spec ident="TBEcustom" doc. Lang="en" xml: lang="en" prefix=""> <module. Ref key="tei"/> <module. Ref key="header"/> <module. Ref key="core"/> <module. Ref key="textstructure"/> </schema. Spec> </body> </text> Minimalni skup modula koje TEI šema </TEI> mora sadržati

TEI dokument koji je validan u odnosu na prethodno definisanu TEI šemu <TEI xmlns="http:

TEI dokument koji je validan u odnosu na prethodno definisanu TEI šemu <TEI xmlns="http: //www. tei-c. org/ns/1. 0"> <tei. Header> <file. Desc> <title. Stmt> <title>A sample TEI document</title> </title. Stmt> <publication. Stmt> <publisher> KANTL </publisher> <pub. Place>Ghent</pub. Place> <date when="2009"/> </publication. Stmt> <source. Desc> <p>No source, born digital</p> </source. Desc> </file. Desc> </tei. Header> <text> <body> <p>This is a sample paragraph, illustrating a <name type="organisation">TEI</name> document. </p> </body> </text> </TEI>

TEI header – TEI zaglavlje n n TEI preporuke zahtevaju da svakom primerku TEI

TEI header – TEI zaglavlje n n TEI preporuke zahtevaju da svakom primerku TEI teksta prethode opšti meta-podaci koji se smeštaju u TEI zaglavlje (kao i TEI dokument) može da bude veoma složeno i da sadrži veoma detaljne podatke. U TEI zaglavlju se ne nalazi tekst dokumenta, već podaci o njemu, što nalikuje podacima u bibliotečkom katalogu. Razlikuje se od ostatka TEI dokumenta jer ima mnogo strožu organizaciju, precizirano je koji su elementi obavezni.

Kataloški listić – MARC zapis – TEI zaglavlje

Kataloški listić – MARC zapis – TEI zaglavlje

Kataloški listić – MARC zapis – TEI zaglavlje (2)

Kataloški listić – MARC zapis – TEI zaglavlje (2)

Kataloški listić – MARC zapis – TEI zaglavlje (3) <tei. Header> <file. Desc> <title.

Kataloški listić – MARC zapis – TEI zaglavlje (3) <tei. Header> <file. Desc> <title. Stmt> <title>The Wild Ass's Skin: an electronic edition</title> </title. Stmt> <publication. Stmt> <p>Published as an example for the header module of TBE. </p> </publication. Stmt> <source. Desc> <p>Honoré de Balzac (1906). The Wild Ass's Skin. </p> </source. Desc> </file. Desc> </tei. Header>

Od čega se sastoji TEI zaglavlje n Sastoji se od četiri glavna dela: q

Od čega se sastoji TEI zaglavlje n Sastoji se od četiri glavna dela: q q <file. Desc> (file description): bibliografski opis elektronskog teksta <encoding. Desc> (encoding description): opis veze elektronskog teksta i izvora <profile. Desc> (profile description): opis konteksta u kome je etekst stvoren i informacije vezane za klasifikaciju <revision. Desc> (revision description): opis istorije revizija eteksta Jedini obavezan element je bibliografski opis e-teksta <file. Desc>, ostali elementi ako se pojavljuju moraju da idu u navedenom redosledu.

Od čega se sastoji bibliografski opis eteksta n n n n <title. Stmt> (title

Od čega se sastoji bibliografski opis eteksta n n n n <title. Stmt> (title statement): grupiše informacije o naslovu e-teksta i ko je odgovoran za sadržaj <edition. Stmt> (edition statement): grupiše informacije koje se odnose na izdanje e-teksta <extent>: opisuje približnu veličinu e-teksta <publication. Stmt> (publication statement): grupiše informacije koje se tiču izdavanja ili distribucije e-teksta <series. Stmt> (series statement): grupiše informacije o seriji u okviru koje je etekst izdat <notes. Stmt> (notes statement): prikuplja sve zabeleške koje pružaju informacije o e-tekstu, a koje nisu zabeležene u drugim delovima bibliografskog opisa <source. Desc> (source description): opisuje izvor iz koga je e-tekst izveden ili generisan Obavezni delovi su samo <title. Stmt> <publication. Stmt> <source. Desc>

Od čega se sastoji iskaz o naslovu? <title. Stmt> n n n n <title>:

Od čega se sastoji iskaz o naslovu? <title. Stmt> n n n n <title>: sadrži naslov e-teksta <author>: sadrži ime autor(a) e-teksta <editor>: sadrži ime urednika e-teksta <sponsor>: specifikuje ime organizacije ili institucije koja je bila sponzor realizacije e-teksta <funder>: specifikuje ime stranke koja je finansirala realizaciju e-teksta <principal>: navodi se ime glavnog istraživača koji je odgovoran za nastanak eteksta <resp. Stmt> (statement of responsibility): navodi se izjava o intelektualnoj odgovornosti za sadržaj e-teksta, tamo gde specijalni elementi za autore i urednike nisu dovoljni ili se ne mogu primeniti. U okviru njega se mogu koristiti <name> i <resp> u okviru kojih se navodi ime odgovorne strane i za šta je odgovorna. Samo je element <title> obavezan, svi elementi se mogu ponavljati i redosled je proizvoljan. Svi ovi elementi, osim teksta, mogu da sadrže i druge elemente iz TEI osnovnog modula koji su na fraznom nivou (npr. delovi pasusa).

Primer - <title. Stmt> - početak <title. Stmt> <title>The Wild Ass's Skin: an electronic

Primer - <title. Stmt> - početak <title. Stmt> <title>The Wild Ass's Skin: an electronic edition</title> <author>Honoré de Balzac</author> <editor>The TBE crew</editor> <resp. Stmt> <name>Ellen Marriage</name> <resp>translation</resp> </resp. Stmt> <name>George Saintsbury</name> <resp>preface</resp> </resp. Stmt> <name>Ron Van den Branden</name> <resp>transcription</resp> <resp>annotation</resp> </resp. Stmt>

Primer - <title. Stmt> - kraj <sponsor>Association for Literary and Linguistic Computing (ALLC)</sponsor> <sponsor>Centre

Primer - <title. Stmt> - kraj <sponsor>Association for Literary and Linguistic Computing (ALLC)</sponsor> <sponsor>Centre for Computing in the Humanities (CCH) - King's College London</sponsor> <sponsor>University College London (UCL)</sponsor> <funder> <address> <addr. Line>Centre for Scholarly Editing and Document Studies (CTB)</addr. Line> <addr. Line>Royal Academy of Dutch Language and Literature</addr. Line> <addr. Line>Koningstraat 18</addr. Line> <addr. Line>9000 Gent</addr. Line> <addr. Line>Belgium</addr. Line> </address> <email>ctb@kantl. be</email> </funder> <principal>Edward Vanhoutte</principal> <principal>Melissa Terras</principal> </title. Stmt>

Od čega se sastoji izjava o izdanju? <edition. Stmt> n n <p> | <edition>:

Od čega se sastoji izjava o izdanju? <edition. Stmt> n n <p> | <edition>: opis izdanja, bilo kao slobodan tekst organizovan po pasusima (<p>), ili korišćenjem posebnog elementa <edition> <resp. Stmt>: sadrži opis odgovornosti koje su specifične za tekuće izdanje Opis izdanja mora da se navede, bilo u okviru pasusa bilo u okviru elementa <edition>, ali ne u oba. Element <edition> se ne može ponavljati.

Primer - <edition. Stmt> <edition n="2. 0"> <title>Version 2. 0, enriched with thematic annotations.

Primer - <edition. Stmt> <edition n="2. 0"> <title>Version 2. 0, enriched with thematic annotations. </title> <date when="2010">2010</date> </edition> <resp. Stmt> <name>Melissa Terras</name> <resp>Added thematic annotations. </resp> </resp. Stmt> </edition. Stmt>

Kako se specifikuje veličina e-teksta? <extent> Element <extent> ne sadrži druge elemente, već se

Kako se specifikuje veličina e-teksta? <extent> Element <extent> ne sadrži druge elemente, već se u okviru njega samo navodi neki tekstualni sadržaj koji opisuje veličinu e-teksta. n Primeri: <extent>572 Kb</extent> <extent>1 5. 25" floppy disk (720 Kb)</extent> n

Od čega se sastoji izjava o izdavanju? <publication. Stmt> n n n <p> |

Od čega se sastoji izjava o izdavanju? <publication. Stmt> n n n <p> | <publisher> | <distributor> | <authority>: opis izdanja, bilo kao slobodan tekst organizovan u pasuse (<p>) ili posebnim elementima za identifikaciju izdavača (<publisher>), distributera (<distributor>), ili neke druge strane (<authority>) koja je učinila e-tekst dostupnim <pub. Place>: mesto izdavanja e-teksta <address>: adresa izdavača e-teksta <idno>: neki standardan bibliografski identifikacioni kod e-teksta (kao ISBN, LCCN, DOI, itd. ) <availability>: izjava o dostupnosti i uslovima korišćenja e-teksta <date>: datum izdavanja e-teksta I u ovom slučaju većina ovih elemenata može osim teksta da sadrži druge elemente koji su na fraznom nivou. Na primer, element <address> mora da sadrži bar generički element <addr. Line> u kome je jedan red iz adrese ili specifičnije elemente <street>, <name>, <post. Code>, or <post. Box>

Primer - <publication. Stmt> <publisher>Centre for Scholarly Editing and Document Studies (CTB)</publisher> <distributor>Centre for

Primer - <publication. Stmt> <publisher>Centre for Scholarly Editing and Document Studies (CTB)</publisher> <distributor>Centre for Computing in the Humanities (CCH) - King's College London</distributor> <pub. Place>Gent</pub. Place> <address> <name type="institution">Centre for Scholarly Editing and Document Studies (CTB)</name> <name type="institution">Royal Academy of Dutch Language and Literature</name> <street>Koningstraat 18</street> <post. Code>9000</post. Code> <name type="city">Gent</name> <name type="country">Belgium</name> </address> <idno type="ISBN">0 -00 -000000 -0</idno> <availability status="free"> <p>Published under a <ref target="http: //creativecommons. org/licenses/bysa/3. 0/">Creative Commons Attribution Share. Alike 3. 0 License</ref>. </p> </availability> <date when="2010 -01 -01">1 January 2010</date> </publication. Stmt>

Od čega se sastoji izjava o seriji? <series. Stmt> n n n <p> |

Od čega se sastoji izjava o seriji? <series. Stmt> n n n <p> | <title>: opis serije, ili kao slobodan tekst organizovan u pasuse (<p>) ili imenovanjem serije u okviru elementa <title> <idno>: standardni bibliografski broj serije u okviru koje je izdat e-tekst <resp. Stmt>: izjava o odgovornosti za realizaciju serije (kao i ranije, sadrži elemente <name> i <resp>)

Primer - <series. Stmt> <title>The TBE collection: sample texts encoded with TEI. </title> <idno

Primer - <series. Stmt> <title>The TBE collection: sample texts encoded with TEI. </title> <idno type="ISSN">0000 -0001</idno> <idno type="installment">1</idno> <resp. Stmt> <name>Edward Vanhoutte</name> <resp>compiler</resp> </resp. Stmt> </series. Stmt>

Šta su izjave koje sadrže beleške? <notes. Stmt> <note> - sadrži napomenu u vidu

Šta su izjave koje sadrže beleške? <notes. Stmt> <note> - sadrži napomenu u vidu slobodnog teksta. Ovaj element se može ponavljati. n Primer: <notes. Stmt> <note>OCR scanning done at KANTL, Gent. </note> </notes. Stmt> n

Šta sadrži izjava o izvoru? <source. Desc> n <p> | <bibl. Struct> | <bibl.

Šta sadrži izjava o izvoru? <source. Desc> n <p> | <bibl. Struct> | <bibl. Full> | <list. Bibl>: bibliografski opis izvora kao: q q <p> - slobodan tekst organizovan po pasusima; Primer (ako nema izvora, a ovaj element je obavezan): <source. Desc> <p>No source, born digital. </p> </source. Desc> q Formalni bibliografski opis koji može da bude: n n <bibl> - slobodan opis, <bibl. Struct> - strukturirani opis, <bibl. Full> - iscrpna opis); <list. Bibl> - lista bibliografskih refrenci.

Šta podrazumeva slobodan bibliografski opis <bibl>? n Podrazumeva se slobodan bibliografski opis gde se

Šta podrazumeva slobodan bibliografski opis <bibl>? n Podrazumeva se slobodan bibliografski opis gde se u okviru teksta javljaju elementi opisa, od kojih se načešće koriste: q Za odgovornost: n q <author>, <editor>, <distributor>, <publisher>, <funder>, <principal>, <sponsor>, <resp. Stmt>; Za izdanje: n <title>, <date>, <pub. Place>, <edition>, <series>, <idno>, <bibl. Scope>, <extent>

Primeri - <source. Desc> - jednostavan ili sa <bibl> Verzija 1 (<p>): <source. Desc>

Primeri - <source. Desc> - jednostavan ili sa <bibl> Verzija 1 (<p>): <source. Desc> <p>The Wild Ass's Skin by Honoré de Balzac. London : Dent, 1906. xv, 288 p. Translated by Ellen Marriage ; preface by George Saintsbury. </p> </source. Desc> n Verzija 2 (<bibl>): <source. Desc> <bibl>The Wild Ass's Skin by Honoré de Balzac. London : Dent, 1906. xv, 288 p. Translated by Ellen Marriage ; preface by George Saintsbury. </bibl> </source. Desc> n

Primeri - <source. Desc> - jednostavan ili sa <bibl> (nastavak) Verzija 3 (<bibl>, formalnije):

Primeri - <source. Desc> - jednostavan ili sa <bibl> (nastavak) Verzija 3 (<bibl>, formalnije): <source. Desc> <bibl><title>The Wild Ass's Skin</title> by <author>Honoré de Balzac</author>. <pub. Place>London</pub. Place> : <publisher>Dent</publisher>, <date when="1906">1906</date>. <extent>xv</extent>, <extent>288 p. </extent> Translated by <editor role="translator">Ellen Marriage</editor> ; preface by <editor role="preface">George Saintsbury</editor>. </bibl> </source. Desc> n

Šta podrazumeva strukturirani bibliografski opis <bibl. Struct>? n Strukturirani bibliografski opis može biti na

Šta podrazumeva strukturirani bibliografski opis <bibl. Struct>? n Strukturirani bibliografski opis može biti na tri nivoa: q <analytic>: bibliografski opis stavke koja je objavljena u okviru monografije ili časopisa: n q <monogr>: bibliografski opis stavke koja je izdata kao nezavisna: n q <title>, <author>, <editor>, <resp. Stmt>, <title>, <imprint> (u okviru koje: <distributor>, <pub. Place>, <publisher>, <date>), <bibl. Scope>, <note> <series>: bibliografski opis serije u okviru koje je delo objavljeno: n <title>, <editor>, <resp. Stmt>, <bibl. Scope>

Primer - <bibl. Struct> <source. Desc> <bibl. Struct> <monogr> <title>The Wild Ass's Skin</title> <author>Honoré

Primer - <bibl. Struct> <source. Desc> <bibl. Struct> <monogr> <title>The Wild Ass's Skin</title> <author>Honoré de Balzac</author> <editor role="translator">Ellen Marriage</editor> <editor role="preface">George Saintsbury</editor> <imprint> <pub. Place>London</pub. Place> <publisher>Dent</publisher> <date when="1906">1906</date> </imprint> <extent>xv</extent> <extent>288 p. </extent> </monogr> </bibl. Struct> </source. Desc>

Šta podrazumeva poptuni bibliografski opis <bibl. Full>? n <bibl. Full> je najiscrpniji bibliografski opis

Šta podrazumeva poptuni bibliografski opis <bibl. Full>? n <bibl. Full> je najiscrpniji bibliografski opis izvora e-teksta koji je organizovan u iste kategorije kao i opis datoteke za sam e-tekst: (naravno, bez odeljka <source. Desc>): q q q obavezan iskaz o naslovu (<title. Desc>), opcioni iskazi o izdanju (<edition. Stmt>), i veličini (<extent>), obavezna iskaz o izdavanju (<publication. Stmt>), i skaz o seriji (<series. Stmt>), uz možda još neke bibliografske napomene (<notes. Stmt>).

<encoding. Desc> n n Encoding Description – opis kodiranja – drugi segment TEI zaglavlja;

<encoding. Desc> n n Encoding Description – opis kodiranja – drugi segment TEI zaglavlja; Služi da dokumentuje veze između elektronskog teksta i njegovog izvora; Može da bude u formi slobodnog teksta (jedan ili više pasusa <p>) ili korišćenjem bar jednog specifičnog elementa. To su deskriptivni odeljci : q q <editorial. Decl> (editorial practise declaration): opisuje uredničke principe korišćene za transkripciju <project. Desc> (project description): opis projekata u okviru kojih je e-tekst nastao

<encoding. Desc> n Dodatni elementi: q q q n <tags. Decl> (tagging declaration): informacija

<encoding. Desc> n Dodatni elementi: q q q n <tags. Decl> (tagging declaration): informacija o etiketama koje su korišćene za kodiranje e-teksta <refs. Decl> (reference system declaration): deklaracija referensnih sistema korišćenih za kodiranje e-teksta <class. Decl> (classification declaration): deklaracija klasifikacionih šema korišćenih za klasifikovanje e-teksta (koje se obavlja negde drugde u zaglavlju) Elementi za specifičnu upotrebu: q q <met. Decl> (metrical notation declaration): deklaracija notacije za metričku analizu poezije – samo uz modul Poetry <variant. Encoding/>: deklariše metod korišćen za kodiranje kritičkih varijanti teksta – samo uz modul Scholary Editing

<editorial. Decl> n Može da sadrži opis kao slobodan tekst (<p>), ili da sadrži

<editorial. Decl> n Može da sadrži opis kao slobodan tekst (<p>), ili da sadrži bar jedan od sledećih elemenata: q <correction>: opisuje da li su, kada i koliko ispravljane greške u tekst. Atributi: n n q @status – stepen korekcije (low, medium, high, ili unknown); @method – da li su korekcije obavljene ali nisu označene ili su sve korekcije obeležene. <normalization>: opisuje da li je, kada i koliko tekst normalizovan. Atributi: n n @source - ukazuje ko je obavio normalizaciju @method – da li je normalizacija obavljena bez označavanja ili je obeležena.

<editorial. Decl> - nastavak n <quotation>: opisuje kako je postupano sa navodnicima iz originalnog

<editorial. Decl> - nastavak n <quotation>: opisuje kako je postupano sa navodnicima iz originalnog teksta. Atributi: q n <hyphenation>: opisuje kako je podela reči iz originala tretirana u e-tekstu. Atributi: q n @marks - beleži u kolikoj meri su navodnici zadržani u tekstu (none, some, ili all), @eol – beleži kako je i u kolikoj meri podela reči na kraju retka iz originala zadržana u e-tekstu (none, some, all, ili hard). <interpretation>: opisuje koje su informacije vezane za interpretaciju dodate tekstu, osim onih vezanih za transkripciju

Primer - <editorial. Decl> <correction method="markup"> <p>Apparent errors have been corrected using the <sic>

Primer - <editorial. Decl> <correction method="markup"> <p>Apparent errors have been corrected using the <sic> / <corr> elements, wrapped in a <choice> element. </p> </correction> <normalization method="markup" source="http: //www. oed. com/"> <p>Spelling has been modernised using the <orig> / <reg> elements, wrapped in a <choice> element. </p> </normalization> <quotation marks="all"> <p>Diplomatic transcription, all original quotation marks have been retained and normalised to double quotation marks. </p> </quotation> <hyphenation eol="none"> <p>End-of-line hyphenation has been removed. All other hyphenation has been retained. </p> </hyphenation> <interpretation> <p>Thematic analysis added, studying the main motifs. </p> <p>Names and dates are marked. </p> </interpretation> </editorial. Decl>

<project. Decl> Daju se ciljevi i namena e-teksta, i druge slične informacije n Struktura

<project. Decl> Daju se ciljevi i namena e-teksta, i druge slične informacije n Struktura je jednostavma; sastoji se samo od jednog ili više pasusa (<p>) n Primer: <project. Desc> <p>Text encoded for <so. Called>The TBE collection: sample texts encoded with TEI</so. Called>, aiming at providing a collection of prime exemplar TEI encoded materials. </p> </project. Desc> n

<tags. Decl> n Opisuje XML elemente koji su korišćeni za obeležavanje teksta: q <namespace>:

<tags. Decl> n Opisuje XML elemente koji su korišćeni za obeležavanje teksta: q <namespace>: formalno identifikuje prostor imena kome pripadaju XML elementi koji se dokumentuju u njegovom podređenom elementu: n <tag. Usage> - za svaki različiti element koji se javlja unutar e-teksta (bez zaglavlja) koristi se jedan ovaj element. Atributi: q q q @gi – naziv XML etikete; @occurs – broj pojavljivanja te etikete u e-tekstu; @with. Id - broj pojavljivanja te etikete u e-tekstu sa jedinstvenim identifikacionim kodom; @render – standardan način prikazivanja tog elementa; <rendition>: deklariše se način prikazivanja jednog ili više XML elemenata u e-tekstu.

Primer - <tag. Decl> <tags. Decl> <namespace name="http: //www. tei-c. org/ns/1. 0"> <tag. Usage

Primer - <tag. Decl> <tags. Decl> <namespace name="http: //www. tei-c. org/ns/1. 0"> <tag. Usage gi="div" occurs="300" with. Id="300" render="#division">Marks text divisions in the source text. </tag. Usage> <tag. Usage gi="p" occurs="8302" with. Id="8300" render="#paragraph">Marks paragraphs in the source text. </tag. Usage> <!-- <tag. Usage> elements for all other distinct elements --> </namespace> </tags. Decl>

<refs. Decl> n n U okviru ovog elementa se opisuju sve referensne šeme koje

<refs. Decl> n n U okviru ovog elementa se opisuju sve referensne šeme koje se koriste u okviru e-teksta, bilo kao slobodan tekst (jedan ili više <p>), bilo korišćenjem specifičnih elemenata (nećemo ih ovde navoditi) Primer: <refs. Decl> <p>The paragraphs in the text are numbered with the <att>n</att> attribute. Each number consists of four digits; numbering is consecutive throughout the book. For example: <val>0203</val> numbers the 203 th paragraph throughout the book. </p> <p>Each chapter is identified with a formal identification code inside the <att>xml: id</att> attribute. Chapters are numbered using arabic numerals. The codes are composed by concatenating the identification codes for all ancestor text divisions down to the chapter level, with the dot as separation marker. For example: <val>I. 2. 3</val> identifies the third chapter of the second book of the first volume. </p> </refs. Decl>

<class. Decl> n n n Koristi se ako je potrebno da se e-tekst klasifikuje

<class. Decl> n n n Koristi se ako je potrebno da se e-tekst klasifikuje korišćenjem neke klasifikacione šeme ili taksonomije. Sama klasifikacija se obavlja u trećem delu TEI zaglavlja (kasnije) Svaka od klasifikacionih šema koje se koriste u e-tekstu mora se definisati u zasebnom elementu q <taxonomy>: definiše tipologiju koja se koristi za klasifikaciju teksta, koja može da bude neka postojeća šema ili sopstvena šema. Atributi: n q @xml: id – identifikator klasifikacione šeme Ako se taksonomija odnosi na postojeću klasifikacionu šemu, nju treba opisati unutar elementa <bibl>.

Primer - <class. Decl> <taxonomy xml: id="DDC"> <bibl> <title>Dewey Decimal Classification</title> <edition>Abridged Edition 14</edition>

Primer - <class. Decl> <taxonomy xml: id="DDC"> <bibl> <title>Dewey Decimal Classification</title> <edition>Abridged Edition 14</edition> <ptr target="http: //www. oclc. org/dewey/versions/abridgededition 14/default. htm"/ > </bibl> </taxonomy> <taxonomy xml: id="lcsh"> <bibl> <title>Library of Congress Subject Headings</title> </bibl> </taxonomy> </class. Decl>

<profile. Desc> n n n Profile Description – opis profila – treći segment TEI

<profile. Desc> n n n Profile Description – opis profila – treći segment TEI zaglavlja; Služi da pruži različite nebibliografske informacije o etekstu; Može da bude u formi slobodnog teksta (jedan ili više pasusa <p>) ili korišćenjem bar jednog specifičnog elementa: q q q n <creation>: informacije o nastanku teksta; <lang. Usage>: informacija o jezicima korišćenim u tekstu; <text. Class>: klasifikacija sadržaja teksta u skladu sa klasifikacionom šemom Ako se koriste moduli za transkripciju ili korpuse, mogu se dodati još neki elementi.

<creation> n <creation> - ako postoje neki detalji koje treba zabeležiti o vremenu ili

<creation> n <creation> - ako postoje neki detalji koje treba zabeležiti o vremenu ili mestu nastanka teksta, kao slobodan tekst. q q Primer: <creation>Original written in <date when="1831">1831</date> in <name type="city">Paris</name>. </creation>

<lang. Usage> n <lang. Usage> - svaki jezik se opisuje u zasebnom elementu <language>

<lang. Usage> n <lang. Usage> - svaki jezik se opisuje u zasebnom elementu <language> q <language> - može da sadrži opis jezika ili dijalekta kao slobodan tekst. Atributi: n n @ident – identifikator jezika @usage - ako ima smisla, za svaki jezik se može dati u procentima koliko teksta je pokriveno tim jezikom; Važno je da se za identifikaciju jezika koriste standardni kodovi i da su oni u skladu sa vrednostima atributa @xml: lang kojim se identifikuju fraze na tom jeziku u e-tekstu. Primeri: <lang. Usage> <language ident="en" usage="98">English</language> <language ident="fr" usage="1">French</language> <language ident="ar" usage="1">Arabic</language> </lang. Usage> q

<text. Class> n Klasifikacija tekst u skladu sa izabranim klasifikacionim šemama, koriste se elementi:

<text. Class> n Klasifikacija tekst u skladu sa izabranim klasifikacionim šemama, koriste se elementi: q q q n <keywords>: lista ključnih reči; <class. Code>: klasifikacioni kod iz date klasifikacione šeme; <cat. Ref/>: lista pokazivača ka specifičnim kategorijama u datoj taksonomiji Pomoću ovih elemenata, klasifikacija se može obaviti na dva načina: q q Referisanje neke spoljašnje klasifikacione šeme, koja koristi predmetne odrednice (<keywords>) ili klasifikacione kodove (<class. Code>) Referisanje specifičnih kategorija iz neke unutrašnje klasifikacione šeme (definisane unutar dokumenta) (<cat. Ref/>)

Primeri - <text. Class> n Ključne reči: <keywords scheme="#lcsh"> <list> <item>Literature</item> <item>Fiction and juvenile

Primeri - <text. Class> n Ključne reči: <keywords scheme="#lcsh"> <list> <item>Literature</item> <item>Fiction and juvenile belles lettres</item> <item>Literature--Translations into English</item> </list> </keywords> n Kod klasifikacione šeme: <class. Code scheme="#DDC">843. 7</class. Code>

<revision. Desc> - opis promena n n Četvrti deo obaveznog TEI zaglavlja namenjen je

<revision. Desc> - opis promena n n Četvrti deo obaveznog TEI zaglavlja namenjen je za detaljan opis svih promena koje su učinjene na e-tekstu. <change> - element u kome se dokumentuje svaka od promena. Atributi: q q @when – ukazuje na datum kada je promena izvršena @who - ukazuje na osobu koja je obavila promenu. U okviru ovog atributa se može koristiti jedinstveni identifikator osobe zadužene za neki aspekt e-teksta, a koja je verovatno definisana u okviru pododeljka <title. Stmt> u okviru odeljka za opis datoteke TEI zaglavlja (prvi deo).

Primer - <revision. Date> <revision. Desc> <change when="2009 -03 -08" who="#MT">addition of thematic analysis</change>

Primer - <revision. Date> <revision. Desc> <change when="2009 -03 -08" who="#MT">addition of thematic analysis</change> <change when="2009 -03 -08" who="#Rvd. B">addition of explanatory notes</change> <change when="2008 -10 -25" who="#Rvd. B">spell check</change> <change when="2008 -08 -25" who="#Rvd. B">addition of phrase level markup</change> <change when="2008 -08 -20" who="#Rvd. B">file creation</change> </revision. Desc>

Sve o TEI zaglavlju n Deo zvaničnog tutorijala o korišćenju TEI sa sajta TEI

Sve o TEI zaglavlju n Deo zvaničnog tutorijala o korišćenju TEI sa sajta TEI q http: //teibyexample. org/modules/TBED 02 v 00. htm

Još jedan odeljak u okviru TEI zaglavlja <xeno. Data> n n Projekti ponekada proizvode

Još jedan odeljak u okviru TEI zaglavlja <xeno. Data> n n Projekti ponekada proizvode višestruke metapodatke za svoja dokumenta. Na primer, projekat može da ima bibliografsku bazu podataka o dokumentima koje objavljuje, a odatle može da generiše MARC zapis i TEI zaglavlje. U TEI zaglavlje se zatim mogu dodati ručno još neki podaci. Potom, kada se dokumenti objavljuju na vebu, mogu se generisati metapodaci u obliku Dablinskog jezgra, radi bolje vidljivosti. Ponekada se svi ovi podaci mogu čuvati u okviru samog dokumenta. Za smeštaj metapodataka koji nisu u TEI formatu koristi se element <xeno. Data> TEI zaglavlja, koji, ako postoji, mora doći iza <file. Desc> a ispred <revision. Desc>

Primer - <xeno. Data> <rdf: RDF> <cc: Work rdf: about=""> <dc: title>Applied Software Project

Primer - <xeno. Data> <rdf: RDF> <cc: Work rdf: about=""> <dc: title>Applied Software Project Management - review</dc: title> <dc: type rdf: resource="http: //purl. org/dc/dcmitype/Text"/> <dc: license rdf: resource="http: //creativecommons. org/licenses/by-sa/2. 0/uk/"/> </cc: Work> <cc: License rdf: about="http: //creativecommons. org/licenses/by-sa/2. 0/uk/"> <cc: permits rdf: resource="http: //web. resource. org/cc/Reproduction"/> <cc: permits rdf: resource="http: //web. resource. org/cc/Distribution"/> <cc: requires rdf: resource="http: //web. resource. org/cc/Notice"/> <cc: requires rdf: resource="http: //web. resource. org/cc/Attribution"/> <cc: permits rdf: resource="http: //web. resource. org/cc/Derivative. Works"/> <cc: requires rdf: resource="http: //web. resource. org/cc/Share. Alike"/> </cc: License> </rdf: RDF> RDF – prostor imena RDF – Resource Description Framework </xeno. Data> dc – prostor imena Dablinskog jezgra cc – prostor imena Creative Commons