Informcie okolo ns Kdovanie znakov GMR Koice Informcie

  • Slides: 11
Download presentation
Informácie okolo nás Kódovanie znakov GMRŠ Košice

Informácie okolo nás Kódovanie znakov GMRŠ Košice

Informácie okolo nás Od obrázkov k písmu n n Od 9. tisícročia pred n.

Informácie okolo nás Od obrázkov k písmu n n Od 9. tisícročia pred n. l. sa začali objavovať prvé viacfarebné kresby človeka a zvierat v pohybe Obrázkové písmo je prvý dôležitý krok ku vzniku hláskového písma Pred 5000 rokmi Féničania položili základy abecedy, v ktorej je základom zápis hlásky (s 22 znakmi s ľavosmerným spôsobom písania ), nie zápis celého slova Neskôr hláskové písmo prevzali Gréci, a vznikla latinka a čiastočne aj cyrilika GMRŠ Košice 2

Informácie okolo nás Kód n n V komunikácii je kód pravidlo prevod informácie (napríklad

Informácie okolo nás Kód n n V komunikácii je kód pravidlo prevod informácie (napríklad listu, slova alebo frázy) na inú formu alebo reprezentáciu, nie nevyhnutne rovnakého typu. Vo všeobecnosti je kód zobrazenie, ktoré každému znaku alebo postupnosti znakov daného súboru znakov (vzorov) jednoznačne priradí znak alebo postupnosť znakov (obrazov) z iného súboru znakov. Postup, pomocou ktorého sa preloží znak alebo postupnosť znakov z množiny vzorov do množiny obrazov, sa volá kódovanie (encoding); opačnému postupu hovoríme dekódovanie (decoding). Digitálne počítače: všetky údaje (textové, zvukové aj obrazové) v počítači sú reprezentované pomocou kódov. GMRŠ Košice 3

Informácie okolo nás Kódovanie znakov n n n Na rozdiel od čísel, znaky textu

Informácie okolo nás Kódovanie znakov n n n Na rozdiel od čísel, znaky textu nevieme previesť do dvojkovej sústavy, preto bolo potrebné vymyslieť iný spôsob ako jednoznačne priradiť určitému znaku práve jednu kombináciu núl a jednotiek, ktorá tento znak v počítači bude reprezentovať. Okrem číslic 0, 1. . 9 používame znaky A, B. . . Z a diakritiku Okrem toho používame aj neviditeľné znaky (biele) : ENTER, TAB Stredoeurópske jazyky takisto používajú diakritiku Neexistuje žiadny univerzálny spôsob ako to urobiť, každý výrobca počítačov tento problém riešil iným spôsobom, preto existuje viacero znakových kódov. GMRŠ Košice 4

Informácie okolo nás Kódové tabuľky n n n Poriadok do tohto chaosu sa snažil

Informácie okolo nás Kódové tabuľky n n n Poriadok do tohto chaosu sa snažil zaviesť americký úrad pre normalizáciu ANSI (American National Standards Institute), ktorý vyhlásil jeden spôsob, ktorý by mali všetci používať – ASCII (American Standard Code for Information Interchange) Kód ASCII obsahuje 128 platných znakov (ľavé tlačídlo Alt a na numerickej klávesnici vyťukáme príslušný kód) Slovensko: druhú polovicu tabuľky stanovuje medzinárodná norma ISO 8859 -2, ktorá sa tiež nazýva Latin 2. Firma Microsoft však tento štandard nepoužíva, používa štandard schválený americkým úradom ANSI označovaný tiež Windows-1250. GMRŠ Košice 5

Informácie okolo nás ASCII tabuľka GMRŠ Košice 6

Informácie okolo nás ASCII tabuľka GMRŠ Košice 6

Informácie okolo nás Windows 1250 GMRŠ Košice 7

Informácie okolo nás Windows 1250 GMRŠ Košice 7

Informácie okolo nás ISO/IEC 8859 -2 GMRŠ Košice 8

Informácie okolo nás ISO/IEC 8859 -2 GMRŠ Košice 8

Informácie okolo nás UNICODE n Unicode je medzinárodný štandard, ktorého cieľom je definovať kódovaciu

Informácie okolo nás UNICODE n Unicode je medzinárodný štandard, ktorého cieľom je definovať kódovaciu schému schopnú reprezentovať väčšinu znakov používaných v písaných jazykoch spolu s inými symbolmi. n Napriek technickým problémom, obmedzeniam a kritike sa zo štandardu Unicode stala dominantná kódovacia schéma používaná pri internacionalizácii softvéru a viacjazyčných prostredí. Toto kódovanie používa 16 bitov na zakódovanie jedného znaku, čo umožňuje zakódovať 65536 možných znakov n n Tento spôsob kódovania používa i kancelársky balík MS Office. Toto kódovanie zabezpečuje, že ten istý znak má rovnaký kód v každej krajine i na každom type počítača. Nevýhodou tohto kódovania je, že znaky, ktoré sme predtým vedeli zakódovať iba ôsmymi bitmi v kódovaní Unicode, sú kódované 16 bitmi, a teda zaberajú viac pamäte. GMRŠ Košice 9

Informácie okolo nás UTF-8 Unicode Transformation Format n n n Istým vylepšením tohto kódovania

Informácie okolo nás UTF-8 Unicode Transformation Format n n n Istým vylepšením tohto kódovania je kódovanie UTF- 8. V tomto kódovaní je prvých 128 znakov tabuľky ASCII (tieto sú pre všetky krajiny rovnaké) zakódovaných pomocou 8 bitov a zvyšné znaky sú zakódované 16, 24, 32, 40 až 48 bitmi. Toto kódovanie je výhodné pre americky hovoriace krajiny a krajiny, v ktorých väčšinu znakov textu tvorí prvých 128 znakov tabuľky ASCII. Pre všetky znaky obsiahnuté v znakovej sade ASCII (t. j. číslice, písmená bez diakritiky, atď) vyžaduje iba 1 bajt a pre reprezentáciu slovenských znakov s diakritikou 2 bajty GMRŠ Košice 10

Informácie okolo nás Príklady n Š. . 13810 = 100010102 n 010011012 = 01002.

Informácie okolo nás Príklady n Š. . 13810 = 100010102 n 010011012 = 01002. . . 16*4 = 64. . . stĺpec 11012 = 13. . . riadok. . . M GMRŠ Košice 11