PRAHOV POJMY doc Ing Kristna Machov CSc kristina

  • Slides: 21
Download presentation
PRAHOVÉ POJMY doc. Ing. Kristína Machová, CSc. kristina. machova@tuke. sk people. tuke. sk/kristina. machova/

PRAHOVÉ POJMY doc. Ing. Kristína Machová, CSc. kristina. machova@tuke. sk people. tuke. sk/kristina. machova/

OSNOVA: • Charakteristika prahových pojmov • Reprezentácia a použitie tabuľky kritérií • Reprezentácia a

OSNOVA: • Charakteristika prahových pojmov • Reprezentácia a použitie tabuľky kritérií • Reprezentácia a použitie lineárnej prahovej jednotky • Reprezentácia a použitie sférickej prahovej jednotky • Operátory na pohyb v priestore pojmov • Indukcia tabuľky kritérií • Algoritmus HCT • Indukcia lineárnej prahovej jednotky • Iteratívna váhová perturbácia

PRAHOVÉ POJMY v KOCKE q Predstavujú flexibilnejšiu reprezentáciu znalostí q Kľúčovým je parciálne pokrytie

PRAHOVÉ POJMY v KOCKE q Predstavujú flexibilnejšiu reprezentáciu znalostí q Kľúčovým je parciálne pokrytie q Stačí ak nový, zatiaľ neklasifikovaný, TP spĺňa iba niektoré podmienky definície triedy q Konkrétne, stačí ak stupeň pokrytia prekročí preddefinovaný prah q Reprezentácie: tabuľka kritérií, lineárna prahová jednotka, sférická prahová jednotka

REPREZENTÁCIA A POUŽITIE TABUĽKY KRITÉRIÍ Reprezentácia: § Najjednoduchšia forma prahového popisu § Hovoríme jej

REPREZENTÁCIA A POUŽITIE TABUĽKY KRITÉRIÍ Reprezentácia: § Najjednoduchšia forma prahového popisu § Hovoríme jej aj pojem m_z_n (n je počet atribútov a prah m je prirodzené číslo medzi 1 a n) § Konjunkcia všetkých n podmienok sa nazýva prototyp alebo etalón § Pojem n_z_n prezentuje konjunkciu § Pojem 1_z_n prezentuje disjunkciu Použitie: TP je zaradený do tej triedy, z definície ktorej spĺňa aspoň m podmienok.

REPREZENTÁCIA A POUŽITIE TABUĽKY KRITÉRIÍ Numerická doména v dvojrozmernom priestore: § Pojem 2_z_2 prezentuje

REPREZENTÁCIA A POUŽITIE TABUĽKY KRITÉRIÍ Numerická doména v dvojrozmernom priestore: § Pojem 2_z_2 prezentuje etalón - bod § Pojem 1_z_2 prezentuje disjunkciu – body rastra na úsečkách

REPREZENTÁCIA A POUŽITIE TABUĽKY KRITÉRIÍ Numerická doména v trojrozmernom priestore: § Pojem 3_z_3 je

REPREZENTÁCIA A POUŽITIE TABUĽKY KRITÉRIÍ Numerická doména v trojrozmernom priestore: § Pojem 3_z_3 je prezentovaný bodom § Pojem 2_z_3 je prezentovaný úsečkami § Pojem 1_z_3 je prezentovaný plochami Geometrické útvary sú rovnobežné s osami irelevantných atribútov

REPREZENTÁCIA A POUŽITIE LINEÁRNEJ PRAHOVEJ JEDNOTKY Reprezentácia: § Každý atribút má priradenú váhu, ktorá

REPREZENTÁCIA A POUŽITIE LINEÁRNEJ PRAHOVEJ JEDNOTKY Reprezentácia: § Každý atribút má priradenú váhu, ktorá určuje stupeň jeho relevancie § IF § THEN chorá bunka § LTU v dvojrozmernom priestore pojmov predstavuje priamku, ktorá separuje negatívne a pozitívne TP Použitie: Ak TP spĺňa nerovnicu v IF časti pravidla, potom je klasifikovaný ako pozitívny TP pojmu.

REPREZENTÁCIA A POUŽITIE LINEÁRNEJ PRAHOVEJ JEDNOTKY Reprezentácia - poznámky: § Kombinácia váh v pravidle

REPREZENTÁCIA A POUŽITIE LINEÁRNEJ PRAHOVEJ JEDNOTKY Reprezentácia - poznámky: § Kombinácia váh v pravidle sa nazýva LTU (Linear Treshold Unit) § Tabuľka kritérií je špeciálnym prípadom LTU, kde váhy nadobúdajú hodnoty 1 § V N - dimenzionálnom priestore predstavuje LTU hyper - rovinu v separabilnom priestore § Váhy atribútov určujú orientáciu hyperroviny § Prahová hodnota určuje jej posunutie pozdĺž kolmice na hyperrovinu § Pojem reprezentovateľný LTU separuje lineárne pozitívne a negatívne príklady

REPREZENTÁCIA A POUŽITIE LINEÁRNEJ PRAHOVEJ JEDNOTKY

REPREZENTÁCIA A POUŽITIE LINEÁRNEJ PRAHOVEJ JEDNOTKY

REPREZENTÁCIA A POUŽITIE SFÉRICKEJ PRAHOVEJ JEDNOTKY Reprezentácia: § Na rozdiel od LTU, pozitívne príklady

REPREZENTÁCIA A POUŽITIE SFÉRICKEJ PRAHOVEJ JEDNOTKY Reprezentácia: § Na rozdiel od LTU, pozitívne príklady sú ohraničené zo všetkých strán § V N - dimenzionálnom priestore tvorí hypersféru § V dvojrozmernom priestore: kruh alebo elipsa § Konštanta pri atribúte udáva polohu centra a prahová hodnota určuje polomer hypersféry § Hypersféra separuje negatívne a pozitívne TP (uzatvára pozitívne TP vo svojom vnútri) Použitie: Ak TP spĺňa nerovnicu v IF časti pravidla, potom je klasifikovaný ako pozitívny TP pojmu.

REPREZENTÁCIA A POUŽITIE SFÉRICKEJ PRAHOVEJ JEDNOTKY

REPREZENTÁCIA A POUŽITIE SFÉRICKEJ PRAHOVEJ JEDNOTKY

OPERÁTORY na POHYB v PRIESTORE Pridanie atribútu do podmienky pri konštantnom prahu produkuje všeobecnejšie

OPERÁTORY na POHYB v PRIESTORE Pridanie atribútu do podmienky pri konštantnom prahu produkuje všeobecnejšie pojmy (1_z_2 je priamka, 1_z_3 je plocha) Nárast prahovej hodnoty pri zachovaní etalónu vedie Ku špecifickejšiemu pojmu (1_z_3 je plocha, 2_z_3 je priamka)

INDUKCIA TABUľKY KRITÉRIÍ Ak r relevantných atribútov 2 kroková indukcia: §určenie etalónu §výber prahu

INDUKCIA TABUľKY KRITÉRIÍ Ak r relevantných atribútov 2 kroková indukcia: §určenie etalónu §výber prahu od 1 do r vrátane Treshold Revision (Algoritmus revízie prahu) Etalón - najfrekventovanejšie hodnoty Atribútov Má dve verzie: Treshold Revision General štartuje od najšpecifickejšieho pojmu r_z_r operátor zmenšuje prahovú hodnotu Treshold Revision Specific štartuje od najvšeobecnejšieho pojmu 1_z_r operátor zvyšuje prahovú hodnotu

ALGORITMUS HCT §Heuriscic Criteria Tabels – Langley, 1996 §Dokáže zvládnuť realistickejšie situácie, keď je

ALGORITMUS HCT §Heuriscic Criteria Tabels – Langley, 1996 §Dokáže zvládnuť realistickejšie situácie, keď je relevantných iba r z n atribútov §Je neinkrementálny §Postupuje smerom od špecifického k všeobecnému §Je riadený ohodnocovacou funkciou Score §Prehľadávanie je obmedzené šírkou lúča Beam Size §Používa operátory generalizácie §Vykazuje prvky kvantitatívneho usudzovania §Zvláda zašumené domény

OPERÁTORY ZOVŠEOBECNENIA 1. Vymaže atribút a zároveň zníži prah o jednotku Z hypotézy 2_z_{jedno_jadro,

OPERÁTORY ZOVŠEOBECNENIA 1. Vymaže atribút a zároveň zníži prah o jednotku Z hypotézy 2_z_{jedno_jadro, jeden_bičík, hrubá stena} generuje zovšeobecnenia: 1_z_{jedno_jadro, jeden_bičík} 1_z_{jedno_jadro, hrubá_stena} 1_z_{jeden_bičík, hrubá_stena} 2. Drží prah konštantný a zároveň zavádza nový atribút Z hypotézy 1_z_{jedno_jadro} Generuje zovšeobecnenia: 1_z_{jedno_jadro, jeden_bičí 1_z_{jedno_jadro, hrubá_stena} Inverzne je možné definovať operátory špecifikácie: 1. Pridá atribút a zároveň zvýši prah o jednotku 2. Drží prah konštantný a zároveň vymazáva atribút

ALGORITMUS HCT Vstupy: PSET. . . množina pozitívnych trénovacích príkladov NSET. . . množina

ALGORITMUS HCT Vstupy: PSET. . . množina pozitívnych trénovacích príkladov NSET. . . množina negatívnych trénovacích príkladov ATTS. . . množina nominálnych atribútov Výstupy: Tabuľka kritérií na klasifikáciu nových príkladov Parameter: Beam-Size počet popisov pojmov na novej úrovni Procedúra: hct(PSET, NSET, ATTS) nech etalón E je množinou najfrekventovanejších hodnôt v PSET pre každý z atribútov v ATTS nech inicializačná prahová hodnota T = veľkosť ATTS (počet atribútov) nech inicializačná množina hypotéz HSET={[T_z_E]} htc-aux(PSET, NSET, E, {}, HSET)

ALGORITMUS HCT htc-aux(PSET, NSET, E, CLOSED-SET, HSET) nech OPEN-SET={} for každý pojem H v

ALGORITMUS HCT htc-aux(PSET, NSET, E, CLOSED-SET, HSET) nech OPEN-SET={} for každý pojem H v HSET nech SPECS je najšpecifickejšie zovšeobecnenie(H, E) nech NEWSET={} for každý špecifikovaný pojem S v SPECS if Score (S, PSET, NSET)>Score (H, PSET, NSET) then pridaj S do NEWSET if NEW-SET={} then pridaj H do CLOSED-SET else for každý pojem S v NEW-SET pridaj S do OPEN-SET if OPEN-SET={} then vráť člena s najvyšším skóre v CLOSED-SET else nech BEST-SET je Beam-Size počet najvyššie skórovaných členov zjednotenia OPEN-SET a CLOSED-SET nech CLOSED-SET sú členovia CLOSED-SET v BEST-SET nech OPEN-SET sú členovia OPEN-SET v BEST-SET hct-aux(PSET, NSET, E, CLOSED-SET, OPEN-SET)

INDUKCIA LTU generuje deliace hranice priamka v rovine rovina v priestore, hyperrovina v multidimenzionálnom

INDUKCIA LTU generuje deliace hranice priamka v rovine rovina v priestore, hyperrovina v multidimenzionálnom pr. Model hyperroviny (w 0 je prah a wi sú váhy atribútov): Vj=0 pre body na deliacej ploche. Body - TP, pre ktoré Vj>0 budú klasifikované ako pozitívne. Hľadáme takú množinu váh, ktorá uskutoční najväčšie množstvo korektných klasifikácií. Pre bod na deliacej ploche platí: Ukj=-wk.

ALGORITMUS IWP Iterative Weight Perturbation. Iteratívna váhová perturbácia Vstupy: Výstupy: Parameter: Procedúra: ISET. .

ALGORITMUS IWP Iterative Weight Perturbation. Iteratívna váhová perturbácia Vstupy: Výstupy: Parameter: Procedúra: ISET. . . množina trénovacích príkladov ATTS. . . množina atribútov LTU na klasifikáciu nových príkladov Max_Iterations. . . maximálny počet iterácií iwp (ISET, ATTS).

ALGORITMUS IWP Procedúra: iwp (ISET, ATTS). nech H je LTU s voliteľnými váhami z

ALGORITMUS IWP Procedúra: iwp (ISET, ATTS). nech H je LTU s voliteľnými váhami z intervalu (-1, 1) nech BEST=H nech COUNT=Max_Iterations repeat kým neplatí COUNT=0: for každý atribút K z ATTS for každý príklad J z ISET vypočítaj Ukj použijúc H a J ulož Ukj hodnoty v zostupnom uspor. (U’) for každý susedný pár U’ hodnôt nech wk’ je zápornou priemernou hodnotou páru nech H’ je H, v ktorom je wk nahradené wk’ vypočítaj Score(H’, ISET) nech H je LTU s najvyšším skóre if Score(H, ISET)=1 then vráť hypotézu H else if Score(H, ISET)>=Score(BEST, ISET) then nech BEST=H dekrementuj COUNT vráť hypotézu BEST.

Deliace hranice generované IWP

Deliace hranice generované IWP