Zpracování informací a znalostí Přesnost a úplnost vyhledávání Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství
Ukládání a vyhledávání dokumentů požadavek na informace dotaz dokumenty indexované dokumenty porovnání dotazu s indexovanými dokumenty vyhledané dokumenty 2
Ukládání a vyhledávání dokumentů – výsledky DOKUMENTY relevantní irelevantní vyhledané a b nevyhledané c d a = počet relevantních vyhledaných dokumentů b = počet irelevantních vyhledaných dokumentů c = počet relevantních nevyhledaných dokumentů d = počet irelevantních nevyhledaných dokumentů 3
Ukládání a vyhledávání dokumentů - příklad Požadavek na informace: Data mining v sociálních vědách DOKUMENTY relevantní irelevantní vyhledané ? ? nevyhledané ? - Poznámka: Systém Pro. Quest umožňuje formulovat dotaz tak, že k dále naznačeným potížím nedochází. 4
Příklad vyhledaného irelevantního dokumentu (1. část ) 7
Příklad vyhledaného irelevantního dokumentu (2. část ) 8
Příklad vyhledaného relevantního dokumentu 9
Příklad jiného vyhledaného relevantního dokumentu (1. část) 10
Příklad jiného vyhledaného relevantního dokumentu (2. část) 11
Příklad nevyhledaného relevantního dokumentu Nevyhledán dokument Pixel bar charts: a visualization technique for very large multi-attribute data sets (viz výše) 12
Úspěšnost vyhledávání dokumentů DOKUMENTY relevantní irelevantní vyhledané a b nevyhledané c d Přesnost = Úplnost = 13