Information Retrieval Methoden, die dazu dienen, unstrukturierte Daten zu beschreiben, zu speichern und später nach inhaltlichen Kriterien wieder aufzufinden.
Information Definition von Shannon Die mittlere oder erwartete Information eines von n möglichen Ereignissen mit den Auftretenswahrscheinlichkeiten p 1, p 2, … pn beträgt: n = pr. log (pr) r=1 n wo: r=1 pr = 1
Subjektive Information, die über die Sinnesorgane aufgenommen wird, hängt stark vom „Empfänger“ ab: n n Von seinem Wissen um die sachlichen Zusammenhänge; von seinem Wissen um die Situation, von der die Nachricht handelt; von seinem Zustand (z. B. Assoziationsfähigkeit); von seinem Grad der Beherrschung des verwendeten Zeichenrepertoires.
Superzeichenbildung
Superzeichenhierarchi e
Retrieval - Funktion RSV
Vektorraum - Retrieval : Menge von Merkmalen (features) j D : Menge der Deskribierungen d D: d= (d 0, …dn-1) n-1 wo di , di 0 und i=0 di > 0 Q : Menge der Queries q Q : q = (q 0, …qn-1) n-1 wo qi , qi 0 und V : V = {v | v 0} i=0 qi > 0
Ähnlichkeitsmasse Inneres Produkt: n-1 RSVI(q, d) = i=0 qi. di Cosinus - Mass: n-1 RSVcos (q, d) = i=0 n-1 i=0 qi 2. qi. d i n-1 di 2 i=0