Information Retrieval Methoden die dazu dienen unstrukturierte Daten

  • Slides: 8
Download presentation
Information Retrieval Methoden, die dazu dienen, unstrukturierte Daten zu beschreiben, zu speichern und später

Information Retrieval Methoden, die dazu dienen, unstrukturierte Daten zu beschreiben, zu speichern und später nach inhaltlichen Kriterien wieder aufzufinden.

Information Definition von Shannon Die mittlere oder erwartete Information eines von n möglichen Ereignissen

Information Definition von Shannon Die mittlere oder erwartete Information eines von n möglichen Ereignissen mit den Auftretenswahrscheinlichkeiten p 1, p 2, … pn beträgt: n = pr. log (pr) r=1 n wo: r=1 pr = 1

Subjektive Information, die über die Sinnesorgane aufgenommen wird, hängt stark vom „Empfänger“ ab: n

Subjektive Information, die über die Sinnesorgane aufgenommen wird, hängt stark vom „Empfänger“ ab: n n Von seinem Wissen um die sachlichen Zusammenhänge; von seinem Wissen um die Situation, von der die Nachricht handelt; von seinem Zustand (z. B. Assoziationsfähigkeit); von seinem Grad der Beherrschung des verwendeten Zeichenrepertoires.

Superzeichenbildung

Superzeichenbildung

Superzeichenhierarchi e

Superzeichenhierarchi e

Retrieval - Funktion RSV

Retrieval - Funktion RSV

Vektorraum - Retrieval : Menge von Merkmalen (features) j D : Menge der Deskribierungen

Vektorraum - Retrieval : Menge von Merkmalen (features) j D : Menge der Deskribierungen d D: d= (d 0, …dn-1) n-1 wo di , di 0 und i=0 di > 0 Q : Menge der Queries q Q : q = (q 0, …qn-1) n-1 wo qi , qi 0 und V : V = {v | v 0} i=0 qi > 0

Ähnlichkeitsmasse Inneres Produkt: n-1 RSVI(q, d) = i=0 qi. di Cosinus - Mass: n-1

Ähnlichkeitsmasse Inneres Produkt: n-1 RSVI(q, d) = i=0 qi. di Cosinus - Mass: n-1 RSVcos (q, d) = i=0 n-1 i=0 qi 2. qi. d i n-1 di 2 i=0