LOGPAT ein webbasiertes Tool zur Analyse von Navigationsverlufen
LOGPAT ein webbasiertes Tool zur Analyse von Navigationsverläufen in Hypertexten Stephan Noller, human. IT Johannes Naumann, Universität zu Köln Tobias Richter, Universität zu Köln
Gliederung 1. 2. 3. 4. 5. 6. 7. Warum Logfile-Analyse? Bedeutung für Hypertextforschung Einsatzbereiche Analysemöglichkeiten/Kennwerte Vorstellung: LOGPAT Anwendungsbeispiel live! Lizenzmodell, Ausblick
Logfile-Analyse: Hintergrund Logfiles: automatisch erstellte Interaktionsprotokolle • hohe Objektivität • niedrige Reaktivität • ökonomisch zu erheben • leichte Weiterverarbeitung • aber: Datenwüste!
Bedeutung für die Hypertextforschung • Hypertexte: individuelle Sequenzierung des Seitenabrufs • verschiedene Strategien werden unterschieden: – zielgerichtete Suche – zweckgebundenes Stöbern – exploratives Stöbern – tiefe vs. breite Exploration
Bedeutung für die Hypertextforschung • In den Navigationsverläufen schlagen sich psychologische Merkmale nieder: – Verarbeitungsstrategien – Vorwissen – Interessen • aber auch Merkmale des Materials: – Charakteristika der Navigationshilfen – Charakteristika des Hypertextes
Analysemöglichkeiten I atomistische Kennwerte • Anzahl bestimmter Seitentypen, z. B. – Überblicks- vs. Inhaltsseiten – wie oft wurden Suchseiten verwendet? – gibt es inhaltliche Schwerpunkte, d. h. werden bestimmte Bereiche verstärkt aufgesucht?
Analysemöglichkeiten II Sequenzanalyse • welche Sequenzen tauchen besonders häufig auf? • Wie häufig wird mit der Back-Taste gearbeitet? • Wie häufig wird „durchgeblättert“? • Gibt es typische Loops oder Sackgassen?
Analysemöglichkeiten III graphentheoretische Kennwerte Grundgedanke: Logfile = Graph wird in einer asymmetrischen Distanzmatrix abgebildet • • • stratum: „Linearität“ des Pfades compactness: „Vernetztheit“ des Pfades Relative In-Centrality (RIC) Relative Out-Centrality (ROC) heuristische Analyse anhand der Distanzmatrix
Graphentheorie: Hintergrund Linearer Pfad A B C D Als Graph A B Vernetzter Pfad A B A C D Als Graph A B C C D Distanz von B A: 1
Warum ein neues Tool? • es gibt kein Tool welches die erwünschte Funktionalität anbietet • Zusammenfassung der genannten Analysemöglichkeiten unter einheitlichen Oberfläche • GPL-Programmierung Möglichkeit der Anpassung und Weiterentwicklung nach eigener Fragestellung
LOGPAT Programmiersprache, Umgebung, Anforderungen • Logpat wurde mit der einfach zu erlernenden Sprache PHP entwickelt • es wird auf einem Webserver installiert und beinhaltet eine Benutzerverwaltung • mehrere Nutzer können gleichzeitig mit dem Tool arbeiten • keine zusätzliche Software-Installation auf dem Clientsystem erforderlich
LOGPAT Single File-Analyse
LOGPAT Single File-Analyse: Output I Sequenzen und Kennwerte Musteranalyse mit Patternfile
LOGPAT Single File-Analyse: Output II Distanz-Matrix
LOGPAT Multi File-Analyse
LOGPAT Multi File-Analyse: Output
Input • Logpat kann beliebige Textdateien einlesen • eingebaute Konvertierfunktion (frei konfigurierbar) • File-Archiv • Analysemuster in Patternfile können importiert werden (Regular Expressions)
Output • Als Output werden HTML-Tabellen generiert • Im Multi File-Plot werden Graphiken generiert • zusätzlich können die Ergebnisse bei Multi File-Analyse als CSV- oder SPSSDatei heruntergeladen werden
Lizenz & Weiterentwicklung. . . • Logpat wurde unter der GNU General Public Licence freigegeben • Unter www. log-pat. de ist eine Demo. Version verfügbar • Der Source-Code steht zur Weiterentwicklung zur Verfügung!
- Slides: 19