Internet fr Einsteiger Das World Wide Web als
Internet für Einsteiger: Das World Wide Web als Informationsquelle KSE, So. Se 2015 Deike Zimmann
Das Internet (von engl. interconnected network), kurz das Netz, ist ein weltweites Netzwerk, bestehend aus vielen Rechnernetzwerken, durch das Daten ausgetauscht werden. Visualisierung der verschiedenen Routen durch Teile des Internets.
Das Internet Es ermöglicht die Nutzung von Internetdiensten wie E-Mail, WWW, Peer-to. Peer-Systemen, Dateiübertragung sowie, als jüngste Entwicklung, Telefonie, Radio und Fernsehen. Visualisierung der verschiedenen Routen durch Teile des Internets.
Das Internet Der Datenaustausch zwischen den einzelnen Internet-Rechnern erfolgt über die technisch normierten Internetprotokolle. Visualisierung der verschiedenen Routen durch Teile des Internets.
Internetdienste Das Internet selbst stellt • E-Mail lediglich eine Infrastruktur • FTP (Dateitransfer) dar. • NNTP (Usenet) • WWW Ein Nutzen für die Anwender. Innen entsteht • Peer-to-Peer-Systeme erst dadurch, dass • VPN (Teamnetze) basierend auf der Struktur • Chat des Internets verschiedene Dienste zur • Telefonie (Vo. IP) Verfügung stehen. • Radio, TV (Livestreams)
Internetdienste Eine ausführliche Übersicht über alle Internetdienste findet man unter http: //de. wikipedia. org/ wiki/Internetdienste
World Wide Web Der Internetdienst World Wide Web (WWW) hat Anfang der 90 er Jahre dem Internet zum Durchbruch außerhalb der Wissenschafts- und Computerfachwelt verholfen. • • • E-Mail FTP (Dateitransfer) NNTP (Usenet) WWW Peer-to-Peer-Systeme VPN (Teamnetze) Chat Telefonie (Vo. IP) Radio, TV (Livestreams)
World Wide Web Es basiert auf drei Kernstandards: Das World Wide Web • HTTP: Protokoll, mit dem der (WWW, Web) überträgt Browser Informationen vom Webseiten. Webserver anfordern kann. Das Grundprinzip ist ein • HTML (Hypertext Markup Language): Dokumentbeschreibungssprache, Hypertext-System; die festlegt, wie die Information seit 1990 hat sich das Web gegliedert ist und wie die ständig weiterentwickelt Dokumente verknüpft sind und bietet neben (Hyperlinks). Bebilderungen, Ton, • URL (oder URI): Eindeutige Adresse bzw. Bezeichnung einer Animationen und Videos Ressource (z. B. Webseite, Bild, auch interaktive Inhalte PDF-Datei), die in Hyperlinks aller Art. verwendet wird.
Web-Browser Zur Anzeige von Webseiten bzw. Web. Inhalten wird ein sogenanntes Browser. Programm (wie beispielsweise Firefox, Internet Explorer, Google Chrome , Safari oder Opera) benötigt.
Web-Browser: Firefox Offizielle Downloadquelle: http: //www. mozillaeurope. org/de/ Ausführliche Einführung in die Benutzung von Firefox: http: //firefoxanleitung. net/
Begriffsklärung I • • Website / Webpräsenz Webseite Homepage Domain – Top Level Domain – 2 nd Level Domain – Subdomain • URL
Begriffsklärung II • Suchmaschine • Metasuchmaschine • Katalog • Surface Web • Deep Web
Suchmaschinen: Meistbenutzte Suchmaschinen. Nutzung in Deutschland 2015 (schwarz) und 2014 (blau) Quelle: de. statista. com Stand: April 2015
Suchmaschinen: Funktionsweise • Registrierung der Webseite • Spider (Crawler, Agent, Robot) • Indexierung • Bestimmung der Relevanz (Algorithmus) • Benutzer-Interface
Suchmaschinen: Funktionsweise Registrierung der Webseite • Zunächst müssen Webseiten, damit eine Suchmaschine sie nachweisen kann, in eine Art Katalog aufgenommen werden. • Nur Seiten, die dort aufgelistet sind, werden von Suchmaschinen gesichtet. • Die Eintragung erfolgt entweder manuell durch die Betreiber/innen der Websites oder automatisch durch die Suchmaschinen.
Suchmaschinen: Funktionsweise Spider (Crawler, Robot, Agent) • In unterschiedlichen Abständen sichten die Suchmaschinen die Webseiten-Inhalte. • Heute werden nicht mehr nur HTML-Seiten gelesen, sondern auch PDF-Dateien und andere Datenformate (aber nicht Bilder). • Die von den Spidern gesammelten Daten werden zentral gesammelt. Sie bilden die Grundlage der Datenbank.
Suchmaschinen: Funktionsweise Indexierung • Ein Indexer untersucht die Daten nach Schlüsselbegriffen (Keywords) und ordnet diese in einem invertierten Index. • Darin werden Listen mit den Webseiten geführt sowie Listen mit den Schlüsselbegriffen, die den einzelnen Webseiten zugeordnet sind.
Suchmaschinen: Funktionsweise Indexierung (Forts. ) • Dieser Index ist somit Grundlage für die Ergebnisse der Suchanfragen. • Der Index bestimmt pro Suchanfrage aber nur, welche Seiten in Frage kommen und welche nicht. Die Reihenfolge wird erst im nächsten Schritt ermittelt.
Suchmaschinen: Funktionsweise Relevanzermittlung • Die Reihenfolge der Suchergebnisse wird für jede Suchanfrage individuell erstellt. • Dabei untersucht die Suchmaschine die im Index gefundenen Webseiten auf verschiedene Kriterien: - Seitentitel - Suchbegriffs-Dichte - Linkpopularität - etc.
Suchmaschinen: Funktionsweise Relevanzermittlung (Forts. ) • Alle diese Kriterien und deren Gewichtung machen den so genannten Such-Algorithmus aus. • Dieser Algorithmus ist das bestgehütete Geheimnis der Suchmaschinenbetreiber.
Suchmaschinen: Funktionsweise User-Interface • Die Webseiten, die den Benutzer/innen einer Suchmaschine präsentiert werden: • Teil 1 - Suchmaske meist einfach und erweitert angeboten • Teil 2 – Ergebnisliste • Ergänzende Seiten, z. B. Hilfe, Hintergrundinformationen, Zusatzdienste
Suchmaschinen und das Deep Web Surface Web Alle Webressourcen, die von normalen Suchmaschinen gefunden werden können. Deep Web Alles, was Google nicht durchsuchen kann.
Surface Web Alle Webressourcen, die von normalen Suchmaschinen gefunden werden können (unsystematische Suche). Trotz Wikipedia und Volltext. Ressourcen wie den Gutenberg -Projekten der deutlich kleinere Teil aller Webinhalte.
Deep Web Alles, was Google nicht durchsuchen kann. Der weitaus größere Teil des Webs! • Ressourcen, die nur durch eine Datenbankabfrage erreicht werden (Suchschlitze) • Ressourcen, die zugangsgeschützt sind (Login erforderlich, zugangsbeschränkt, kostenpflichtig, . . . ) • Versteckte Ressourcen, die nirgends verlinkt sind
Deep Web Inhalte im Deep Web finden • Systematische Suchstrategien Kataloge, wissenschaftliche Verzeichnisse etc. als Einstiege nutzen • Spezialsuchmaschinen Sind auf das Durchsuchen bestimmter Datenbankinhalte spezialisiert • Deep-Web-Verzeichnisse
- Slides: 25