Medizinische Statistik und Informationsverarbeitung Quade Institut fr Medizinische
Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung Quade
Netzwerke Quade
Quade
Netzwerke In einem lokalen physikalischen Netzwerk erkennen sich die Teilnehmer mittels der MAC-Adresse (Media Access Control (Schicht 2 des OSI Referenz Modells)) der Netzwerk Karte (arp –a unter Windows). Die Abbildung in die uns bekannte IPAdresse geschieht mittels des Adress Resolution Protokolls (ARP)
IP-Netzwerkadressen Eine IP-Adresse besteht aus 4 Zahlen zwischen 0 und 255. Die Netzwerkmaske (z. B. 255. x. x) bestimmt den Netzwerkteil und den Knotenteil. Die höchste und die niedrigste Knotenadresse ist jeweils für Broadcasts reserviert. Alle Rechner im Netzwerk lauschen auf den Broadcast-Adressen.
IP-Netzwerke Ip-Netz Maske IP-Binär Maske 131. 220. 23. 0 Broadcast 0 & 255. 0 oder /24 131. 220. 23. 0 131. 220. 0001 0111. 0000 255. 1111. 0000 255. 0 Daher können sich Rechner mit den IP-Adressen 131. 220. 23. 1 bis 131. 220. 23. 254 in einem lokalen Netzwerk „sehen“.
Befehle um die Netzwerkkonfiguration zu sehen ipconfig Windows-IP-Konfiguration Ethernetadapter Drahtlose Netzwerkverbindung: Medienstatus. . . : Es besteht keine Verbindung Ethernetadapter LAN-Verbindung: Verbindungsspezifisches DNS-Suffix: meb. uni-bonn. de IP-Adresse. . . : 172. 30. 1. 70 Subnetzmaske. . . : 255. 0 Standardgateway. . : 172. 30. 1. 254
Befehle um die Netzwerkkonfiguration zu sehen netstat -a Aktive Verbindungen Proto TCP TCP TCP Lokale Adresse Remoteadresse Quade-T 60: epmap Quade-T 60: 0 Quade-T 60: microsoft-ds Quade-T 60: 0 Quade-T 60: 2869 Quade-T 60: 0 Quade-T 60: 5800 Quade-T 60: 5900 Quade-T 60: 6060 Quade-T 60: 10243 Quade-T 60: 0 Quade-T 60: 31038 Quade-T 60: 0 Quade-T 60: 1036 Quade-T 60: 0 Quade-T 60: 1090 localhost: 27015 Quade-T 60: 1168 localhost: 1169 Quade-T 60: 1169 localhost: 1168 Status ABHÖREN ABHÖREN ABHÖREN HERGESTELLT
Befehle um die Netzwerkkonfiguration zu sehen netstat -b Aktive Verbindungen Proto Lokale Adresse Remoteadresse TCP Quade-T 60: 1090 localhost: 27015 TCP Quade-T 60: 3289 localhost: 3290 TCP Quade-T 60: 3290 localhost: 3289 TCP Quade-T 60: 4844 localhost: 4845 TCP Quade-T 60: 4845 localhost: 4844 TCP Quade-T 60: 4847 localhost: 4848 TCP Quade-T 60: 4848 localhost: 4847 TCP Quade-T 60: 27015 localhost: 1090 [Apple. Mobile. Device. Service. exe] TCP Quade-T 60: 5152 localhost: 1088 Status PID HERGESTELLT HERGESTELLT 6020 6108 5016 712 SCHLIESSEN_WARTEN [i. Tunes. Helper. exe] [Netscp. exe] [firefox. exe] 3004 [jqs. exe]
Befehle um die Netzwerkkonfiguration zu sehen netstat -ano Aktive Verbindungen Proto TCP TCP TCP Lokale Adresse 0. 0: 80 0. 0: 135 0. 0: 445 0. 0: 2869 0. 0: 5800 0. 0: 5900 0. 0: 6060 0. 0: 10243 0. 0: 31038 127. 0. 0. 1: 1036 Remoteadresse 0. 0: 0 0. 0: 0 Status ABHÖREN ABHÖREN ABHÖREN PID 7128 552 4 1076 2808 684 2632 2024 1912
Befehle um die Netzwerkkonfiguration zu sehen arp -a Address www. dsmrsvpaed. de www. oncopaednki. de linkdb. meb. uni-bonn. de famhap. meb. uni-bonn. de www-dom 0. meb. uni-bonn. d HWtype ether ether HWaddress 00: 16: 3 e: 57: 90: 23 00: 16: 3 e: 35: c 1: 5 e 00: 15: 17: ab: ae: fe Flags Mask iface C br 0 C br 0 nmap 131. 220. 23. 0/24 Interesting ports on Jumbo-dom 0. meb. uni-bonn. de (131. 220. 23. 181): Not shown: 998 closed ports PORT STATE SERVICE 22/tcp open ssh 111/tcp open rpcbind MAC Address: 00: 30: 48: 20: 0 C: D 4 (Supermicro Computer)
IP-Netzwerkklassen Eine IP-Adresse ist zweigeteilt und zwar in einen Netzwerkteil und einen Knotenteil. Der Netzwerkteil ist innerhalb eines Netzwerksegments überall gleich, während jeder Rechner oder jedes andere Gerät seine eigene Knotennummer bekommt. 10. 10 Maske 255. 0. 0. 0
IP-Netzwerkklassen Über die Netzwerknummer erfolgt auch die Einteilung in sogenannte Netzwerk-Klassen in A -, B- oder C-Klasse Netzwerke. Das Prinzip ist, dass große Netzwerke mit vielen Knoten möglichst eine Klasse A oder wenigstens eine Klasse B Nummer bekommen und kleine Netze eine Klasse C Nummer http: //www. instrumentation. de/5106003 d. htm
IP-Netzwerkklassen Klasse A (1. 0. 0. 0 bis 127. 255): • Das erste Bit der Adresse ist auf Null gesetzt. Die ersten acht Bit identifizieren das Netzwerk, die restlichen 24 Bit den Host. Insgesamt sind 127 Class-A-Netze möglich. • Reserviert: 127. x. x. x (loopback/localhost) • Privat: 10. 0 - 10. 255 • Maske: 255. 0. 0. 0 oder /8
IP-Netzwerkklassen Das Klasse B (128. 0. 0. 0 bis 191. 255): • Bei Klasse-B-Netzen ist das erste Bit auf Null, das zweite Bit auf eins gesetzt. Die ersten 16 Bit beschreiben das Netzwerk, die anderen 16 Bit sind die Hostadresse. • Netze: 16. 384 mit maximal 65. 534 angeschlossenen Computern. • Privat: 172. 16. 0. 0 - 172. 31. 255 • Maske 255. 0. 0 oder /16
IP-Netzwerkklassen Klasse C (192. 0. 0. 0 bis 223. 255) : • Diese Netzwerkart erlaubt nur 255 Hosts in einem Netz. Die ersten drei Bit einer Class-C-Adresse bilden dabei die Folge "110". Die ersten 24 Bit identifizieren das Netzwerk, nur acht Bit den Host. • 2. 097. 152 Netze mit jeweils 254 Rechnern • Privat: 192. 168. 0. 0 - 192. 168. 255 • Mask 255. 0 oder /24
IP-Netzwerkklassen Klasse D: 224. 0. 0. 0 - 239. 255 für spezielle Dienste z. B. Multicast
Ports • • Jede IP-Adresse hat 65536 Ports festgelegte privilegierte Ports 0 bis 1023. festgelegte Ports von 1024 bis 49151 dynamische oder private von 49152 bis 65535 http: //www. iana. org/assignments/portnumbers
Firewall • Die Firewall legt fest, ob eine Verbindung erlaubt ist. • Die Firewall kontrolliert eingehende, weitergeleitete und ausgehende Pakete. • Die Firewall kann berücksichtigen, ob Pakete zu einer bereits bestehenden Verbindung gehören.
Firewall • iptables -A INPUT -i eth 0 -p ICMP -j ACCEPT • iptables -A OUTPUT -o eth 0 -p ICMP -j DROP
Penetrationstest • • BSI Literatur nmap nessus Qualis
Router Ein Router leitet Pakete aktiv von einem Netzwerk in ein anderes. Dabei können die Pakete (z. B. IP-Adresse) auch verändert werden.
Switch Ein Switch verbindet Netzwerksegmente oder Rechner miteinander. Dabei können auch mehrere Rechner in virtuellen Netzwerken (vlan) zusammengefasst werden.
Historie • Einzelne Inseln • Jeder vertaut Jedem (frühes Internet) Internet Company B Company A Router
Weitere Entwicklung • Filtern & Firewalls Internet Company A Router Firewall • demilitarisierte Zonen Company A DMZ Internet Router WWW Server DNS Server SMTP Relay Company A Internal Network Firewall
Sichere Architektur • Virtuelle Gemeinschaft (Extranets & B 2 B VPNs) – Site-to-site VPN tunnel – Vernetzung mit Praxen Company A DMZ Company A Internal Network Firewall Company A Extranet Company B DMZ Internet Router Firewall Company B Extranet Company B Internal Network
und weiter … • Virtuell mobile Arbeitsweise (C 2 B VPNs) – Zunehmend schneller Internetzugang – Firewalls mit VPN-Funktionalität – Dedizierte VPN-Konzentratoren machen den Zugang für mobile Arbeitsplätze von der Firewall unabhängig Company A DMZ Internet Telearbeit Router Mobiler Arbeitsplatz Firewall w/ Tunnel Company A Internal Network
Cave! Auch wenn richtig verschlüsselte VPNs für die Kommunikation von Patientendaten benutzt werden dürfen: Es gibt auch unverschlüsselte VPNs Quade
Begriffe html: Hypertext Markup Language http: Hypertext Transfer Protocol Quade
HTML Bearbeitung Quade
Logfiles & Cookies Log. Format "%h %l %u %t "%r" %s %b %T %{Cookie}n "%{Referer}i" "%{User-Agent}i" "%{UNIQUE_ID}e"" Quade
Recherchesysteme Recall Anteil der gefundenen Daten an den gesuchten Daten A A+C Precision Anteil der gefundenen Daten der von Interesse ist A A+B vorhandene Daten relevant irrelevant Ergebnis der Suche gefunden A B nicht gefunden C D
Recherchesysteme MEDLINE Schlagworte, Autoren (3000 journals) http: //www. ncbi. nlm. nih. gov/Pub. Med/ CURRENT CONTENTS wöchentlich erstelltes lnhaltsverzeichnis wichtiger Journals SCIENCE wie häufig wurde eine Publikation zitiert CITATION INDEX Quade
Zwei Verfahren der Indexierung Einfacher Index über alle Worte z. B. WAIS Alle Worte werden in den Index aufgenommen Auch Worte wie Ich, Du, Er, Sie, Es, Das, und, aber, wie, . . . Keine Bestimmung von Häufigkeit und Wichtigkeit Index mit Thesaurus z. B. Xindex mit UMLS-Metathesaurus Es werden nur relevante Begriffe in den Index aufgenommen Was Relevant ist wird an Hand von UMLS bestimmt Berechnung der Häufigkeiten von Worten und Wortgruppen Berechnung der Dichte dieser Worte und Wortgruppen
Vorteile intelligenter Systeme Erkennen von Wortkombinationen z. B. Breast Cancer Gleiches Suchergebnis bei unterschielicher Schreibweise z. B. hpv und HPV z. B. MTX und Methotrexat Sinnvolles Suchergebnis bei trivialen Begriffen z. B. love --> HPV, Cervixcarzinom, Brustkrebs Es werden Dokumente in verschiedenen Sprachen gefunden z. B. Englisch, Deutsch und Spanisch
Vorteile von Xindex gegenüber WAIS Beispiel Melanom
Vorteile von Xindex Es werden seltene Entitäten gefunden: Suche nach „Melanom“ liefert Informationen zum „Wilms Tumor“ Dieser steht in Verbindung zum „clearcellsarcoma“ einer seltenen Form des Melanoms Erkennen von Synonymen z. B. Mumps, Parotitis epidemica
Der UMLS-Metathesaurus Integration vorhandener Thesaurie: ICD 10, MESH, Cancerlit, HL 7 -Zusatz Mehrsprachig: z. B. Englisch, Deutsch, Spanisch, Russisch, Französisch, Finnisch, Italienisch, . . . Konzeptorientierung: Jedes Konzept bekommt eine Nummer (CUI) Jedes Synonym jedes Konzeptes bekommt eine eigene Nummer in verschiedenen Sprachen sowohl normalisiert (SUI) als auch nicht normalisiert (LUI) Kennzeichnung des „Preffered Terms“
Nutzerprobleme • Wie finde ich als Laie eine Information? • Wie kann ich die Seriosität einer Information erkennen (weit mehr fragliche Informationen denn gute) ? • Wie finde ich beim Anbieter eine Information trotz bildorientierter Oberfläche?
Was man wissen sollte! • Suchmaschinen lesen über „Spider“ Dokumente ein und erstellen einen Volltext-Index (nicht bei Datenbanken, Graphiken, Java). • Metatags werden nur bedingt ausgewertet. (Anbieter manipulieren „auf Teufel komm raus“) • Ranking ist nicht intelligent und bevorzugt kurze Dokumente. • Für Geld wird das Ranking manipuliert!
Meta-Tags <META NAME="keywords" CONTENT="Breast cancer, oncology, Cancer, medicine, Medizin, Krebs, Cancer. Net, PDQ, Tumor"> <META HTTP-EQUIV="RESOURCE-TYPE" content="document"> <META name="description" content="Breast cancer">
Qualitätssiegel • Geschütztes Logo einer anerkannten Organisation (NCI) • HON Code of Conduct • Link von einer anerkannten Organisation (WHO) • Med. CERTAIN
Evaluation kommerzieller Anbieter • Kriterien für Focus Recherche – Nutzen für den User – Kostensenkung durch weniger Arztbesuche – Richtigkeit und Ausgewogenheit – Vollständigkeit – Online-Arzt vorhanden
• Ergebnis der Recherche für Focus – Der User kann einen Arzt finden. Ein Hausarzt-Buch ist auf mehrere Tausend Pages aufgeteilt. – Der User verbringt viel Zeit für wenig Information im Netz. Seiten werden aus Datenbank generiert. Viele Wege führen zur gleichen Seite. – Bachblüten und Standardtherapie gleichwertig im Angebot. – Nur Infos vom eigenen Server. Suche extrem schwierig (Stunden) da Information versteckt. – Online-Arzt ist nicht hilfreich für eigene Fragen (Show).
Was will der Nutzer? • • Informationen zu Krankheiten Informationen zu eigenen Werten Zugriff auf die eigene Patientenakte Informationen zu Arzt, Krankenhaus oder Versicherung – Sprechstunden, Besuchszeiten, Parkplatz – Benchmarking im Qualitätsbereich Link – Versicherungsvergleich
Aufbau von Suchmaschinen Spider / Crawler (robot. txt) Indexer Broker (Schnittstelle zum Benutzer)
Spider / Crawler Nur ein Teil des WWW-Bereichs wird von einem Crawler erfaßt. Häufig werden Links nicht weiterverfolgt bei: dynamisch gestalteten Webseiten, Frames, Java und Bildern.
robots. txt User-agent: * Disallow: /usage/ Disallow: /dimdi/ Disallow: /standards/HL 7/ Disallow: /niedergel/ Disallow: /epileptologie/epi_info/physicians/
Ranking Schlüsselwortdichte (Benachteiligung ausführlicher Dokumente) Meta-Tags (oft manipuliert) Link Popularity (science citation index) Verkauf von Ranking-Prioritäten statt Werbung Neuere Ansätze
Aktualität Anzahl der Dokumente überschreitet die Kapazität der Suchmaschinen Scannen der Dokumente in mehrmonatlichen Abständen Zulassen mehrerer „no connection„ für bereits indexierte Dokumente Keine Strafen für tote Links in Dokumenten
Verzeichnisse Qualität der Bewertung liegt allein bei dem Redaktionsteam Nur wenige Dokumente können erfaßt werden Großer finanzieller Anreiz zur Manipulation
Benutzerschnittstelle
- Slides: 53