Web browsere sking m m Pensum Olsen kap
Web – browsere, søking, m. m. Pensum: Olsen, kap. 8 -17
Historikk n n 1991 – første Browser utviklet av Tim Berners-Lee 1993 Mosaic (NCSA, Marc Andreessen) 1995 Netscape (Andreessen et al) 1995 Internet Explorer (Microsoft, basert på Mosaic)
Oppgave n n n Vise Web sider Utfører GET-kommandoer for å hente sidene Presenterer sidene ut fra taginformasjonen Forenkle administrasjon (favoritter, sidehistorikk, oppsett…) Utføre programmer (script og applets)
Surfing n n n Kort tid mellom klikkene Skanner sider mer enn å lese Følger linker Mye bilder, lite tekst Krever kjappe responstider
Skjema - form n n n Meget viktig funksjon Vi kan nå bruke HTML også for inndata Gir muligheter for en lang rekke applikasjoner: n n n n Billettbestilling Banksystemer Ordresystemer m. m. Data fra forms blir hentet ut på serversiden Med form-begrepet kan vi altså bruke HTML som et grensesnitt mot andre systemer Gir standardisering på brukersiden, grunnlaget er nå lagt for B 2 C applikasjoner
Mer n Script, applets: n n n Cookies: n n Server kan identifisere bruker Plug-ins: n n En del kontroller kan gjøres i brukergrensesnittet i Browseren Mer dynamiske brukergrensesnitt Vi kan utvide funksjonaliteten til browseren Sertifikater: n Browseren kan identifisere serverapplikasjonen (f. eks. et banksystem), serveren kan identifisere bruker (en bankkunde), kryptografert overførsel (HTTPS)
Web n Inhomogene data: n n n n Hjemmesider til personer Hjemmesider til organisasjoner Offisielle rapporter Stiler, kursinnleveringer, øvingsoppgaver Amatørorganisasjoner Aviser Blogger …
Lavt formaliseringsnivå n n n Mesteparten av data er formalisert på tegn/layout nivå (HTML, PDF) Samtidig er noe formalisert på høyt nivå (billettbestillingssystem, banksystem) Vi må skille mellom systemer: n n der data er lagret som tilgjengelig som f. eks. HTML (”ekte Web”) der data ligger i lukkede databaser og der Web brukes kun for brukergrensesnitt
Tilgjengelig/utilgjengelig n n Mye er tilgjengelig for alle, men ikke alt Mye data er lukket inne bak innloggingsprosedyrer: n n n Banksystemer Bibliografiske databaser Noen avisarkiv m. m. Her har en ofte høyere formaliseringsnivå
Enveis linker n n n Vi kan linke dit vi vil, ingen sentralisering Men ulempen er at linken kan gå til en side som er fjernet/endret Toveis linker ville rettet på dette, men ville vært langt vanskeligere å administrere
Søking Precision = # relevant returned # returned Recall = # relevant returned # relevant in total
Web søking n Komplisert ved: n n Datamengden Inhomogen database Naturlig språk Forenklet ved: n At vi ofter ute etter å finne noe informasjon, og der mye av det vi finner løser vårt informasjonsbehov
Søkemotorer n n Stikkordbasert Prioritering basert på antall forekomster Prioritering basert på viktigheten til siden (Google) Prioritering basert på betaling, annonser
Information overload No 1. 2. 3. 4. 5. 6. 7. 8. Query information AND retrieval “information retrieval” full AND text AND information AND retrieval “information retrieval” AND “full text” “full text information retrieval” information AND overload “information overload” “information retrieval” AND “information overload” # returned 80, 000 20, 000 10, 000 2, 000 40 10, 000 40
Filtrering n n Vi ønsker kanskje å fjerne en viss type sider fra søket eller fra eposten (porno, SPAM. . ) Kan eliminere ut fra ord i teksten, ut fra farge på bilder (hudfarge) Kan eliminere sider på visse adresser, epost fra visse avsendere Kan la noen kategorisere sidene for oss
I praksis n n Ingen av metodene fungerer 100% Et filter kan fjerne mesteparten av SPAM men ikke alt Fjerner også noen genuine meldinger/sider Problem: n Formalisering
Kvalitet n n Siden alle kan legge inn data på Web får vi et demokratisk system Til gjengjeld har vi ingen kontroll med kvaliteten av det som blir lagt ut Derfor må vi vurdere informasjonen ut fra hvem som har generert denne Det er kanskje en fordel, som vi ser er verken myndigheter eller media ”objektive”.
Portaler n n n Organiserer informasjonen på Web Hele Web (Yahoo) For et firma, bransje, markedsplass, etc. ”Alt på ett sted” tanke Data organiseres ofte i menyer, greit om vårt informasjonsbehov kan klassifiseres på samme måte Kjente organisasjoner i den fysiske verden (f. eks. vg, nrk, tv 2) forsøker å utnytte sin posisjon til å etablere portaler
Tilstedeværelse på Web n n n Mange har sin hjemmeside på nettet Demokratisk at vi alle kan ha vår side her Problemet er å skape trafikk – hvordan gjør vi det? n n n Kan vi gjøre linken kjent? Kan vi bli ”utvalgt” av søkemotorene? Lettere for VG enn for Ola Nordmann Lettere for et hotell i Honningsvåg enn i London Undersøkelser viser at 75% av trafikken går til noen få Web steder
Mobil databehandling n n n Relativt nytt – ”hot” tema Du har kontoret ditt der du er Fantastisk nyttig for enkelte, mer marginalt for andre Vi kan snakke mens vi er mobile, ikke like lett å håndtere PC’en Mange nettløsninger: n n n Flere typer av enheter: n n n Mobiltelefoni (GSM, WAP, GPRS, UMTS) Radiosamband (Bluetooth, WLAN) mobiltelefon, PDA, PC Enkle brukergrensesnitt blir viktig: Talestyrte systemer (du kan be om avgangstider for fly) Automatiske systemer (henter fram avg. tid for det flyet du er booket på) Push-teknologi (SAS sender deg informasjon om flyet)
Push teknologi 0700 a. m. Thursday 4. October Traffic, no delays. Trains delayed. Buses on schedule. Weather Temp: 25 HUMIDITY: 87% WIND: WSW at 9 mph SUNRISE: 06: 08 am Forecast: Partly sunny, COLDER, … Freezer temp. low Alarms working. Headline news: New airline merger Blue chips rally on Wall Street Hurricane warning email (filtered): FROM SUBJECT RECEIVED Joe Meeting 10/04 08: 43 09. 00 Department meeting 10. 00 Lecture 12. 00 Lunch with project team 14. 30 Airport
Dynamiske Web sider (server scripts) Eksempel – framhenting av informasjon om ansatte
Kode for skjemaet <FORM> ACTION=”http: //www. firm. com/employee. asp” METHOD=post id=userdata name=userdata> <p>To get contact information, give last name of employee: </p> <INPUT type=text name=lastname size=40 maxlength=60> <INPUT name=info type=submit value=”Get info”> </FORM>
Prosedyre n n n n Skjemaet vises av browser Vi fyller ut navn og trykker knappen Data fra skjemaet sendes til serveren Serveren starter applikasjonen (asp) Applikasjonen plukker ut navnet Slår opp i databasen og genererer en Web side med resultatet
Script Dette kjøres på serveren Henter fram data om personen med det oppgitte navnet Legger svaret inn i en HTML side <%@ Language=VBScript %> <% set DBObj= Server. Create. Object("ADODB. Connection") DBObj. Open "Employee" %> <HTML> <HEAD> <TITLE>Directory</TITLE> </HEAD> <BODY> <H 2>Contact information for <%=Request. Form("name")%> </H 2> <% set stdset=db. Obj. Execute("SELECT * FROM employee. Table WHERE name = '" & Request. Form("name") & "'") if stdset. eof then Response. Write("<p>No persons fulfilled search request</p>") else Response. Write("<p>Phone: " & stdset("phone") & "</p>") Response. Write("<p>Email: " & stdset("email") & </p> ") end if stdset. close db. Obj. close %> </BODY> </HTML>
Viktig n n Med dette kan vi bruke Web som et standardisert grensesnitt til andre applikasjoner Vi kan tilby bank, billett, og andre tjenester uten å måtte installere egne programmer hos brukerne Serveren kan holde orden på hva brukeren har gjort, så nå frir vi oss fra den tilstandsfrie standard Web-løsningen Basis for B 2 C applikasjoner
Script i browser n n n Kan gjøre det mulig å utføre enkle valg og kontroller i browseren Små programmer som browseren kan utføre uavhengig av server Øker funksjonaliteten i Web grensesnitt
Peer to Peer computing n n n Utnytter at datamaskiner står i nett Programmer som administrerer nettverket Med eller uten en sentral maskin Robuste systemer, uavhengig av enkeltkomponenter i systemet Eksempler: n n Fildeling (musikk, video, …) Store beregninger (mange PC er erstatter en supercomputer)
- Slides: 28