Seminar Agentensysteme Multiagentensysteme in der Informationssuche berblick ber
Seminar Agentensysteme Multiagentensysteme in der Informationssuche Überblick über bestehende Technologien und Entwicklungsperspektiven Dariusz Kordoński
Agenda I. traditionelle Informationssuche im Internet • Einführung in Information Retrieval • Grundlagen von IR • Web-Suchmaschinen • das Problem des Informationsüberflusses II. Agenten in der Informationssuche • Grundlagen • Überblick über Technologien • Mängel der Suchagenten III. Multiagentensysteme • Grundlagen • Vorteile der Multiagentensystemen 2
Agenda IV. der „biologische Ansatz” in der KI • neuronale Netze • der genetische Ansatz V. praktische MAS-Anwendungen in der Suche • die Info. Spiders- und My. Spiders-Systeme • das Amalthaea-System VI. die Entwicklung • Entwicklungsperspektiven • der Konzept einer evolutionären Suchmaschine VII. Fazit 3
Einführung in die IR Traditionelle IR im Internet Information Retrieval Informationswiedergewinnung Informationsbeschaffung Informationsrückgewinnung Agenten im Suchen Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit „… die Nutzende mit Informationen zu versorgen” computergestützte, inhaltsorientierte Suche 4
Einführung in die IR Traditionelle IR im Internet Agenten im Suchen Multiagentensysteme Herausforderungen des Internets: Ø verteilte Daten Ø größer Anteil der wandelbaren Daten Ø riesige Ausmaße Biologie in KI Ø unstrukturierte und überflüssige Daten Praxisbeispiele Ø niedrige Qualität von Daten Entwicklung Ø heterogene Daten Fazit Die wichtigste Methoden: Ø Web-Suchmaschinen Ø Webkataloge Ø Hyperlink-Suchen 5
Grundlagen von IR Traditionelle IR im Internet Agenten im Suchen Multiagentensysteme Biologie in KI Praxisbeispiele Ø das Vektorraummodell Ø die tf-idf-Gewichtung Ø precision und recall Entwicklung Fazit Ø technische Tools (parsing, noise-word-Beseitigung, stemming) 6
Web-Suchmaschinen Traditionelle IR im Internet Die Architektur Agenten im Suchen Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit ü sofortige Antwort auf die Anfrage SKALIE BAErgebnisse ü Rangliste. Rder RKEITS MANGE L ü Kostensenkung durch Indizierung 7
Informationsüberfluss Biologie in KI Praxisbeispiele Entwicklung e es lle Di ue n. as , an de ch d st or n m s e ur fa rv et f he ern ie au hw d ge n n, rsc lich en xe t ich en nt , d ne ve bild m do jetz ndl list isut I sen E- alle n e niies i z is t. ) ö zu r am ra e r g it eh us pa ln un erbd btee rfn ha e? eh Ze rd s t: Z der inze zu Erbge. Ducah edü en zcz E ng n, a enes B og s en t m die wi ell u ch he on est b z der uga uhfeat tesh G llen gez , (je ing i n uc ti rg e s Z rn sda a d s S itua da s W das en genne bte, er sich ice be ch S itat da n, nkt fraatio nrkins g il d ch erv ien si Z hrt tio rä Arnm Lrib Te na b S log ann fü itua sch hnefo vtonve ger ts We hno n k S nbe rlnic. I n. Zei inzi rne s, ec Ma u füehle otnee. w nte up n T e. i is I o usv ielli eeinn es gr ene uch r a us Mm niunrd g d ws zog nss h se e a ng f lun , ne tbe atio i d urfi ick rce ne rm r S ntw me te fo E m In e In co iese dig d än st Multiagentensysteme üb lic , seh rden zers zum nherwn r ua ut ein igeÜb he eise die w usefn er m cer n d o n a Scuhe ues B ührliamndv e, sp. Zrsou inggaeng ie Re M r n c e i f d o illioieberdsheet brezenrbedstan von geln p. Ern ging nue kte u. Atn, vo d sin es igtuwnic nur dim lieddedie d h en, ers e w umneevrndoebnnefdreagerin k t b coilm re lunghenseineh. Psw. Bin u dedi. Lg. Kin. Iustneng rgugemndurecftnurdernutz nk edtiee gm a c u r Dw d B ninr loigkussutsnna fennie c o d d rw ärig ic e. Oenr Bevon n P ige stäft ssoe In sper , nne. Pgreosb Inaktsoutzm eerimplötim e lemter ebptle Tetzenprbraeozin secthszehsipt d. Ewersegig e inem rig änd s. O ndigtebeterinligeustdewllesr N x il n o t B u o r e e p e grro. Pe n, etsnaunpsprdoicrehle t v. ng. Ihn. Ze, n. inbneis s in nggtabrezeznu nk e. Inteu t e r ll H m d u e u n m t e B u e m m en s oze n f h a p u s i a o rsa liste P itbc cisa ig ell des D o. Blg ormliachaongeennendrf. ie r üs. Dlln, tsie k. SW utunvgdeaehrilnsurtedarneenhtzrege s bei is n he ding chp en eigref ftüasnugf m nednnde em n. PulöT rv etio a. Ssse. Beoneebgtrs. ZSnwcuoehugnicaehllrenogub. Sle. Bm öd t d rrigdieän. Vd nusn. res. Onp, r ecrw w s le h h be Su o e n P s e e s it b nc liigcehc eu t essrw B uz nünrfe Int or, öes ie vfü hstr dgie vevrs Produeurc hg sth nfaodtloio e viceneds cohgeen nnis, sae ernet mlt m am ispiie ozeinitdz. u. S ebrilednli. choernignm eneen, r. Z eönfadensr. dodsu. Mc. erc. Oehgin d h unf, e t e sgtäsetsa. Zpn s ann d gniewnir , en(. je. D ie d a iep esrw s B dineichitinhgümblic esvm teährkr ssiabmm ezeuligsaum n. Zduobrx. W kasn bde siezsc Zte. it. E- ie de. Ssis ere Algboeurdchd. Soeeurcddhenhw ir o s d e u e e e n t Z s e i d e S g d t w n nnndd nllg n a ein eze? zu t: d i la. R nbarak p ee t r m n. Z mouatiboea te esre Ein tische icke. Sltait u udeie ) rerduiepgunch ejet tzb a he itsaic hgr e e rpletimaarg w fiend ndvo zie rldbieegnin. Pz. Seeuglne e. BSzuitutumnaseoÜgnzdulidc ngef thdar bnildli alle gen e ent m Üb. Züeitbat rd e. E endi Djzeu. O ausle. Ine, bse t f triodbniee, rgeranpag asst gest ch h ra arsau. Wm Hert hdreigr am Suc orie vo mit äanpng. Zssu. eraztb buenstbe hbdte htanddllsim dbeaersi smvonr Zko n feüin ustgm , m hretmellt: adszesu ravo usst leaxe h Zfü d n g o e t, e e o c ä ic o a w h m z ti n e n u h s te u i h u d I T sch dte d Zu nfo s n. GPgeros ble uaigte, , ürä t xe eron tu getiornpzu n SZe. Siträft der iebnkrg re er Enicnht imams stand in inre dnarhmat, zu u m a ifceh n m h beeschhd eerm KI, immte besch in a g tnee änn, ktm er de t tbfoddas Seurb e unb stne. In ri. Gndget, eis un e it dezene r ted tionib s bes sst, b stimiemlete m en nd. Ulinmneng lnne man K eitmv. Ziel daesriunc, Zko v fa h v e von te ri. Zteari um h eit veplizhieartt ecÜ ie meis n. en zufried eteinze Lö b , rbrng ab erg leanngsr en st u f su e d in zu e n ellein e fi deerfgüt, dfinr deien, die geln. n. llt as t ich ste d n gt un edin ie be b ld n he un a lc b glo In so d die in ist. en s hen Fäll etisc en m n ge orith rs Alg onde t, da s be igne e ge den sraum sie tand en s Zu usag soz allel r pa Agenten im Suchen üb zu liche ein m Ü rwe an em berg ise d be dere Zust ang ie R im ste b n vo and von egeln se mer ede rlie in d g Pro hr ko der utet en en st ble mp opt nich Der im e ll en men lexe ale t de , m n. I n rfü it llt den en Traditionelle IR im Internet Index Web Ø Größe des Internets vs. Möglichkeiten der Suchmaschine Fazit Ø Zeit des Wiederbesuches durch einen crawler Ø Menge und Relevanz der gelieferten Links 8
Agenda I. traditionelle Informationssuche im Internet • Einführung in Information Retrieval • Grundlagen von IR • Web-Suchmaschinen • das Problem des Informationsüberflusses II. Agenten in der Informationssuche • Grundlagen • Überblick über Technologien • Mängel der Suchagenten III. Multiagentensysteme • Grundlagen • Vorteile der Multiagentensystemen 9
Grundlagen der Agenten Traditionelle IR im Internet Aufgabedelegierung autonome Erfüllung Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit Entlastung des Benutzers Ø Autonomie Ø Intelligenz selbständige Bewertung der Relevanz Wissensdarstellung Filterung der Ergebnisse. Ø Reaktivität Schlussfolgerung Ø Proaktivität Lernen Ø Kommunikation Kontexterkennung Ø Mobilität … lokale Zugriff auf Information Ø Sozialverhalten Leistungssteigerung (Zukunft) Ø Adaptivität Ø… 10
Überblick über Technologien Traditionelle IR im Internet Ø Web-Roboter Agenten in Suche Multiagentensysteme Ø Informationssuchagenten Biologie in KI Praxisbeispiele Entwicklung Ø Informationsfilteragenten Fazit Ø kollaborative Agenten 11
Mängel der Suchagenten Traditionelle IR im Internet Beruhung auf den traditionellen Tools Agenten in Suche Multiagentensysteme ü Erweiterung precision Biologie in KI ü Intelligenz recall Praxisbeispiele ü Teilentlastung Entwicklung Fazit Das Problem des Informationsüberflusses wird nicht gelöst! 12
Agenda I. traditionelle Informationssuche im Internet • Einführung in Information Retrieval • Grundlagen von IR • Web-Suchmaschinen • das Problem des Informationsüberflusses II. Agenten in der Informationssuche • Grundlagen • Überblick über Technologien • Mängel der Suchagenten III. Multiagentensysteme • Grundlagen • Vorteile der Multiagentensystemen 13
Grundlagen Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit Ø mehrere Agenten Mehragentensysteme beschränkte Sicht auf die Umgebung keine globale Steuerung Dezentralisierung der Daten asynchrones Handeln Multiagentensysteme Ø DPS vs. MAS 14
Vorteile der MAS Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Internet MAS verteilte Daten ü verteilte Daten dynamische Struktur ü schnelle, lokale Anpassung riesige Ausmaße ü Skalierbarkeit Praxisbeispiele Entwicklung Fazit ü Mangel der zentralen Planung unstrukturierte und überflüssige ü ständige dezentrale Daten Entwicklung niedrige Qualität von Daten heterogene Daten ü heterogene Architektur 15
Agenda IV. der „biologische Ansatz” in der KI • neuronale Netze • der genetische Ansatz V. praktische MAS-Anwendungen in der Suche • die Info. Spiders- und My. Spiders-Systeme • das Amalthaea-System VI. die Entwicklung • Entwicklungsperspektiven • der Konzept einer evolutionären Suchmaschine VII. Fazit 16
Neuronale Netze Traditionelle IR im Internet Ø Vorbild: menschliches Gehirn Agenten in Suche Ø „Neurone” durch gewichtete „Synapsen” verbunden Multiagentensysteme Biologie in KI Ø Änderung des Zustandes („Aktivierung”) durch Eingabe (input) von anderen Zellen Praxisbeispiele Ø Ausgabe (output) aufgrund einer bestimmten Aktivierung Entwicklung Fazit Ø Haupteigenschaft - Lernfähigkeit 17
Der genetische Ansatz Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Ø Vorbild: die Evolution in Natur Ø „Chromosome” bilden die Population Ø Bewertung von Fitness („Güte”) Ø Charles Darwin – Überleben des Stärkeren Biologie in KI Praxisbeispiele Entwicklung Fazit Probabilistische Auswahl der Fitness-stärken Chromosomen Ø ständige Steigerung von Fitness: Reproduktion Cross-over Mutation 18
Der genetische Ansatz Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Eigenschaften paralleles Verfahren Flexibilität Rauschen dezentrale Anpassung Biologie in KI Praxisbeispiele Entwicklung Fazit Multiagentensysteme Internet 19
Agenda IV. der „biologische Ansatz” in der KI • neuronale Netze • der genetische Ansatz V. praktische MAS-Anwendungen in der Suche • die Info. Spiders- und My. Spiders-Systeme • das Amalthaea-System VI. die Entwicklung • Entwicklungsperspektiven • der Konzept einer evolutionären Suchmaschine VII. Fazit 20
Info. Spiders/My. Spiders Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele Info. Spiders - Einleitung Ø Multiagentensystem zur Suche im Internet Parallele, autonome Informationsauffindung Ø Hyperlink-Suchen-Ansatz Verfolgung der Graf-Struktur, ohne Indizierung Ø Realisierung der genetischen Methoden Entwicklung Bewertung von Fitness Fazit Reproduktion, Mutation, Crossover, Elimination Ø Anpassung Verwendung von NN, Lernen mit Relevanzrückmeldung Dynamische Anpassung der Querende 21
Info. Spiders/My. Spiders Traditionelle IR im Internet Info. Spiders – Architektur eines Spider Adresse und Zurück-Link Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele HTML Parser „noise-word”-Eliminator Stemmer Dokumentvektor Energie Relevanzrückmeldung Entwicklung Fazit Der Genotyp Stichwörter 22
Info. Spiders/My. Spiders Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit Info. Spiders – der Algorithmus (1/4) Moment N <!DOCTYPE html PUBLIC "-//W 3 C//DTD XHTML 1. 0 Transitional//EN" "DTD/xhtml 1 transitional. dtd"> <html> <head> <title>odge Wö rterbuch - Ü bersetzung Deutsch-Englisch</title> <meta name="description" content="Englisch-Deutsch Ü bersetzungen kostenlos"> <meta name="keywords" content=" Ü bersetzung Deutsch-Englisch, ü bersetzungen, wö rterbuch, wö rterbü cher, translation"> <LINK Rel=stylesheet TYPE="text/css" HREF="http: //odge. de/styles. css"> </head> <body onload="document. s. kw. focus(); "> <a name="oben"></a> +- Kosten Gewinn <div style="background-color: #fff; border: 1 px solid #000; width: 780 px; height: 100%; "> <A HREF="http: //odge. de/"><img alt="Wö rterbuch" src="http: //odge. de/logo. jpg"></a><div style="background-color: #71 BFFF; paddingleft: 10 px; padding-right: 10 px; padding-top: 3 px; padding-bottom: 3 px; border-bottom: 1 px solid #999; margin-bottom: 15 px; overflow: hidden; height: 18 px; "> <A HREF="http: //odge. de/deutsch/a/">Beginnend mit "a"</a> Kostenlose Ü bersetzungen beim Deutsch-Englisch online Wö rterbuch odge. de Aktuell mit mehr als 420. 000 Begriffen. Czlmcsalc; szkc’; azlsc ‘; ascs’; , aszclsa’; ldx’as <A HREF = "http: //www. restposten-plattform. de">Restposten-Plattform. de</a> Cazsasxcx Zxxczczxc </html> 23
Info. Spiders/My. Spiders Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit Info. Spiders – der Algorithmus (2/4) Moment N <!DOCTYPE html PUBLIC "-//W 3 C//DTD XHTML 1. 0 Transitional//EN" "DTD/xhtml 1 transitional. dtd"> <html> <head> <title>odge Wö rterbuch - Ü bersetzung Deutsch-Englisch</title> <meta name="description" content="Englisch-Deutsch Ü bersetzungen kostenlos"> <meta name="keywords" content=" Ü bersetzung Deutsch-Englisch, ü bersetzungen, wö rterbuch, wö rterbü cher, translation"> <LINK Rel=stylesheet TYPE="text/css" HREF="http: //odge. de/styles. css"> </head> <body onload="document. s. kw. focus(); "> <a name="oben"></a> <div style="background-color: #fff; border: 1 px solid #000; width: 780 px; height: 100%; "> <A HREF="http: //odge. de/"><img alt="Wö rterbuch" src="http: //odge. de/logo. jpg"></a><div style="background-color: #71 BFFF; paddingleft: 10 px; padding-right: 10 px; padding-top: 3 px; padding-bottom: 3 px; border-bottom: 1 px solid #999; margin-bottom: 15 px; overflow: hidden; height: 18 px; "> <A HREF="http: //odge. de/deutsch/a/">Beginnend mit "a"</a> Kostenlose Ü bersetzungen beim Deutsch-Englisch online Wö rterbuch odge. de Aktuell mit mehr als 420. 000 Begriffen. Czlmcsalc; szkc’; azlsc ‘; ascs’; , aszclsa’; ldx’as <A HREF = "http: //www. restposten-plattform. de">Restposten-Plattform. de</a> Cazsasxcx Zxxczczxc </html> 24
Info. Spiders/My. Spiders Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit Info. Spiders – der Algorithmus (3/4) Moment N <!DOCTYPE html PUBLIC "-//W 3 C//DTD XHTML 1. 0 Transitional//EN" "DTD/xhtml 1 transitional. dtd"> <html> <head> <title>odge Wö rterbuch - Ü bersetzung Deutsch-Englisch</title> <meta name="description" content="Englisch-Deutsch Ü bersetzungen kostenlos"> <meta name="keywords" content=" Ü bersetzung Deutsch-Englisch, ü bersetzungen, wö rterbuch, wö rterbü cher, translation"> <LINK Rel=stylesheet TYPE="text/css" HREF="http: //odge. de/styles. css"> </head> <body onload="document. s. kw. focus(); "> <a name="oben"></a> <div style="background-color: #fff; border: 1 px solid #000; width: 780 px; height: 100%; "> <A HREF="http: //odge. de/"><img alt="Wö rterbuch" src="http: //odge. de/logo. jpg"></a><div style="background-color: #71 BFFF; paddingleft: 10 px; padding-right: 10 px; padding-top: 3 px; padding-bottom: 3 px; border-bottom: 1 px solid #999; margin-bottom: 15 px; overflow: hidden; height: 18 px; "> <A HREF="http: //odge. de/deutsch/a/">Beginnend mit "a"</a> Kostenlose Ü bersetzungen beim Deutsch-Englisch online Wö rterbuch odge. de Aktuell mit mehr als 420. 000 Begriffen. Czlmcsalc; szkc’; azlsc ‘; ascs’; , aszclsa’; ldx’as <A HREF = "http: //www. restposten-plattform. de">Restposten-Plattform. de</a> Cazsasxcx Zxxczczxc </html> 25
Info. Spiders/My. Spiders Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit Info. Spiders – der Algorithmus (4/4) Ø Evolution: Θ – globale Energieschwelle für Reproduktion Crossover – der Stichwortvektor Mutation – der Stichwortvektor und das neuronale Netz (Gewichten) der lokale Kontext bei der Mutation Ø Rangfolge der Ergebnisse: Ähnlichkeit zum Genotyp Fitness des spider Ø Haltbedingungen: Aussterben der Population MAX_PAGES wird erreicht Anweisung des Benuzters 26
Info. Spiders/My. Spiders - Einleitung Traditionelle IR im Internet Ø Realisierung von IS als Java Applett Agenten in Suche Ø Verwendung von Multithreading Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit 27
Info. Spiders/My. Spiders Traditionelle IR im Internet My. Spiders – die Architektur Benutzerschnittstelle Gemeinsame Objekte Agenten in Suche Cache Multiagentensysteme Ergebnistabelle Biologie in KI Praxisbeispiele Namensgeber Log Manager Hilfsprogramme Dokumentenwiedergewinnung, Parsing, Stemming usw. Entwicklung Fazit Spiders Gemeinsame XML Daten 28
Info. Spiders/My. Spiders Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Eigenschaften ü Evolution ü Anpassung ü lokale Selektion ü lokale Verinnerlichung ü selektive Expansion der Querende Praxisbeispiele ü Personalisierbarkeit Entwicklung ü Skalierbarkeit Fazit ü Aktualität ü Mobilität (Zukunft) Geschwindigkeit Suchmaschinen-Abhängigkeit 29
Amalthaea Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit Einleitung Ø Multiagentensystem zum Informationsfiltern Empfehlungssystem (Informationsrückgewinnung und – Filtern) Benutzerrückmeldung bedeutsam Ø künstliches Ekosystem zwei Populationen von Agenten Informationsfilteragenten (IFA) Informationsrückgewinnungsagenten (IDA) „Marktorientierte Kontrolle” Kooperation und Wettbewerb Realisierung des evolutionären Ansatzes Ø Meta-Suche-Ansatz 30
Amalthaea Traditionelle IR im Internet Agenten in Suche IFA - Architektur int Agent ID int Fitness date Entstehungsdatum bool Benutzererschaffungsflag Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit Stichwort ……… … mov cx, 1 int 21 add cx, dx mov dx, 2 …… Schlüsselwortvektor Der Ausführungskode 31
Amalthaea Traditionelle IR im Internet IFA - Algorithmus Ø fordert an und bekommt die Dokumente von IDAs Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit Ø Vergleich mit dem eigenen Stichwortvektor (Kosinusmaß) Ø entscheidet, ob der Benutzer an dem Dokument interessiert wäre (Vertrauensniveau von Fitness abhängig) Ø Benutzerrückmeldung ins Kredit umgesetzt (vom Vertrauensniveau abhängig) Ø Teil des bekommenen Kredits als „Bezahlung” an IDA weitergegeben 32
Amalthaea Traditionelle IR im Internet Agenten in Suche IDA - Architektur int Agent ID int Fitness date Entstehungsdatum array Transaktionsgeschichte Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit Suchmaschine Anzahl der Stichwörter Kombinationsmethode Suchdaten Min Treffer Max Treffer mov cx, 1 int 21 add cx, dx mov dx, 2 …… Der Ausführungskode 33
Amalthaea Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung IDA - Algorithmus Ø bekommt Suchaufträge von IFAs Ø selbständige Wahl des Auftrages aufgrund der Geschichte der Transaktionen (80% der Zeit) Ø drei grundlegende Arten: Beobachten Auffindung Strömung Fazit 34
Amalthaea Praxisbeispiele Entwicklung Benutzerschnittstelle Ekosystem Informationsfilteragenten Informationsrückgewinnungsagenten Beobachten Auffindung Strömung Informationsquellen Kredit Fazit Benutzer Kredit Biologie in KI gefilterte Dokumente Digest Multiagentensysteme Dokumente Agenten in Suche das System (1/2) Rückmeldung Traditionelle IR im Internet Hilfsprogramme 35
Amalthaea Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele Ø Anfang: das System (2/2) verschiedene Methoden zur Erzeugung der ersten Generation der IFAs Erzeugung der IDAs durch zufälliges Zugeben vom Genotyp Ø Kredit/Fitness: Weitergeben an IDAs durch IFAs („Bezahlung”) Entwicklung lineare Verringerung von Fitness als Handelnsanstoß Fazit Strafen für Empfehlung derselben Dokumente Ø Evolution: Reproduktion, Cross-over, Mutation, Elimination Dynamik abhängig von der allgemeinen Fitness Bewertung der IFAs in Interessengruppen 36
Amalthaea Eigenschaften Traditionelle IR im Internet ü Evolution Agenten in Suche ü Anpassung Multiagentensysteme ü Konvergenz zum Gleichgewichtspunkt Biologie in KI Praxisbeispiele Entwicklung ü Personalisierbarkeit ü Aktualität ü Meta-Suche Fazit Suchmaschinen-Abhängigkeit 37
Agenda IV. der „biologische Ansatz” in der KI • neuronale Netze • der genetische Ansatz V. praktische MAS-Anwendungen in der Suche • die Info. Spiders- und My. Spiders-Systeme • das Amalthaea-System VI. die Entwicklung • Entwicklungsperspektiven • der Konzept einer evolutionären Suchmaschine VII. Fazit 38
Die Entwicklungsperspektiven Traditionelle IR im Internet Ø die zurzeit entwickelten Systeme sind nur als Komplementierung der üblichen Methoden vorgesehen Agenten in Suche Multiagentensysteme Biologie in KI Ø sie greifen mehr oder weniger auf die Indexe der Suchmaschinen zurück Praxisbeispiele Entwicklung Fazit Ø die beiden vorgestellten Systeme werden nicht mehr weiterentwickelt Ø die grundlegende Ansätze könnten unter Umständen benutzt werden, um eine selbständige, evolutionäre Suchmaschine zu erschaffen, die Mängel der traditionellen search engines vermeidet 39
Eine evolutionäre Suchmaschine Traditionelle IR im Internet Hauptkonzepte Ø Evolution Agenten in Suche Multiagentensysteme Biologie in KI Ø marktorientierte Kontrolle Ø zwei Populationen von Agenten – IDAs und IFAs Praxisbeispiele Entwicklung Fazit Ø Gestaltung der Populationen durch Anfragen und globale Fitness Ø kollaborativer Ansatz bei Klassifizierung der Anfragen (Interessengruppen) 40
Eine evolutionäre Suchmaschine Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele Informationsrückgewinnungsagenten Ø auf dem Info. Spiders-Konzept basiert Ø Wahl der Aufträge der IFAs Ø Auftragsannahme verursacht Mutation Ø dynamische Gestaltung des Zahlbestandes Entwicklung Fazit Ø Fitness von zwei Faktoren abhängig Entdeckung der relevanten Seiten Kredit von „Auftraggeber” 41
Eine evolutionäre Suchmaschine Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele Informationsfilteragenten Ø auf dem Amalthaea-Konzept basiert Ø „Kampf” um den Benutzer („Versteigerung”) Ähnlichkeit der Querende mit dem eigenen Stichwortvektor Fitness Ø Wettbewerb in Gruppen Entwicklung Fazit Ø kollaborativer Ansatz bei Klassifizierung der Anfrage Ø Geschichte der Transaktionen – die erste Quelle der Antwort Ø Kredit aufgrund Rückmeldung 42
Agenda IV. der „biologische Ansatz” in der KI • neuronale Netze • der genetische Ansatz V. praktische MAS-Anwendungen in der Suche • die Info. Spiders- und My. Spiders-Systeme • das Amalthaea-System VI. die Entwicklung • Entwicklungsperspektiven • der Konzept einer evolutionären Suchmaschine VII. Fazit 43
Das Fazit Traditionelle IR im Internet Ø Information Retrieval im Web ist heutzutage eines der bedeutendsten Fachgebiete der IT Agenten in Suche Ø die Größe und Dynamik des Internets machen ein extrem schwieriges Problem für leistungsfähige Informationsbeschaffung aus Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit Ø die Web-Suchmaschinen, die traditionell das populärste Tool zum Suchen im Internet sind, leiden unter Mängel der Skalierbarkeit Ø die Agenten werden schon seit längerem in Web-IR benutzt, bieten aber keine vollständige Lösung des Problems der Informationsüberfluss Ø Multiagentensysteme erfüllen eine Menge von Voraussetzungen für ein innovatives Internet-Suchsystem 44
Das Fazit Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit Ø die moderne Technologien der KI, die Lösungen der Natur nachahmen, erweisen sich als sehr hilfreich bei Realisierung eines dezentralen Multiagentensystemes Ø die schon seit des Enden des letzten Jahrhunderts vorgenommene Forschung hat zur Entwicklung einiger MAS zur Suche geführt, die erheblich höhere Leistung als traditionelle Suchmaschinen vorweisen Ø diese Systeme greifen aber mehr oder weniger auf die Dienste der Suchmaschinen zurück und werden eher als eine Unterstützung der klassischen Methoden angesehen Ø der Konzept von MAS im Suchen könnte aufgrund der erreichten Ergebnisse weiterentwickelt werden und zur Realisierung eines völlig unabhängigen Systems zur Informationssuche führen 45
Seminar Agentensysteme THE END Danke für Eure Aufmerksamkeit! 46 Dariusz Kordoński
Seminar Agentensysteme HILFSFOLIEN 47 Dariusz Kordoński
Einführung in IR Traditionelle IR im Internet Agenten im Suchen Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit Schwerpunkt: Ø Suche Ø Umsetzung des Bedarfs in für die Maschine verständliche Form Ø Umsetzung des Ergebnisses in eine für den Benutzer verständliche Form Hauptprobleme: Ø Vagheit Ø Unsicherheit 48
Grundlagen von IR Das Vektorraummodell Traditionelle IR im Internet Agenten im Suchen … … … Multiagentensysteme Gewichtung Biologie in KI Abfrage Praxisbeispiele zwischen Entwicklung … … Fazit Ø Dokument … … Gewichtung zwischen den beiden Vektoren kalkuliert. Da alle die Gewichtungen gleich oder größer als 0 sind, nimmt der Kosinus die Werte zwischen 0 und 1 an. Daher kann man auf diese Weise feststellen, inwieweit der Dokument die Abfrage erfüllt und die herausgefundene Dokumente in Hinsicht auf ihre Relevanz ordnen. Einer der bedeutendsten Probleme dabei ist die entsprechende Gewichtung der Schlüsselwörter. Am häufigsten benutzt man eine der Variationen der so genannten term-frequency-inverted document frequency-Gewichtung (tf-idf. Gewichtung). Die Gewichtung des Terms wird aus zwei Werten zusammengestellt. (Termhäufigkeit des Terms im Dokument) ist einfach die relative Häufigkeit des Auftretens des Wortes im Dokument… als eine Kollektion der Schlüsselwörter Ø Jedes Stichwort im Vektor wird in Hinsicht aufs Auftreten in einem bestimmten Dokument gewichtet ( ) Ø Gleich wird die Querende dargestellt ( ) 49
Grundlagen von IR Traditionelle IR im Internet Agenten im Suchen Das Vektorraummodell Ø Das Ähnlichkeitsmaß der Anfrage mit einem bestimmten Dokument – Kosinus des Winkels: Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Fazit Vorteile ü Relativ gute Leistung ü Rückgewinnung nur teilweise übereinstimmenden Dokumente Nachteile Annahme der unabhängigen Terme (umstritten) ü Erschaffung einer Rangfolge in Hinsicht auf Relevanz möglich 50
Grundlagen von IR Traditionelle IR im Internet Agenten im Suchen Die tf-idf-Gewichtung Fragestellung: Wie soll man die Terme im Vektor gewichten? Ø Proportional zu Häufigkeit im Dokument (term frequency): Multiagentensysteme Biologie in KI Praxisbeispiele Entwicklung Ø Umgekehrt proportional zu Häufigkeit in der ganzen Sammlung (inverted document frequency): Fazit Ø das zusammengestellte Gewicht: (daher: tf-idf) 51
Grundlagen von IR Traditionelle IR im Internet Die Bewertungsmethoden Die Sammlung Agenten im Suchen Multiagentensysteme Biologie in KI Aufgefundene relevante Dokumente |Ra| Praxisbeispiele Entwicklung Fazit Relevante Dokumente |R| Gelieferte Dokuente |A| 52
Grundlagen von IR Traditionelle IR im Internet Die Bewertungsmethoden Ø Precision (Präzision): Ø Recall (Vollständigkeit): Agenten im Suchen Multiagentensysteme Ø Precision-Recall-Diagramm - Beispiel Biologie in KI Praxisbeispiele Entwicklung Fazit 53
Der genetische Ansatz Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Biologie in KI Das genetische „Rauschen” Ø Reproduktion 100101011110100 Ø Crossover Praxisbeispiele Entwicklung Fazit 010001110110111 111 011000011001 Ø Mutation 10010 11011110100 54
- Slides: 54