Gurusoft Adaptiivista kieliteknologiaa Timo Honkela Tutkimusjohtaja fil tri

  • Slides: 11
Download presentation
Gurusoft: Adaptiivista kieliteknologiaa Timo Honkela Tutkimusjohtaja, fil. tri Gurusoft Oy Kaupallinen kieliteknologia, Helsingin yliopisto

Gurusoft: Adaptiivista kieliteknologiaa Timo Honkela Tutkimusjohtaja, fil. tri Gurusoft Oy Kaupallinen kieliteknologia, Helsingin yliopisto 23. 9. 2002

Agenda �Gurusoftin tausta ja kehitys �Fokusoituminen nykypäivään �Tulevaisuudennäkymät

Agenda �Gurusoftin tausta ja kehitys �Fokusoituminen nykypäivään �Tulevaisuudennäkymät

Gurusoft: yleistä �Taustalla pitkäaikainen tutkimus Teknillisessä korkeakoulussa; kokemuspohjana myös Sitran kielikoneprojekti ja VTT Tietotekniikka

Gurusoft: yleistä �Taustalla pitkäaikainen tutkimus Teknillisessä korkeakoulussa; kokemuspohjana myös Sitran kielikoneprojekti ja VTT Tietotekniikka �Perusmenetelmä, Kohosen itseorganisoiva kartta julkaistu 1982; idea dokumenttikartoista 1990, keskittynyt tutkimus alkoi 1995, valmius kaupallistamiseen 1997/1999

Gurusoft: yleistä �Kolme rahoituskierrosta: - R. Linturi Oyj (2000) - joukko yksityissijoittajia (2001) -

Gurusoft: yleistä �Kolme rahoituskierrosta: - R. Linturi Oyj (2000) - joukko yksityissijoittajia (2001) - joukko yksityissijoittajia (2002) �Kolme toimitusjohtajaa: - Timo Honkela (2000 - 2001) - Raimo Tuuli (2001 - 2002) - Mikko Myyryläinen (2002 - )

Perusidea �Auttaa suurten tekstimäärien hallinnassa �Tukee tiedon löytämistä ja kokonaisuuksien hahmottamista (Text Mining, Information

Perusidea �Auttaa suurten tekstimäärien hallinnassa �Tukee tiedon löytämistä ja kokonaisuuksien hahmottamista (Text Mining, Information Discovery) �Tekstien automaattinen järjestäminen sisällön perusteella automaattisesti visuaaliseksi, vuorovaikutteiseksi kartaksi

Karttakonsepti Tekstidokumentteja analyysi GS Textplorer -kartta

Karttakonsepti Tekstidokumentteja analyysi GS Textplorer -kartta

Dokumenttikartat: periaatteet �Dokumentit järjestetään automaattisesti koko tekstisisältönsä perusteella �Samansisältöiset tekstit sijoittuvat lähelle toisiaan �Kartta

Dokumenttikartat: periaatteet �Dokumentit järjestetään automaattisesti koko tekstisisältönsä perusteella �Samansisältöiset tekstit sijoittuvat lähelle toisiaan �Kartta nimikoidaan automaattisesti kutakin aluetta kuvaavilla sanoilla ja fraaseilla �Analyysissa säästyy työtä - haluttaessa valmiita sanastoja voidaan käyttää apuna ja painotuksia voidaan valita

Dokumenttikartat: käyttötavat �Haku: annetaan hakusanoja tai esimerkkidokumentti; löydetään niitäkin relevantteja tekstejä, joissa hakusanaa ei

Dokumenttikartat: käyttötavat �Haku: annetaan hakusanoja tai esimerkkidokumentti; löydetään niitäkin relevantteja tekstejä, joissa hakusanaa ei ole käytetty �Selailu: voidaan perehtyä 'karttamaastoon' ja saada kokonaiskuva aineistosta �Suodatus: järjestelmän voidaan antaa valikoida uusista dokumenteista todennäköisesti kiinnostavat tai ne, jotka eivät kiinnosta (nk. agenttiteknologia)

Dokumenttikartat: esimerkkejä �Uutisten ryhmittely �Patenttikartta �Osallistujakartta �Osaamiskartta �Palautekartta �Hakutulosten kartta

Dokumenttikartat: esimerkkejä �Uutisten ryhmittely �Patenttikartta �Osallistujakartta �Osaamiskartta �Palautekartta �Hakutulosten kartta

Fokusoinnista ja tulevaisuudesta �Runsaasti potentiaalisia käyttökohteita �Tarve fokusoitua: tuotekehityksen ja markkinoinnin tarpeet �Myynnin alueet:

Fokusoinnista ja tulevaisuudesta �Runsaasti potentiaalisia käyttökohteita �Tarve fokusoitua: tuotekehityksen ja markkinoinnin tarpeet �Myynnin alueet: suora myynti, OEM-kauppa

Kiitokset! Yhteydenotot: timo. honkela@gurusoft. fi, www. gurusoft. fi

Kiitokset! Yhteydenotot: timo. honkela@gurusoft. fi, www. gurusoft. fi