Visuell persepsjon figur grunn objektgjenkjenning spatial lokalisering nettverk
Visuell persepsjon figur/ grunn – objektgjenkjenning – spatial lokalisering – nettverk Anders M. Fjell Psykologisk Institutt, Universitetet i Oslo
n Perception, chapter 4 in Sternberg (2003), Cognitive psychology, 3 rd ed. , p. 108 -147
n Persepsjon (def) – serien av prosesser vi bruker for å kunne gjenkjenne, organisere og forstå sanseinntrykkene vi får fra miljøstimuli
Den perseptuelle prosessen fysisk stimulering sanseopplevelse persept
Et sanseinntrykk og et persept er ikke det samme n Et persept krever kortikal prosessering på et høyere nivå enn et sanseinntrykk n
Sanseintrykk – persepsjon - kognisjon n Kan antagelig best sees på som et kontinuum sanseinntrykk Kvaliteter ved stimulus persept kognisjon Er det en hund? Skal jeg klappe den?
Svært mye hjernekapasitet er tilegnet visuell persepsjon Minst 35 hjerneområder direkte involvert i behandling av visuell informasjon n Mer enn 300 visuelle nervebaner n
-Lukk øynene hvis du har epilepsi …
Gibsons rammeverk fotoner Distalt Informasjonelt Proksimal objekt medium stimulering Indre perseptuelt objekt
Enkelte ganger klarer vi ikke å forstå hva vi ser
Enkelte ganger klarer vi ikke å forstå hva vi ser
Andre ganger ”forstår” vi mer enn vi ser Kan du se trekanten? Hvilken linje er lengst? Hvor er feilen?
Hvor mange sorte prikker finnes i dette bildet?
n … har med lateral inhibisjon å gjøre
Hvem er størst? Ame’s room
Hvem er størst? Ame’s room
Ame’s room
Hvilken vei er opp?
http: //psylux. psych. tu-dresden. de/i 1/kaw/diverses%20 Material/www. illusionworks. com/html/mystery_spot. html http: //psylux. psych. tu-dresden. de/i 1/kaw/diverses%20 Material/www. illusionworks. com/html/plank_illusion. html
Hvem er Bill?
Hvem er Bill?
Hva kan vi lære av dette? Hvordan vi opplever verden er avhengig av mye mer enn enkle sanseinntrykk. n Vi konstruerer en tolkning av verden med utgangspunkt den sanseinformasjonen vi oppfatter n Denne konstruksjonen ser i utgangspunktet ut til å gå automatisk, selv om vi kan overstyre den ved aktive viljesanstrengelser n
Perseptuelle konstanser n Perseptuell konstans (def) oppstår når persepsjonen av et objekt forblir den samme selv når vårt proksimale inntrykk av det eksterne distale objektet endrer seg n Vårt perseptuelle system har mekanismer som projiserer konstans inn i sanseinntrykk som er i endring (proksimale inntrykk)
Fokus her: n Størrelseskonstans (def) er persepsjonen av at et objekt har den samme størrelsen selv om størrelsen på det proksimate stimulus endres u Størrelsen på et bilde på retina er direkte avhengig av avstanden mellom øyet og objektet (oppfattet størrelse = størrelsen på retina X oppfattet distanse)
Størrelseskonstans
Størrelseskonstans Bildet på retina (gule linjer) blir mindre og mindre, men siden oppfattet avstand blir større, slutter vi oss til at objektet har samme størrelse Bildet på retina (gule linjer) er konstant, og siden oppfattet avstand blir større, slutter vi oss til at objektet blir større og større
Feiloppfatning av distanse … Ponzoillusjonen – Hvilken av de gule linjene er lengst
Feiloppfatning av distanse … Ponzoillusjonen – Hvilken av de gule linjene er lengst
Feiloppfatning av distanse … Müller-Lyer illusjonen – Hvilken av de grønne linjene er lengst
Feiloppfatning av distanse … Müller-Lyer illusjonen – Hvilken av de grønne linjene er lengst
n Formkonstans (def) er persepsjonen av at et objekt har den samme formen selv om formen på den proksimate stimuleringen endres
Hva lærer vi av dette? n n n Persepsjon er ikke en aktivitet der stimuli fra omverdenen treffer en passiv mottager (“Das Ding an sich”) Den persiperende er aktivt med og skaper sine persepter av omverdenen (“Das Ding für mich”) Allerede på det første stadiet i prosessen, der fotoner treffer fotoreseptorer i øyet, begynner prosessen med å “tolke” og “gjenskape” ytterverden
Lateral Geniculate Nucleus n 90% av fibrene i den optiske nerven går til LGN, de andre 10% går til superior colliculus. n LGN mottar mer input fra cortex enn fra retina. n For hver 10. impuls som mottas fra retina, blir bare 4 sendt videre til cortex.
Dybdepersepsjon Hvordan kan vi oppfatte 3 -dimensjonale rom når det proksimale stimuli på retina bare er en 2 -dimensjonal projeksjon av omverdenen? n Det ligger i sakens natur at 2 -D projeksjonen på netthinnen gir opphav til en 3 -D oppfatning av omverdenen gjennom en form for “tolkning” av stimuli n
Dybdecues ute av kontroll. . . Små segmenter av figuren ser rimelige ut fordi det ikke er noen inkonsistens i deres individuelle dybdecues, mens cuene som gir dybdeinformasjon i bildet som helhet er i konflikt
Dybdecues ute av kontroll. . . Små segmenter av figuren ser rimelige ut fordi det ikke er noen inkonsistens i deres individuelle dybdecues, mens cuene som gir dybdeinformasjon i bildet som helhet er i konflikt
Dybdecues ute av kontroll. . . Vi tolker den ene figuren som nærmere enn den andre, og, via størrelse på retina X oppfattet avstand-mekanismen, slutter vi oss at den ene figuren er større, tross samme retinale bilde
Dybdecues ute av kontroll. . . Feiltolkning av dybdeinformasjon gir opphav til visuelle illusjoner, noe som er mulig fordi det er en tolkning som foregår.
To hovedtyper av dybdecues Monokkulære Kan representeres i 2 D og observes med ett øye lærte miljøavhengige n Binokkulære Avhengig av integrasjon av informasjon fra begge øynene biologiske medfødte n
Monokkulære dybdecues • Superimposition (overlapping) • Relativ størrelse • Høyde i horisontalplanet • Lineært perspektiv • Tekstur gradient • Bevegelsesparallakse
Superimposition (overlapping) Vi antar at Beckham er foran den fyren fra WBA, siden han forstyrrer bildet av den andre spilleren. Likeledes her, hvor det siste bildet også ville vært antatt foran det første
Relativ størrelse Når vi ser to objekter vi vet er av samme størrelse, og den ene ser mindre ut enn den andre, antar vi at den minste er lengst unna. Vi tolker ikke dette bildet som ett stort kjøretøy fulgt av en rekke mindre.
Høyde i det horisontale planet De bilene som er lengst fremme er de som ligger nederst i synsfeltet
Lineært perspektiv Parallelle linjer konvergerer med distanse, slik at jo lenger unna en observatør de er, jo nærmere hverandre vil det se ut som om de er. Dette prinsippet ble f. eks. brukt mye av renessansemalere
Andre eksempler fra kunst. . .
Det lineære perspektivet finnes også i den virkelige verden
Teksturgradient Teksturen ser ut til å bli finere ettersom avstanden øker
Stenene ser ut til å bli mindre jo lenger unna de er
Bevegelses parallakse
Fjerne objekter ser ut til å passere sakte Nære objekter ser ut til å passere raskere
Selv om de ulike dybdecu’ene kan brukes på en individuell basis, er det vanligere at de opptrer i sammenheng. Hvor mange monokkulære dybdecues can identifiseres i dette bildet? Lineært perspektiv Rel. størrelse Tekstur gradient Superimposition
Binokkulære dybdecues n Binokkulær disparitet Objekter lenger unna vil forme likere bilder på retina enn objekter nærme (oppstår fordi øynene ser såvidt forskjellige ting)
Binokkulære dybdecues n Binokkulær konvergens Oppstår når vinkelen mellom øynene øker (de vendes innover) Oppstår når man ser på et stimuli som er nært Er et nyttig dybdecues bare fra 0 -6 meter
Gestalt-tilnærminger til formpersepsjon n Den strukturalistiske tilnærmingen (Wundt, Titchener): Enkle sanseinntrykk utgjør byggeblokkene i de oppfattede formene Gestalt-tilnærmingen (Koffka, Köhler, Wertheimer): helheten er forskjellig fra summen av delene – tilnærmingen har vært nyttig for å forstå hvordan vi oppfatter grupper av objekter og deler av objekter til integrerte helheter Delene har ingen mening isolert fra helheten n
Den mest sentrale Gestalt-loven Loven om Prägnanz – ‘good figure’ n “Of several geometrically possible organisations that one will occur which possesses the best, simplest and most stable shape” Koffka, K. (1935) Principles of Gestalt Psychology. New York: Harcourt Brace (p 138). n
Flere Gestalt-lover. . . 1. 2. 3. 4. Likhet God fortsettelse Nærhet Forbundethet 5. 6. 7. 8. Lukkethet Felles skjebne Kjenthet Prägnanz – “good figure” De enkle Gestalt-lovene karakteriserer mye av vår pesreptuelle organisering. Dessvere er de mer beskrivende enn forklarende.
1. Likhet Like ting blir gruppert sammen
2. God fortsettelse Punkter som, når de er forbundet, resulterer i rette eller lett kurvede linjer, ses på som om de hører sammen, og linjene tenderer til å sees på en måte som følger den enkleste stien.
3. Nærhet Ting som er nær hverandre tenderer til å bli gruppert sammen
4. Forbundethet Ting som fysisk er forbundet oppfattes som en enhet.
5. Lukkethet Av flere geometrisk mulige perseptuelle organiseringer vil en lukket figur foretrekkes fremfor en åpen.
6. Fells skjebne Ting som beveger seg i samme retning vil se ut til å bevege seg sammen http: //psylux. psych. tu-dresden. de/i 1/kaw/diverses%20 Material/www. illusionworks. com/html/hidden_bird. html
7. Kjenthet Ting vil med større sannsynlighet danne grupper hvis gruppene fremstår som kjente eller meningsfulle.
8. Prägnanz – “Good Figure” n Gestaltpsykologiens sentrale lov n Mange av de andre lovene er manifestasjoner av Prägnanz n “Of several geometrically possible organisations that one will occur which possesses the best, simplest and most stable shape” Koffka, K. (1935) Principles of Gestalt Psychology. New York: Harcourt Brace (p 138).
Gestaltteori i dag n n n Basale perseptuelle prinsipper har overlevd Men; vi er mer avhengige av vår ”perseptuelle historie” enn Gestaltpsykologien la vekt på, noe som gjør persepsjon til en funksjon av den persiperende like mye som en funksjon av stimulus Gestaltpsykologenes oppfatning av at de perseptuelle prosessene de beskrev nødvendigvis er veldig “tidlige” i persepsjon ser ikke ut til å være helt riktige u Segmentering er ikke bare “bottom-up”
Hvilke bokstaver ser du?
Hvilke bokstaver ser du? C
Hvilke bokstaver ser du?
Et problem … Persepsjon krever altså at informasjon i miljøet på en eller annen måte matches mot indre informasjon om omverdenen. n Men: Miljøinformasjonen er gjenstand for enorm variasjon. n Hvordan kan vi gjenkjenne ting i lys av denne variabiliteten? n
Teoretiske tilnærminger til persepsjon Bottom-up teorier; data-/stimulus-drevne n Top-down teorier; høyere-ordens kognitive prosesser, eksisterende kunnskap, forventninger n
To hovedmåter å se persepsjon n n “Indirekte” persepsjon: persepsjon er resultatet av interaktive prosesser fra omverdenen og individet selv – bruk av indre representasjoner basert på “top-down” og “bottom-up” prosessering “Direkte” persepsjon (Gibson): informasjon fra den visuelle verden er tilstrekkelig til å tillate persepsjon uten å involvere indre representasjoner – fokus på “bottom-up” prosessering
Bottom-up teorier – Direkte persepsjon (Gibson)
n Direkte persepsjon (Gibson, 1979) Økologisk tilnærming som vektlegger viktigheten av interaksjonen mellom mennesker og miljøet. Dynamisk visuell persepsjon heller enn persepsjon av statiske bilder. Avviste illusjoner som “tricks”. Vektlegger bruk av optic array, som er miljøets flyt under bevegelser. Argumenterte for at objekter har ‘affordances’ om mening. 80
Bottom-up teorier – Direkte persepsjon (Gibson) n n n v v “Optic array” inneholder all nødvendig informasjon Oppfattelse av objekter i rommet bestemmes av teksturgradienter, optiske flytmønstre (flow patterns), og affordanser (objekters impliserte mening) Persepsjon involverer å “plukke opp” informasjon gjennom “resonnans” Har hatt historisk betydning ved å gjenopprette interessen for det perseptuelle miljøet Har blitt kritisert for å være underspesifisert, og undervurdere kunnskapens rolle i å utforske stimulus
n ‘Direkte’ persepsjon av distanse er afforded av bevegelsesparallakse. Bevegelsesparallakse skjer under bevegelse. Objekter lenger unna ser ut til å passere eller bevege seg tregere enn objekter som er nærmere. 82
n ‘Affordance’ dreier seg om handlbare verdier ved objekter. I henhold til Gibson blir objekter oppfattet direkte i termer av handlingene de tilbyr (‘afford’). F. eks, et dørhåndtak “tilbyr” handlingen ‘åpning’. Objekter kan være kastbare, slåbare, kan sittes på. . . Gibson argumenterte for at postkaster direkte “tilbyr” handlingen å poste brev? Kan dette være riktig? 83
Styrker ved Gibsons teori Konteksteffekter i persepsjon: Hva som sees er avhengig av omgivelsene n Økologisk teori n Effekter av bevegelse n Visuelle illusjoner: ideen er at generell kunnskap om objekter anvendes feilaktig til persepsjonen av 2 dimensjonale figurer (e. g. , Muller-Lyer) n
Andre bottom-up tilnærminger Template teorier n Prototype teorier n Trekk-teorier n Strukturell-beskrivelses-teori n
Template teorier Vi har lagret mengder av templater, som er detaljerte modeller for mønstre vi potensielt kan gjenkjenne n Når vi gjenkjenner et mønster er det fordi vi har sammenlignet det med våre lagrede templater og funnet en templat som perfekt matcher det vi observerer n
Problemer med template teorier n n n Objektene må være av samme størrelse som templatene. Objektene må være i samme posisjon og med samme orientering som templatene. Vikelige objekter kan være delvis skjulte. Templat-teorier tillater ikke at samme bilde kan ha flere tolkninger (f. eks. H og A i det tidligere eksempelet) Teorien er et eksempel på hva som kan skje når en teori tar utgangspunkt i en psykologisk sett urealistisk computermodell
Prototyp-teorier n En prototyp er ikke en rigid, spesifikk konkret modell, men heller et eksempel på en klasse relaterte objekter eller mønstre, som integrerer alle de mest typiske trekkene til formen eller mønsteret en prototyp er representativ for et mønster, men ikke en nøyaktig identisk match til alle mønstre den er en modell for
Prototyp-teorier n Forskning har vist at vi er i stand til å forme prototyper selv når vi ikke har sett noe som nøyaktig matcher prototypen – prototypene vi danner ser ut til å integrere alle de mest typiske trekkene ved et mønster, selv om vi aldri har sett et mønster der alle disse trekkene er integrert samtidig
Prototyp-teorier n n n Prototypteorier er en mer fleksibel teori enn templat teorien, i det en match ikke trenger å være eksakt Styrker u Mange færre representasjoner i hukommelsen kan forklare hvordan vi klassifiserer tilsvarende objekter i en felleskategori Svakheter u Mangler eksplisitt informasjon om hvordan stimuli sammelignes med prototyper
Trekk-teorier n Vi forsøker å matche trekk ved mønstre vi ser til trekk lagret i hukommelsen Vi matcher ikke hele mønstre til en templat eller en prototyp
Trekk-teorier
Trekk-teorier
Oliver Selfridge (1959) n ”pandemonium” – basert på tanken om at metaforiske ”demoner” med spesifikke plikter mottar og analyserer trekkene til et stimulus n (Navnet er tatt fra hovedstaden i Helvete i John Miltons Paradise Lost)
The Story u u u u u Once upon a time there was Pandemonium. In Pandemonium there dwelt many very ugly and intelligence challenged (a. k. a. stupid) demons. There was only one little hole to look out of and only one demon could look out of it. This image demon could only paint what he saw and show it to the demons in the row standing behind him. The demons in the next row, being of stout body and little brain, could each only recognize one type of feature. Since there was little else to do in these cramped quarters, the feature demons got excited and jumped up and down if they recognized their feature. The demons in the row behind them were unable to see the painted image because they were too dumb or scared to turn around and were facing the wrong way. Each of the cognitive demons, however, were connected to specific feature demons by ropes. Based on the elasticity of the ropes, which varied, the cognitive demons would get painful tugs from their connected feature demons. The resulting shrieks from the row of cognitive demons were louder from the demons who had more of their connected feature demons excited. Finally, there was the grand high decision demon who really just wanted quiet. Upon hearing the calamity from the cognitive demons, the decision demon would yell out the name of the cognitive demon shrieking the loudest (with a threat to make him turn around and look at his brother demons – a fate worse than death)
Pandemonium n n n Hver trekkdemon skriker ut hver gang det er en match mellom stimulus og det gitte trekket Kognitive demoner skriker ut hvis mulige mønstre lagret i hukommelsen passer med ett eller flere av trekkene som trekkdemonene har reagert på Beslutningsdemoner hører på de kognitive demonene, og bestemmer hva som har blitt sett, basert på hvilken kognitive demon som roper oftest (dvs den som har flest matchende trekk)
Selfridge’s Model (cont. )
Pandemonium n En liten parentens: (En demon i data- og AIspråk er et program eller en del av et program som ikke er påkalt eksplisitt, men som ligger i dvale og venter på at en eller annen betingelse skal oppstå. )
n He [Selfridge] used this idea to explain and model the way perceptual systems recognize stuff. For example, the letter R has one vertical line, a "belly" on the upper right, and a "leg" on the lower right. When "feature demons" whose names are "vertical, " "belly, " and "leg" (and others with names like "one, " "upper right, " and "lower right") hear their names being called, they begin to to call to the "cognitive demons. " The cognitive demons named B and D, for example, may each prick up their ears, since they are "sensitized" to such calls as are given out by the vertical and belly demons. K may be listening, because it is listening for the calls of the vertical and leg demons. But only the R demon recognizes the calls of all three. So while B, D, and K may be calling out to the "decision demon, " it will be R who calls the loudest.
This may seem rather silly. . .
…but pandemonium provides a very good model for much of what goes on in the mind. The tip-of-the-tongue phenomenon, for example: You are trying to think of the name of that actress in Moulin Rouge. Her name starts with an N, you are certain. Nancy, Nadene, Norah, Natalie. . . damn. You could say the N demon is yelling, and several names are responding. Nicole! That's it: Nicole Kidman
n Det finnes også alternative trekk-teorier
De fleste av disse skiller ikke bare mellom trekk, men også mellom globale vs lokale trekk
De fleste av disse skiller ikke bare mellom trekk, men også mellom globale vs lokale trekk Her står de lokale trekkene tett
De fleste av disse skiller ikke bare mellom trekk, men også mellom globale vs lokale trekk Ingen negativ effekt av lokal global inkongruens Negativ effekt av global lokal inkongruens The global precedence effect
Hvis de lokale trekkene derimot står langt fra hverandre … S S S S S S
Hvis de lokale trekkene derimot står langt fra hverandre … S S S S S S … får man en local precedence effect, der det tar lengre tid å benevne det globale bildet hvis trekkene er inkongruente, men ikke omvendt
Nevrofysiologisk evidens for trekkteorier n Hubel og Wiesels (1963) enkeltcelleopptak i visuell cortex – mappet til korresponderende visuelle stimuli i det visuelle feltet Spesifikke nevroner i visuell cortex responderer til ulike stimuli presentert på spesifikke områder på retina Hvert enkelt kortikale nevron vil derfor kunne mappes til et spesifikt reseptivt felt på retina
Hubel og Wiesel
Hubel og Wiesel Fant at det ofte ikke var tilstrekkelig å vise enkle lyspunkter n Ved en tilfeldighet oppdaget de at fleste av cellene i visuell cortex responderer til spesifikt orienterte linjer (hadde en ødelagt slide) n Cellene viser en hierarkisk struktur i termer av hvor komplekse stimuli de responderer på n Generelt: økt størrelse på det reseptive feltet økt kompleksitet i typen stimuli som utløser en respons n
Hyperkompleks celle Kompleks celle Enkel celle Enkel celle
n n Senere forskere har funnet celler som reagerer på hjørner og vinkler I enkelte deler av cortex er det enkelte hyperkomplekse celler som fyrer maksimalt bare i respons til svært spesifikke former (f. eks. en hånd eller et ansikt), uavhengig av størrelsen på stimulus jo mindre likhet stimulus har med den optimale formen, jo mindre fyrer disse cellene
Dorsale (“Where”) og Ventrale (“What”) nervebaner i aper Parietal (Dorsal) and Temporal (Ventral) Processing Streams Areas MT and V 4 in the Macaque Brain
Dorsale (“Where”) og Ventrale (“What”) nervebaner i mennesker (PET) Dorsal (where) pathway shown in green and blue and Ventral (what) pathway shown in yellow and red serve different functions. (Courtesy of Leslie Ungerleider).
Poenget her er … n Nevronene avdekker spesifikke trekk ved stimulus, og kan således kalles trekkdetektorer n Dette passer godt med trekkteorier for mønstergjenkjenning
Strukturell-beskrivelse-teori n n n Biederman (1990) har foreslått en serie med 3 D geoner: klosser, sylindere, osv I følge Biedermans recognition-by-components (RBC) teori gjenkjenner vi hurtig objekter ved å observere objektenes kanter, og så dekomponere objektene til geoner Et lite antall geoner (36, faktisk) kan brukes for å bygge opp mange basale former, og videre et utall basale objekter
Oversikt over Biedermans Modell
A B C A: komplette stimuli B: stimuli med konkavitetsinformasjon intakt C: stimuli som mangler konkavitetsinformasjon
Styrker. . . n Siden geonene er enkle og synspunktuavhengige, vil objektene konstruert fra geonene være gjenkjenbare fra mange ulike perspektiver
. . . og svakheter n n n Forklarer hvordan vi kjenner igjen objekter som tilhørende en klasse (f. eks. en stol), men ikke hvordan vi kan gjenkjenne bestemte objekter (en spesiell stol) Fortsatt uklart hvordan forholdene mellom delene av et objekt skal beskrives (som Biederman selv innrømmer) Generelt problem med alle bottom-up tilnærminger: Vanskelig å forklare effektene av tidligere forventninger og miljøkontekst på mønstergjenkjenning.
’Indirekte’ persepsjon Top-down tilnærminger: Konstruktiv beskrivelse n Sjefen: Hermann von Helmholtz (1909) n Nyere teoretikere: Jerome Bruner (1957), Richard Gregory (1980), Irvin Rock (1983) n n Gibsons teori var et motsvar til denne tradisjonelle tenkemåten
Top-Down innflytelse i segmentering Er “x” på det samme eller forskjellige objekter? Dette spørsmålet tar lengre tid å svare på med bildet til høyre. Vecera & Farah, 1997
Konstruktiv persepsjon n Den som persiperer bygger eller konstruerer en kognitiv forståelse (persepsjon) av et stimulus u sanseinformasjonen er fundamentet u andre informasjonskilder brukes til å bygge perseptet
n F. eks. fargekonstans – vi oppfatter farger som konstante selv om forskjeller i lyshet endrer hva vi kan se (f. eks. sterkt opplyst sort ser ut som hvitt så lenge det ikke er andre farger i nærheten, men skifter til sort hvis man legger til hvite elementer)
n Under persepsjon former og tester vi hurtig ulike hypoteser om perseptene, basert på hva vi sanser, hva vi vet (hukommelsesinformasjon) og hva vi kan slutte oss til (ved bruk av høyere-ordens kognitive prosesser) Vi bruker en rekke informasjonskilder for å komme frem til en beslutning, og mange av disse er helt ubevisste
Fordel med modellen n Ingen problemer med å forklare konteksteffekter Gjør kognisjon og intelligens til en integrert del av persepsjon
Syntese Det finnes empirisk støtte for begge hovedsyn n Det virker rimelig at vi i større grad baserer oss på bottom-up prosessering når persepsjon gjøres av enkle mønstre under gode forhold, og mer på top-down når mønstrene er tvetydige og persepsjonsforholdene er dårligere n
Vi bruker bottom-up så mye som mulig, og top-down når vi ”er nødt”
Marrs (1982) computational teori om persepsjon Forsøkte å utvikle en teori om visuell persepsjon som tok hensyn til både tidligere kunnskap og sanseopplevelser (uten å bli en konstruktivist). n Inkorporerer deskriptive persepsjonsprinsipper (dybdecues, perseptuelle konstanser, Gestalt-prinsippene om form-persepsjon) n
Marrs (1982) computation n Sensorisk informasjon fra retina kan organiseres gjennom bruk av 3 typer trekk: kanter, konturer og like regioner
Marrs (1982) computation Kanter: Danner grenser mellom og rundt objekter og deler av objekter n Konturer: Differensierer en type overflate fra en annen (f. eks. indikerer konturer på et kart høyde) n Like regioner: Områder som i hovedsak er udifferensiert av adskilte trekk n
Marrs (1982) computation Marr viste hvordan en persepsjonsmodell kan spesifiseres i tilstrekkelig detalj til å kunne simuleres av en computer n For å danne et 3 -D-bilde mente han at menneskehjernen bruker en 3 -stegs prosess n
Marrs representasjoner n Primal skisse: 2 -D representasjon av endringer i lysintensiteten, informasjon om kanter, konturer, og “blobs” (f. eks. en stol i 2 D) u Rå-data: rene lysintensitetsendringer u Fullt analysert: bruker informasjon til å identifisere former n 2 1/2 -D skisse: dybde og orientering til synlige overflater, skygger, tekstur, bevegelse, binokkulær disparity; observatørsentrert (f. eks. enkelte aspekter ved dybde men ikke andre) n 3 -D skisse: 3 -D beskrivelse av objekter uavhengig av synspunkt (f. eks. blir hvert element nå representert som adskilte 3 -D objekter, selv om det observatørens synspunkt er én enkelt overflate)
Marrs representasjoner n I formingen av 3 -D modellen vil tidligere kunnskap og opplevelser påvirke persepsjonen (f. eks. å vite at et bord stort sett har fire ben, selv om det ene er skjult)
Marr-Hildreth Algoritme n n n Attempts to account for development of primal sketch Idea of “blurred representations” “Zero-crossings” identify edges within a visual image Only ‘reliable’ zero-crossings are kept Four types of tokens: edge -segments, bars, terminations, and blobs Intensity change Rate of change (1 st D) Zero-crossing (2 nd D)
Marr & Nishihara (1978) Utvikling av 3 -D skisse basert på prosessering av mer elementære formprimitiver (den basale primitive er en sylinder med en hovedakse) n Hierarkisk organisering av primitiver n Konkaviteter er viktige i å segmentere deler n
Persepsjonsforstyrrelser n n Agnosipasienter – alvorlige forstyrrelser av evnen til å oppfatte sensorisk informasjon Disse pasientene har normale sanseinntrykk, men de kan ikke sette dem sammen og gjenkjenne hva de ser Mange typer (se f. eks. Oliver Sacks, Humphreys og Riddock) Sternberg: Fokuserer på spesifikke problemer med å se former og mønstre i rommet
n n Gjerne skader i spesielle deler av visuell cortex Skader i temporale deler av cortex simultagnosi (problemer med å være oppmerksom på mer enn ett objekt av gangen) Skader i parietale deler av cortex spatial agnosi (problemer med å navigere i dagligmiljøet) Skader i høyre temporallapp prosopagnosi (problemer med å gjenkjenne menneskelige ansikter) Indikerer stor grad av spesialisering (modularitet)
Fodor: Modularity of mind n n (1) Moduler må være raske og deres operasjoner uunngåelige (2) Moduler har gjerne overfladiske output, og man har generelt liten innsikt i modulens virkemåte (3) Moduler er områdespesifikke (4) Moduler må være støttet av bestemte nevrale organiseringer gir opphav til karakteristiske symptomer ved sammenbrudd
Aoccdrnig to rscheearch at Cmabrigde Uinervtisy, it deosn't mttaer in waht oredr the ltteers in a wrod are, the olny iprmoetnt tihng is taht the frist and lsat ltteer be at the rghit pclae. The rset can be a toatl mses and you can sitll raed it wouthit a porbelm. Tihs is bcuseae the huamn mnid deos not raed ervey lteter by istlef, but the wrod as a wlohe.
- Slides: 146