Paradigmele psihologiei cognitive Curs 3 n psihologia cognitiv

În psihologia cognitivă există astăzi două modele de explicare şi de raportare la

Paradigma simbolică clasică În funcţie de tipul reprezentărilor şi de modalităţile de tratare ale

Paradigma simbolică clasică Un simbol este o reprezentare care denotă obiecte sau stări de

Paradigma simbolică clasică Apariţia acestei teorii a fost susţinută de succesele înregistrate de formalizarea

Paradigma simbolică clasică Aplicarea paradigmei simbolice clasice a fost susţinută, în special, la explicarea

Arhitecturile cognitive (AC) Accentul cade pe intracţiunea dintre structuri. Termen împrumutat din inteligenţa artificială.

La baza lor stau sistemele de producere şi regulile de producere (production systems

Asumpţiile majore ale teoriei ACT-R: 1. Sistemul cognitiv are şase module care funcţionează

Modulul scopului: urmăreşte intenţiile unui subiect şi controlează procesarea informaţiilor. Este localizat în cortexul

3. ariile cerebrale corespunzătoare celor patru module sunt activate în general de sarcini

4 CAPS, developed at Carnegie Mellon University under Marcel A. Just ACT-R, developed at

Co. JACK An ACT-R inspired extension to the JACK multi-agent system that adds a

Paradigma (neo)conexionistă Este cunoscută şi sub numele de paradigma procesărilor paralele distribuite sau de

Paradigma (neo)conexionistă În urma cercetărilor lui Minsky şi Papert (1969) care demonstrau incapacitatea reţelelor

Paradigma (neo)conexionistă După această dată, renaşte conexionismul în forma pe care o cunoaştem astăzi,

Paradigma (neo)conexionistă Prin urmare, sistemul cognitiv este o reţea (neuromimetică) în care informaţia circulă

Reţelele neuromimetice Neoconexionismul susţine o modelare a procesării la nivelul algoritmicreprezentaţional printr-o reţea neuromimetică.

Reţelele neuromimetice 1. o mulţime de unităţi; 2. o stare de activare; 3. o

Unităţile Se numesc unităţi cognitive, neuroni formali, noduri. Au caracteristici asemănătoare cu ale neuronilor:

Unităţile Între unităţile vizibile de input şi de output sunt interpuse unităţi care nu

Unităţile Dacă o atribuire a semnificaţiei este totuşi făcută, putem distinge două tipuri de

Stările de activare Acestea sunt valori care definesc starea unei unităţi la un moment

Regula de activare Este o funcţie care stabileşte modul în care se modifică valoarea

Funcţia output Stabileşte relaţia dintre valoarea de activare a unei unităţi şi outputul pe

Conexiunile Nodurile, unităţile unei reţele sunt legate prin conexiuni. Când conexiunile sunt orientate într-o

Conexiunile Sunt inhibitive dacă ponderea este negativă. Conexiunile sunt elemente importante ale reţelei conexioniste

Regulile de învăţare Sunt algoritmi sau ecuaţii care guvernează ponderea conexiunilor dintr-o reţea. Modificarea

Regula lui Hebb Ponderea unei conexiuni creşte dacă unităţile au o stare de activare

Regula lui Hebb Prin urmare, avem relaţia: Wu, i= lr · au · ai

Regula delta (Widrow-Hoff) Utilizează discrepanţa între outputul dezirabil (du) şi outputul actual (au). Ponderea

Regula retropropagării erorii (delta generalizată) Este o extindere a regulii delta la reţelele multinivelare.

Mediul sau ambianţa reţelei Orice reţea conexionistă (ca şi orice reţea neuronală) este în

Concluzii Nu alegem, când explicăm cum funcţionează un sistem cognitiv, între una dintre paradigme.

Slides: 34

Download presentation

Paradigmele psihologiei cognitive Curs 3

În psihologia cognitivă există astăzi două modele de explicare şi de raportare la sistemul cognitiv, numite paradigme (modelări). Acestea sunt paradigma simbolică, numită şi clasică, şi paradigma (neo)conexionistă.

Paradigma simbolică clasică În funcţie de tipul reprezentărilor şi de modalităţile de tratare ale acestora putem identifica două paradigme în care se discută despre sistemul cognitiv: paradigma clasic-simbolică şi paradigma neoconexionistă. Paradigma clasică porneşte de la ideea că toate cunoştinţele şi stările de lucruri corespunzătoare sunt reprezentate în sistemul cognitiv prin simboluri sau structuri simbolice.

Paradigma simbolică clasică Un simbol este o reprezentare care denotă obiecte sau stări de lucruri şi se supune unor reguli de combinare (au o “gramatică”). Pentru a putea opera cu cunoştinţele calculatorul, ca şi creierul, trebuie să le codeze în structuri simbolice. Newell şi Simon spun că sistemul cognitiv uman, cât şi calculatorul, sunt sisteme fizicosimbolice (fizic pentru că are o instanţiere neurobiologică şi simbolic pentru că are cunoştinţele reprezentate sub forma unor

Paradigma simbolică clasică Apariţia acestei teorii a fost susţinută de succesele înregistrate de formalizarea logicii, de apariţia gramaticilor generative şi a lingvisticii teoretice care au dus la ideea că sistemul psihic uman este un sistem de manipulare a simbolurilor. Ea se numeşte “clasică” deoarece foloseşte idei dezvoltate în lucrările unor filosofi cum ar fi Leibniz, Descartes (raţionalismul continental) sau Hobbes, Locke, Hume (empirismul englez).

Paradigma simbolică clasică Aplicarea paradigmei simbolice clasice a fost susţinută, în special, la explicarea proceselor cognitive centrale şi în primul rând la rezolvarea de probleme (stare iniţială, stare finală şi blocul de operatori, care premite trecerea de la starea iniţială la cea finală). Începând cu acest model de explicare a sistemului cognitiv, putem vorbi despre metafora computerului (calculatorului) cu privire la explicarea sistemului cognitiv

Arhitecturile cognitive (AC) Accentul cade pe intracţiunea dintre structuri. Termen împrumutat din inteligenţa artificială. AC sunt totalitatea mecanismelor, cognitiv impenetrabile (vezi Pylyshyn, 1984, 1990) necesare şi suficiente pentru realizarea unui comportament inteligent. Sunt aspecte ale sistemului cogitiv care rămân în cea mai mare parte invariabile de la un subiect la altul, la tipuri de sarcini şi în timp.

La baza lor stau sistemele de producere şi regulile de producere (production systems and production rules): condiţionali şi sisteme de condiţionali de tipul „dacă. . . atunci”. Newell şi Simon (1972) au fost primii care au relevat valoarea sistemelor de producere în rezolvarea de probleme. Modelul ACT-R (Adaptative Control of Thought - Rational), dezvoltat de J. R. Anderson între anii 1993 to 2008. Site-ul oficial: http: //act-r. psy. cmu. edu/ Este de inspiraţie computaţională şi dezvoltă un model general al funcţionării cognitive umane şi a rezolvării de probleme, în special.

Asumpţiile majore ale teoriei ACT-R: 1. Sistemul cognitiv are şase module care funcţionează relativ independent unul de celelalte. 2. Patru sunt importante pentru cogniţie şi pentru rezolvarea de probleme: - modulul de recuperare: conţine indiciile sau cheile de accesare a informaţiilor. Este localizat în cortexul prefrontal inferior ventrolateral. - modulul imagistic: transformă problema în reprezentare vizuală. Este situat în cortexul parietal posterior.

Modulul scopului: urmăreşte intenţiile unui subiect şi controlează procesarea informaţiilor. Este localizat în cortexul cingulat anterior. - Modulul procedural: utilizează regulile de producere, daca. . . atunci, pentru a determina care va fi următoarea acţiune întreprinsă. Se află în ganglionii bazali, în capătul nucleului caudat. Celelalte module sunt: modulul motor şi modulul vizual. -

3. ariile cerebrale corespunzătoare celor patru module sunt activate în general de sarcini complexe, cu toate că fiecare este activată de factori realativi diferiţi. 4. fiecare modul are un buffer asociat lui, care conţine o cantitate limitată de informaţie. 5. cunoaşterea umană poate fi redusă la două tipuri de reprezentări: declarative şi procedurale. Această arhitectură poate rula pe oricare calculator, adică poate rezolva probleme, dacă se descarcă codul-sursă şi calculatorul deţine limbajul Common Lisp.

4 CAPS, developed at Carnegie Mellon University under Marcel A. Just ACT-R, developed at Carnegie Mellon University under John R. Anderson. Apex developed under Michael Freed at NASA Ames Research Center. CHREST, developed under Fernand Gobet at Brunel University and Peter C. Lane at the University of Hertfordshire. CLARION the cognitive architecture, developed under Ron Sun at Rensselaer Polytechnic Institute and University of Missouri. Copycat, by Douglas Hofstadter and Melanie Mitchell at the Indiana University. DUAL, developed at the New Bulgarian University under Boicho Kokinov. EPIC, developed under David E. Kieras and David E. Meyer at the University of Michigan. FORR developed by Susan L. Epstein at The City University of New York. GAIu. S developed by Sevak Avakians. The H-Cogaff architecture, which is a special case of the Cog. Aff schema. (See Taylor & Sayda, and Sloman refs below).

Co. JACK An ACT-R inspired extension to the JACK multi-agent system that adds a cognitive architecture to the agents for eliciting more realistic (human-like) behaviors in virtual environments. IDA and LIDA, implementing Global Workspace Theory, developed under Stan Franklin at the University of Memphis. Pre. Act, developed under Dr. Norm Geddes at ASI. PRODIGY, by Veloso et al. PRS 'Procedural Reasoning System', developed by Michael Georgeff and Amy Lansky at SRI International. Psi-Theory developed under Dietrich Dörner at the Otto. Friedrich University in Bamberg, Germany. R-CAST, developed at the Pennsylvania State University. Soar, developed under Allen Newell and John Laird at Carnegie Mellon University and the University of Michigan. Society of mind and its successor the Emotion machine proposed by Marvin Minsky. Subsumption architectures, developed e. g. by Rodney Brooks (though it could be argued whether they are cognitive).

Paradigma (neo)conexionistă Este cunoscută şi sub numele de paradigma procesărilor paralele distribuite sau de modelarea neuromimetică. Porneşte de la ideea că activitatea cognitivă poate fi explicată pe baza unor modele de inspiraţie neuronală. Un sistem cognitiv este format dintr-o reţea de neuroni formali (simplificaţi). Primele încercări de a pune în aplicare această idee au fost făcute în 1943 de Pitts si Mc. Cullogh. Rosenblatt (1958) a construit pe baza cercetărilor celor doi o reţea neuromimetică cu două niveluri numită perceptron.

Paradigma (neo)conexionistă În urma cercetărilor lui Minsky şi Papert (1969) care demonstrau incapacitatea reţelelor de tip perceptron de a calcula funcţii logice simple: “ca”, “de exemplu”, “sau” (exclusiv), dezvoltarea în această direcţie a fost abandonată. În anii ’ 80 însă, Mc. Clelland şi Rumelhart publică lucrarea Parellel Distributed Processing: Exploration in the Microstructure of Cognition (1986) şi volumul 2, Psychological and Biological Models (1987).

Paradigma (neo)conexionistă După această dată, renaşte conexionismul în forma pe care o cunoaştem astăzi, numită neoconexionism. Spre deosebire de paradigma simbolică (ce considera cunoaşterea ca o manipulare de simboluri), conexionismul susţine că reprezentarea informaţiei în sistemul cognitiv constă în activarea unor unităţi simple (neuromimi) pe baza unor patternuri şi

Paradigma (neo)conexionistă Prin urmare, sistemul cognitiv este o reţea (neuromimetică) în care informaţia circulă între unităţile de procesare nu sub formă de mesaje, ci sub formă de valori de activare; sub formă de scalari, nu de simboluri (D. A. Norman, 1986).

Reţelele neuromimetice Neoconexionismul susţine o modelare a procesării la nivelul algoritmicreprezentaţional printr-o reţea neuromimetică. Informaţia este reprezentată la nivelul sistemului cognitiv uman prin valori şi patternuri de activare ale unor unităţi (neuromimi). O reţea neuromimetică este formată din:

Reţelele neuromimetice 1. o mulţime de unităţi; 2. o stare de activare; 3. o regulă de activare; 4. o funcţie output; 5. un pattern de conexiuni între aceste unităţi; 6. reguli de învăţare; 7. un mediu (o ambianţă) în care operează reţeaua.

Unităţile Se numesc unităţi cognitive, neuroni formali, noduri. Au caracteristici asemănătoare cu ale neuronilor: valoarea de activare şi asocierea într-o reţea. Valoarea de activare este notată printr-o cifră cuprinsă în intervalul -1, +1. Sunt unităţi de input (receptează şi convertesc în valori de activare semnalele externe) şi unităţi de output (care transmit în mediu răspunsul reţelei). Acestea sunt unităţi vizibile pentru că pot fi accesate direct din mediul reţelei.

Unităţile Între unităţile vizibile de input şi de output sunt interpuse unităţi care nu pot fi accesate decât prin intermediul acestora. Acestea se numesc unităţi ascunse. Dacă o reţea este formată din unităţi vizibile, atunci ea se numeşte binivelară. Dacă este formată atât din unităţi vizibile, cât şi din unităţi ascunse, reţeaua se numeşte multinivelară. Neuromimii nu sunt interpretabili semantic, adică nu semnifică lucruri, concepte, fapte (aşa cum era în cazul simbolurilor). Spunem că reţelele neuromimetice sunt semantic-opace.

Unităţile Dacă o atribuire a semnificaţiei este totuşi făcută, putem distinge două tipuri de reţele: 1. Localizaţionaliste, se consideră că fiecare unitate este un concept. Aceasta este o interpretare exterioară, ea nu este regăsită implicit în reţea. 2. Distributive, informaţia este distribuită pe interacţiunile dintre unităţi (de exemplu, un concept sau o propoziţie nu sunt reprezentate de o singură unitate, ci de patternul de conexiuni dintre mai multe unităţi ale reţelei). În acest caz, unităţile sunt neinterpretabile semantic.

Stările de activare Acestea sunt valori care definesc starea unei unităţi la un moment dat. Sunt notate numeric, de la -1 la +1 (şi nu numai, pot fi alese şi alte intervale), astfel că o reţea conexionistă este o matrice de valori de activare (0. 2, 0, 0, 5). Fiecare unitate are un rest de activare ca rezultat al stimulărilor trecute (întocmai ca un neuron). Rata descreşterii stării de activare se numeşte rata degradării (decay rate).

Regula de activare Este o funcţie care stabileşte modul în care se modifică valoarea de activare a unităţilor dintr-o reţea. Modificarea valorii se face pe baza netinputului. Acesta este suma ponderată a valorilor de activare recepţionate. Procesul este similar cu cel petrecut în reţelele neuronale.

Funcţia output Stabileşte relaţia dintre valoarea de activare a unei unităţi şi outputul pe care ea îl transmite altor unităţi. În cazul unei reţele conexioniste un programator poate stabili un prag al stării de activare sub care valoarea outputului este zero, iar deasupra acestui prag outputul este egal cu valoarea de activare. Similarităţi cu reţeaua neuronală.

Conexiunile Nodurile, unităţile unei reţele sunt legate prin conexiuni. Când conexiunile sunt orientate într-o singură direcţie de la unităţile input spre unităţile output, reţeaua este unidimensională (feed-forward network). Dacă conexiunile sunt reciproce, reţeaua este interactivă. Conexiunile sunt excitative şi inhibitive. Sunt excitative când ponderea este pozitivă 0<Wi, j<1, unde W este ponderea, iar i şi j sunt două unităţi oarecare.

Conexiunile Sunt inhibitive dacă ponderea este negativă. Conexiunile sunt elemente importante ale reţelei conexioniste deoarece o unitate reprezintă ceva pentru reţea în funcţie de conexiunile pe care le are. Acestea îi oferă valoarea de activare.

Regulile de învăţare Sunt algoritmi sau ecuaţii care guvernează ponderea conexiunilor dintr-o reţea. Modificarea tăriei conexiunilor se face în funcţie de regulile de învăţare. Regulile de învăţare sunt similare regulilor de manipulare a simbolurilor din paradigma clasică. Menţionăm trei reguli de învăţare:

Regula lui Hebb Ponderea unei conexiuni creşte dacă unităţile au o stare de activare de acelaşi semn (ambele pozitive sau ambele negative) şi scade dacă se află în stări de activare opuse. Ponderea conexiunii dintre două unităţi se modifică în funcţie de produsul valorilor de activare. Proporţia cu care se va modifica ponderea conexiunii este modulată de rata învăţării (este stabilită de creatorul reţelei).

Regula lui Hebb Prin urmare, avem relaţia: Wu, i= lr · au · ai Adică ponderea conexiunii de la unitatea i la unitatea u depinde de rata învăţării (lr) înmulţită cu valoarea de activare a unităţilor u şi i.

Regula delta (Widrow-Hoff) Utilizează discrepanţa între outputul dezirabil (du) şi outputul actual (au). Ponderea unei conexiuni se modifică cu atât mai mult cu cât eroarea (diferenţa) dintre outputul dezirabil şi outputul actual este mai mare. Wu, i= lr(du – au)ai Dacă du = au ponderea conexiunilor rămâne neschimbată. Înseamnă că reţeaua a dat răspunsul dorit

Regula retropropagării erorii (delta generalizată) Este o extindere a regulii delta la reţelele multinivelare. Eroarea dintre du şi au se propagă invers de la unităţile output spre unităţile ascunse şi spre unităţile de input. Mai întâi se calculează ponderea pe care două unităţi au avut-o în propagarea erorii pe baza regulii delta, apoi se modifică tăria legăturii dintre ele după contribuţia pe care au avut-o la apariţia erorii.

Mediul sau ambianţa reţelei Orice reţea conexionistă (ca şi orice reţea neuronală) este în legătură cu structuri mai generale, pot fi şi alte reţele, care o influenţează şi creează mediul reţelei. Influenţa mediului apare într-un model conexionist sub forma unor biaşi (bias), adică a unor inputuri cu valori fixe şi independenţi de activitatea reţelei.

Concluzii Nu alegem, când explicăm cum funcţionează un sistem cognitiv, între una dintre paradigme. Paradigma clasică ne oferă un model de funcţionare a unei reţele când vorbim despre procesarea la un nivel complex, central. Paradigma conexionistă ne oferă un model când vorbim de procesări la un nivel periferic. Problema: cum se face trecerea de la nivelul subsimbolic la nivelul simbolic, sau cum un fenomen material, precum creierul, produce un fenomen nematerial, precum mintea.