Linguistica dei corpora Salvatore De Masi LA LINGUISTICA

  • Slides: 118
Download presentation
Linguistica dei corpora Salvatore De Masi

Linguistica dei corpora Salvatore De Masi

LA LINGUISTICA COME DISCIPLINA EMPIRICA La linguistica è una disciplina empirica Le sue generalizzazioni

LA LINGUISTICA COME DISCIPLINA EMPIRICA La linguistica è una disciplina empirica Le sue generalizzazioni traggono il fondamento da dati empirici I principi teorici rendono conto dei fatti di lingua

CHOMSKY: LINGUISTICA INTERNA E LINGUISTICA ESTERNA Grammaticalità/Accettabilità Le due nozioni non vanno confuse La

CHOMSKY: LINGUISTICA INTERNA E LINGUISTICA ESTERNA Grammaticalità/Accettabilità Le due nozioni non vanno confuse La prima deriva dall’osservanza delle regole della grammatica, nella costruzione di una frase: Incolori verdi idee dormono furiosamente La seconda deriva dalla capacità dei parlanti di attribuire un senso alle frasi e di utilizzarle in contesti appropriati: Dovremmo riparare la sedia infelice Domani ti messaggio

CHOMSKY: LINGUISTICA INTERNA E LINGUISTICA ESTERNA Grammaticalità/Probabilità Le due nozioni non vanno confuse La

CHOMSKY: LINGUISTICA INTERNA E LINGUISTICA ESTERNA Grammaticalità/Probabilità Le due nozioni non vanno confuse La frase: Ho visto un’esile balena Per quanto sia improbabile nella ordinaria comunicazione linguistica, è perfettamente grammaticale

CHOMSKY: LINGUISTICA INTERNA E LINGUISTICA ESTERNA A partire dalla pubblicazione delle Strutture della sintassi

CHOMSKY: LINGUISTICA INTERNA E LINGUISTICA ESTERNA A partire dalla pubblicazione delle Strutture della sintassi (1957), i dati linguistici sono soprattutto i giudizi di grammaticalità. Secondo Chomsky. La Linguistica interna riguarda lo studio della competenza (Grammatica Generativa), la Linguistica esterna riguarda lo studio dell'esecuzione.

CHOMSKY: LINGUISTICA INTERNA E LINGUISTICA ESTERNA Parallelamente, ed in polemica con la GGT, si

CHOMSKY: LINGUISTICA INTERNA E LINGUISTICA ESTERNA Parallelamente, ed in polemica con la GGT, si sviluppa un approccio nel quale i dati sono il prodotto dell’attività linguistica dei parlanti. Herdan reinterpreta la dicotomia langue/parole in termini di popolazione statistica/campione statistico

LA MISURAZIONE Con il termine misurazione ci si riferisce al processo con il quale

LA MISURAZIONE Con il termine misurazione ci si riferisce al processo con il quale si stabilisce un rapporto tra un segmento di lunghezza nota e costante assunto come unità di misura ed un continuum indefinito. Allo stesso modo può essere misurato il tempo, assumendo una appropriata unità di misura. In questo senso, il processo di misurazione può essere applicato solo a grandezze fisiche. Successivamente, il concetto di misurazione è stato generalizzato ed applicato ad entità non determinate fisicamente.

LA MISURAZIONE In un senso più ampio, la misurazione «consiste nell’attribuzione di numeri a

LA MISURAZIONE In un senso più ampio, la misurazione «consiste nell’attribuzione di numeri a oggetti o eventi seguendo determinate regole. Il fatto che si possano assegnare dei numeri seguendo regole differenti porta a differenti tipi di scala e differenti tipi di misurazione. Il problema diventa quello di rendere esplicite: a) le varie regole per l’assegnazione dei numeri, b) le proprietà matematiche (o la struttura del gruppo) delle scale che ne risultano, e c) le operazioni statistiche applicabili alle misure effettuate su ciascun tipo di scala» (S. S. Stevens, On the Theory of Scales of Measurement, 1946, 141).

LA MISURAZIONE Le scale di misurazione possono essere suddivise in: Qualitative: • Nominali •

LA MISURAZIONE Le scale di misurazione possono essere suddivise in: Qualitative: • Nominali • Ordinali Quantitative • Ad intervalli • Di rapporti Un carattere misurabile con una scala qualitativa è detto mutabile o più semplicemente variabile qualitativa. Un carattere misurabile con una scala quantitativa è detto variabile (quantitativa).

LA MISURAZIONE: LE SCALE NOMINALI Il primo livello di misurazione è la scala nominale.

LA MISURAZIONE: LE SCALE NOMINALI Il primo livello di misurazione è la scala nominale. È un livello di misurazione esclusivamente qualitativo. Le variabili a scala nominale possono essere usate solo come criterio di raggruppamento dei soggetti di una popolazione o di un campione. Corrisponde ad una delle operazioni cognitive basilari: la classificazione. In una scala nominale le classi ottenute devono essere esaustive e mutuamente esclusive. Esaustive = è necessario che ogni individuo o entità dell'universo di riferimento rientri in una classe. Mutuamente esclusive = le classi non devono avere alcun elemento comune.

LA MISURAZIONE: LE SCALE NOMINALI ESEMPI La classificazione delle persone in maschi e femmine

LA MISURAZIONE: LE SCALE NOMINALI ESEMPI La classificazione delle persone in maschi e femmine è una scala nominale dicotomica (ha solo due valori). La classificazione delle vocali italiane in anteriori, centrali e posteriori è una scala nominale politomica (ha più di due valori). La classificazione delle consonanti in sorde, sonore, occlusive, fricative, ecc. NON è una scala di misurazione poiché non è rispettato il requisito secondo cui le classi devono essere mutuamente esclusive. Una consonante come la b, infatti, può essere classificata sia come sonora che come occlusiva.

LA MISURAZIONE: LE SCALE NOMINALI ESEMPI Le consonanti dell’italiano, nella tabella, sono classificate secondo

LA MISURAZIONE: LE SCALE NOMINALI ESEMPI Le consonanti dell’italiano, nella tabella, sono classificate secondo tre criteri: 1. Modo di articolazione: scala nominale con valori occlusive, fricative, affricate, nasali, laterali, polivibranti; 2. Luogo di articolazione: bilabiali, labiodentali, alveolari, palato-alveolari, palatali, velari; 3. Sonorità: sorde, sonore;

LA MISURAZIONE: LE SCALE NOMINALI Proprietà: Simmetria: se A=B allora B=A Transitività: se A=B

LA MISURAZIONE: LE SCALE NOMINALI Proprietà: Simmetria: se A=B allora B=A Transitività: se A=B e B=C allora A=C Associamo numeri alle classi Ad ognuno dei valori attribuiti alla variabile, è possibile associare: la Frequenza assoluta: F = numero di entità che presentano una certa modalità della variabile e la Frequenza relativa: f = F diviso il numero totale di entità della popolazione o del campione.

LA MISURAZIONE: LE SCALE NOMINALI ELABORAZIONE DEI DATI I valori medi sintetizzano lo stato

LA MISURAZIONE: LE SCALE NOMINALI ELABORAZIONE DEI DATI I valori medi sintetizzano lo stato del fenomeno analizzato, dando una visione d’insieme del collettivo. La moda di una distribuzione statistica, nel caso di misurazione a scala nominale, è la modalità con frequenza maggiore.

LA MISURAZIONE: LE SCALE ORDINALI Il livello immediatamente superiore è la scala ordinale. Il

LA MISURAZIONE: LE SCALE ORDINALI Il livello immediatamente superiore è la scala ordinale. Il livello ordinale conserva i requisiti (esaustività e classi mutuamente esclusive) e le proprietà (simmetria e transitività) della scala nominale, ma consente anche di esprimere i valori in ordine di grandezza crescente o decrescente e di confrontare le posizioni relative all'interno dei numeri assegnati ad una variabile. Proprietà di tricotomia: se A e B sono due elementi del collettivo E è vero A=B aut A<B aut A>B (aut significa che una ed una sola delle tre alternative deve essere vera). È possibile confrontare livelli diversi di una stessa variabile, ma non si può stabilire l'entità della differenza tra i due livelli mediante un'operazione matematica.

LA MISURAZIONE: LE SCALE ORDINALI ESEMPI Livello di scolarità: all'interno del quale possiamo stabilire

LA MISURAZIONE: LE SCALE ORDINALI ESEMPI Livello di scolarità: all'interno del quale possiamo stabilire una gerarchia con valori compresi tra 1 (Analfabeta) e 7 (Laureato) con gradi intermedi crescenti di scolarizzazione: 2 =Terza elementare, 3=Licenza elementare, 4=Licenza media inferiore, 5=Maturità, 6=Laurea triennale, 7=Laurea magistrale). Ceto sociale: 1=Ceto basso, 2=Ceto medio, 3=Ceto alto. Grado di accordo con una proposizione o Grado di soddisfazione: 1=Per niente, 2=Poco, 3=Abbastanza; 4=Molto, 5=Completamente. Per ciascuna modalità possono essere determinate frequenza assoluta e frequenza relativa

LA MISURAZIONE: LE SCALE ORDINALI ELABORAZIONE DEI DATI Moda: nel caso di caratteri ordinabili,

LA MISURAZIONE: LE SCALE ORDINALI ELABORAZIONE DEI DATI Moda: nel caso di caratteri ordinabili, la moda si definisce come la modalità in cui ricade un numero di casi maggiore che nelle modalità contigue. ESEMPI: Supponiamo di aver rilevato il grado di istruzione di due collettivi distinti con le due distribuzioni di frequenze per le sette modalità: A. 10; 12; 15; 18; 17; 15; 9. B. 20; 16; 30; 12; 20; 7; 5. Nella distribuzione (A) solo la modalità 4 (Licenzia media inferiore) soddisfa la definizione; diremo che (A) è una distribuzione unimodale. Nella distribuzione (B), la definizione è soddisfatta sia dalla modalità 3 (Licenza elementare) che dalla 5 (Maturità); diremo che (B) è una distribuzione plurimodale. La modalità (3) è la moda principale; la (4) è una moda secondaria.

LA MISURAZIONE: LE SCALE ORDINALI Es. : Supponiamo di aver raccolto dati relativi all'iscrizione

LA MISURAZIONE: LE SCALE ORDINALI Es. : Supponiamo di aver raccolto dati relativi all'iscrizione alla scuola secondaria superiore e di aver ottenuto la seguente distribuzione di frequenze: Tecni- Professio- Classico co nale 20 La 15 45 Scientifico 30 Linguistico 18 Pedago- Artistico gico 12 moda è costituita dalla modalità Classico, che ha la frequenza assoluta più elevata all’interno dei dati (45). La distribuzione è unimodale. 10

LA MISURAZIONE: LE SCALE ORDINALI ELABORAZIONE DEI DATI Mediana: Disponiamo una serie di dati

LA MISURAZIONE: LE SCALE ORDINALI ELABORAZIONE DEI DATI Mediana: Disponiamo una serie di dati in ordine non decrescente; se essi sono in numero dispari, la mediana è la modalità preceduta e seguita da un ugual numero di casi, ossia quella posseduta dall’elemento che occupa la posizione (n+1)/2. Se classifichiamo un gruppo di sette studenti nel modo seguente: Scadente, discreto, sufficiente, buono, elevato, notevole, ottimo La mediana è costituita dalla modalità buono.

MEDIANA Se i dati sono in numero pari, possono verificarsi due casi esemplificati da:

MEDIANA Se i dati sono in numero pari, possono verificarsi due casi esemplificati da: 1. Discreto, sufficiente, buono, elevato, notevole, ottimo 2. Scadente, discreto, sufficiente, buono, elevato, notevole, ottimo Nel primo caso esistono due modalità mediane, ma non si può determinare la mediana, poiché tra buono ed elevato non esiste un valore intermedio. Nel secondo caso, la mediana è costituita dalla modalità buono, la quale lascia tre valori prima di sé e tre dopo.

MEDIANA Dati raggruppati in classi. Se i dati sono in numero dispari, si determina

MEDIANA Dati raggruppati in classi. Se i dati sono in numero dispari, si determina la posizione del dato intermedio e la mediana è costituita dalla modalità della classe che lo contiene; se i dati sono in numero pari, si determina la posizione dei casi n/2 e n/2 + 1; se essi appartengono alla stessa classe, allora la sua modalità sarà la mediana, in caso contrario la mediana non sarà determinabile. Nell’esempio seguente: I dati sono in numero pari; le due posizioni intermedie sono la 125 e la 126, le quali appartengono entrambe alla classe con modalità insoddisfatto*, che è, perciò, la mediana. *Dalla colonna relativa alle frequenze assolute cumulate ricaviamo che la classe contiene i casi che vanno da 37° al 126°.

MEDIANA Dati raggruppati in classi. Si determina la posizione del dato intermedio Frequenze Gradimento

MEDIANA Dati raggruppati in classi. Si determina la posizione del dato intermedio Frequenze Gradimento Frequenze cumulate dei professori assolute relative percentuali molto deluso 36 0, 144 14, 4 insoddisfatto 90 0, 360 36 126 0, 504 50, 4 parzialmente 63 soddisfatto 0, 252 25, 2 189 0, 756 75, 6 soddisfatto 51 0, 204 20, 4 240 0, 960 96 entusiasta 10 0, 040 4 250 1, 000 100 Totali 250 1, 000 100

INTERVALLI Il terzo livello di misurazione è costituito dalle scale a intervalli. Questo tipo

INTERVALLI Il terzo livello di misurazione è costituito dalle scale a intervalli. Questo tipo di misura possiede, oltre alle proprietà già viste, quella dell'equivalenza, per cui le distanze tra gli attributi di una variabile sono uguali (p. es. , in una scala a 5 punti, la distanza – o la differenza – fra 1 e 3 è uguale a quella fra 2 e 4). È possibile, perciò, sommare due valori della variabile o sottrarre un valore da un altro o moltiplicare un valore per un numero puro*. * numero puro locuzione con cui si indica un numero che non rappresenta una grandezza e quindi non è espresso in qualche unità di misura. Per esempio, il rapporto tra due grandezze omogenee è un numero puro. [Enciclopedia Treccani]

INTERVALLI Le variabili misurate con una scala a intervalli si dicono quantitative e possono

INTERVALLI Le variabili misurate con una scala a intervalli si dicono quantitative e possono essere continue (possono assumere come valore un numero reale qualsiasi) oppure discrete (possono assumere solo valori interi). ESEMPIO Il peso di un corpo è misurabile con una scala a intervalli. Infatti Peso(A+B)=Peso(A)+Peso(B) Peso(A-B)=Peso(A)-Peso(B) Peso(3 • A) =3 • Peso(A) Il numero di abitanti nei diversi comuni della provincia di Lecce è misurabile con una scala a intervalli. La variabile peso è continua; la variabile numero di abitanti è discreta.

LA MISURAZIONE: LE SCALE A INTERVALLI Il fatto che le modalità di una variabile

LA MISURAZIONE: LE SCALE A INTERVALLI Il fatto che le modalità di una variabile siano espresse da numeri non comporta necessariamente che questa sia misurabile con una scala a intervalli. Ad esempio, le valutazioni riportate agli esami, anche se espresse numericamente, non sono misurabili al livello di scala ad intervalli, poiché non esiste una unità di misura comunemente accettata.

INTERVALLI Le scale a intervalli non hanno uno zero assoluto in quanto, o non

INTERVALLI Le scale a intervalli non hanno uno zero assoluto in quanto, o non si verifica mai la totale assenza della variabile, o lo strumento non è in grado di valutarla. Questo comporta l'impossibilità di asserire che se la misura di Y è uguale a k volte la misura di X, vale anche la relazione Y=k. X. Una scala che rispetta questa proprietà è una scala di rapporti. Le scale di misura dei pesi sono scale di rapporti, infatti se Y è il doppio di X, anche la misura di Y sarà il doppio della misura di X e viceversa. Le misure della temperatura in gradi Celsius e Fahrenheit, non avendo uno 0 assoluto, sono scale ad intervalli, ma non di rapporti.

LA MISURAZIONE: LE SCALE A INTERVALLI Consideriamo, ad esempio, una temperatura di 30 gradi

LA MISURAZIONE: LE SCALE A INTERVALLI Consideriamo, ad esempio, una temperatura di 30 gradi sulla scala Celsius; essa è calda il doppio rispetto ad una di 15 gradi sulla stessa scala. Trasformiamo le due temperature in gradi Fahrenheit, con la formula: F=(C • 1, 8)+32. Otteniamo: F 1=(15*1, 8)+32=27+32=59 F 2=(30*1, 8)+32=54+32=86 Mentre sulla scala Celsius la seconda temperatura è il doppio della prima, sulla scala Fahrenheit è all’incirca il 46% più alta.

LA MISURAZIONE: LE SCALE DI RAPPORTI Nel 1868 il fisico e ingegnere irlandese William

LA MISURAZIONE: LE SCALE DI RAPPORTI Nel 1868 il fisico e ingegnere irlandese William Thomson, nominato barone con il nome di Lord Kelvin propose una scala di misurazione nella quale lo zero corrisponde alla più bassa temperatura ottenibile, pari a -273, 15 °C. Tale punto è lo zero assoluto; a questa temperatura le molecole di un corpo sarebbero prive di energia cinetica, cioè ferme. La scala Kelvin è una scala di rapporti. Ha senso dire che il rapporto tra 600 K e 300 K è uguale a 2.

INTERVALLI ELABORAZIONE DEI DATI Medie analitiche: Sono valori medi calcolati utilizzando tutti i valori

INTERVALLI ELABORAZIONE DEI DATI Medie analitiche: Sono valori medi calcolati utilizzando tutti i valori delle singole osservazioni, invece della loro posizione. Media aritmetica: è il valore che, se sostituito ad ogni singolo dato, lascia invariata la loro somma; si indica con ; distinguiamo due casi: 1. Media di singoli valori: Supponiamo che i voti agli esami di maturità di 5 studenti siano stati 84, 90, 85, 98, 68. La media del collettivo considerato sarà:

INTERVALLI 2. Media di dati raggruppati in classi: Immaginiamo di avere una classe di

INTERVALLI 2. Media di dati raggruppati in classi: Immaginiamo di avere una classe di 20 studenti con i seguenti risultati: 3 maturati con 75, 4 con 80, 10 con 88 e 3 con 98. La media sarà: La formula utilizzata è la stessa che si impiega nel calcolo della media ponderata, con pesi pari ai diversi n i.

INTERVALLI ESEMPIO Uno studente ha sostenuto 5 esami ai quali sono assegnati differenti CFU,

INTERVALLI ESEMPIO Uno studente ha sostenuto 5 esami ai quali sono assegnati differenti CFU, riportando i risultati riportati nella tabella: ESAME CFU VOTO A 12 24 Calcolare la media semplice e B 8 20 la media ponderata. C 12 18 Media semplice: D 6 30 E 8 25 Media ponderata:

SCALE A INTERVALLI: LA VARIABILITÀ La media rappresenta abbastanza fedelmente il grado con cui

SCALE A INTERVALLI: LA VARIABILITÀ La media rappresenta abbastanza fedelmente il grado con cui una determinata qualità è presente in un collettivo, ma non descrive il modo in cui detta qualità si distribuisce. LA STATISTICA Sai che d'e' la statistica? E' 'na cosa che serve pe' fa' un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che sposa. Ma pe' me la statistica curiosa e' dove c'entra la percentuale, pe' via che, li', la media è sempre eguale puro co' la persona bisognosa. Me spiego: da li conti che se fanno seconno le statistiche d'adesso risurta che te tocca un pollo all' anno: e, se nun entra ne le spese tue, t'entra ne la statistica lo stesso perche' c'e' un antro che ne magna due. Trilussa (Carlo Alberto Salustri), 1871 -1950

SCALE A INTERVALLI: LA VARIABILITÀ Consideriamo due gruppi di studenti, i quali in un

SCALE A INTERVALLI: LA VARIABILITÀ Consideriamo due gruppi di studenti, i quali in un esame abbiano conseguito i seguenti risultati: GRUPPO A: 30, 18, 30, 26, 20, 18, 21, 30, 18, 19 GRUPPO B: 22, 24, 23, 25, 22, 21, 23, 24, 22 Il voto medio è, per entrambi i gruppi, 23, ma le due classi ci appaiono sostanzialmente differenti: i voti del gruppo B sono tutti molto vicini alla media, mentre quelli del gruppo A mostrano un gruppetto di studenti molto bravi contrapposto ad una maggioranza di studenti con voti sensibilmente più bassi. Rappresentare i dati ricorrendo alla sola media significa darne un rappresentazione parziale, se non addirittura falsa. È necessario completare i quadro con indici che misurino la variabilità presente nei due gruppi.

SCALE A INTERVALLI: LA VARIABILITÀ Gli indici di variabilità più utilizzati si basano sugli

SCALE A INTERVALLI: LA VARIABILITÀ Gli indici di variabilità più utilizzati si basano sugli scarti tra i singoli dati e la loro media Xi VOTO Xi -Mx (Xi -Mx)2 Nella seconda colonna X 1 30 7 49 sono riportati i voti del X 2 18 -5 25 gruppo A; nella terza le differenze di ciascun voto X 3 30 7 49 dalla media (23); la somma X 4 26 3 9 di tali differenze è uguale a X 5 20 -3 9 zero, poiché una delle X 6 18 -5 25 proprietà della media X 7 21 -2 4 consiste proprio X 8 30 7 49 nell’annullamento della X 9 18 -5 25 somma degli scarti da sé X 10 19 -4 16 stessa. TOTALE 0 260

SCALE A INTERVALLI: LA VARIABILITÀ Si passa, perciò a calcolare il quadrato dei singoli

SCALE A INTERVALLI: LA VARIABILITÀ Si passa, perciò a calcolare il quadrato dei singoli scarti, calcolandone, poi, la somma, che viene detta devianza. Dividendo questa quantità per il numero dei casi (ossia, Yi VOTO Yi–My (Yi–My)2 calcolcolandone la media), si Y 1 22 -1 1 ottiene la varianza, secondo Y 2 24 1 1 la formula: Y 3 24 1 1 Y 4 23 0 0 Y 5 25 2 4 Y 6 22 -1 1 Y 7 21 -2 4 Y 8 23 0 0 Y 9 24 1 1 Y 10 22 -1 1 TOTALE 0 14

SCALE A INTERVALLI: LA VARIABILITÀ La varianza non è espressa nella stessa unità di

SCALE A INTERVALLI: LA VARIABILITÀ La varianza non è espressa nella stessa unità di misura dei dati, essendo una misura quadratica; si passa, perciò, a calcolare lo scarto quadratico medio, ossia la radice quadrata della varianza: Riprendendo i dati dell’esempio precedente, otteniamo: GRUPPO A: Devianza = 260; Varianza = 26; Scarto quadratico medio = 5, 10. GRUPPO B: Devianza = 14; Varianza = 1, 4; Scarto quadratico medio = 1, 18.

I PUNTI Z Nella diapositiva n. 25 abbiamo sottolineato il fatto che non tutte

I PUNTI Z Nella diapositiva n. 25 abbiamo sottolineato il fatto che non tutte le variabili i cui valori sono espressi numericamente sono misurabili con una scala a intervalli. Quando non si dispone di una unità di misura condivisa, si collocano al livello ordinale. Riconsideriamo l’esempio precedente e supponiamo che i due gruppi siano stati valutati da commissioni d’esame differenti. Chiediamoci se è possibile confrontare i voti dei due studenti che abbiamo indicato con X 7 e Y 7. A prima vista diremmo di sì, anzi diremmo che i due studenti hanno lo stesso voto; d’altronde le due commissioni hanno utilizzato una stessa scala di valutazione espressa in trentesimi.

I PUNTI Z Ma possiamo asserire che le due commissioni abbiano utilizzato una stessa

I PUNTI Z Ma possiamo asserire che le due commissioni abbiano utilizzato una stessa unità di misura? La prima commissione ha utilizzato l'intera gamma dei voti dal 18 al 30, mentre la seconda commissione mostra una chiara propensione ad utilizzare la fascia mediana dei voti (dal 22 al 25). Inoltre, nel primo caso troviamo forti differenze nella valutazione, mentre nel secondo le differenze sono di minore entità. Da tutto ciò deduciamo che i due 21 hanno probabilmente un diverso valore e che prima di confrontarli, dobbiamo sottoporli ad una qualche trasformazione che abbia a che fare sia con la media delle due distribuzioni che con il loro scarto quadratico medio. Ricordiamo che quest’ultimo rappresenta la distanza dei dati dalla loro media.

I PUNTI Z La nuova scala misurerà i punteggi nei termini della loro distanza

I PUNTI Z La nuova scala misurerà i punteggi nei termini della loro distanza dalla media espressa in scarti quadratici medi; diremo che un tale punteggio dista dalla media tot scarti quadratici medi. I nuovi punteggi si chiamano punti Z o punti standardizzati. Si calcolano con la formula: Le tabelle successive mostrano i risultati della trasformazione.

I PUNTI Z Xi VOTO Yi Zi VOTO Zi X 1 30 1, 37

I PUNTI Z Xi VOTO Yi Zi VOTO Zi X 1 30 1, 37 Y 1 22 -0, 85 X 2 18 -0, 98 Y 2 24 0, 85 X 3 30 1, 37 Y 3 24 0, 85 X 4 26 0, 59 Y 4 23 0, 00 X 5 20 -0, 59 Y 5 25 1, 69 X 6 18 -0, 98 Y 6 22 -0, 85 X 7 21 -0, 39 Y 7 21 -1, 69 X 8 30 1, 37 Y 8 23 0, 00 X 9 18 -0, 98 Y 9 24 0, 85 X 10 19 -0, 78 Y 10 22 -0, 85

I PUNTI Z Nella figura seguente è rappresentata, su una scala graduata, la posizione

I PUNTI Z Nella figura seguente è rappresentata, su una scala graduata, la posizione dei diversi punti Z (la variabile Y sulla parte superiore e la X su quella inferiore. Come si vede, mentre in termini assoluti i massimo e il minimo sono raggiunti dal gruppo A, in termini di punti Z massimo e minimo sono nel gruppo B. È facile verificare che le due distribuzioni ottenute hanno medio uguale a 0 e varianza uguale a 1.

TIPI DI DATI LINGUISTICI Dati naturalistici Aspetto positivo: naturalezza del contesto. Aspetto negativo: difficoltà

TIPI DI DATI LINGUISTICI Dati naturalistici Aspetto positivo: naturalezza del contesto. Aspetto negativo: difficoltà di controllo delle variabili pertinenti. Dati controllati sperimentalmente: Aspetto positivo: astrazione ed idealizzazione. Aspetto negativo: interferenza dello sperimentatore. La linguistica computazionale ha bisogno di entrambe le procedure di raccolta dei dati 42

I CORPORA Il luogo naturale dei dati linguistici è costituito dai TESTI Una collezione

I CORPORA Il luogo naturale dei dati linguistici è costituito dai TESTI Una collezione di testi raccolti e organizzati per rispondere alle esigenze dell’analisi linguistica è detta corpus. Esso è un sottoinsieme di tutte le possibili produzioni linguistiche, ossia ne costituisce un campione. 43

I CORPORA • PROBLEMA: Campionamento da una popolazione infinita o, quantomeno, non delimitabile Dimensione

I CORPORA • PROBLEMA: Campionamento da una popolazione infinita o, quantomeno, non delimitabile Dimensione del cam pione Metodo di campionamento [possibilità offerte dalla [bilanciamento (campioni tecnologia corpora dinamici] stratificati)] 44

I CORPORA La tipologia di un corpus è determinata da: Generalità [specialistico/generale] Modalità [lingua

I CORPORA La tipologia di un corpus è determinata da: Generalità [specialistico/generale] Modalità [lingua scritta/lingua parlata/misto] Cronologia [sincronico/diacronico] Lingua [monolingue/multilingue] 45

LA CODIFICA DEL TESTO Codifica di livello zero: associazione biunivoca tra un insieme di

LA CODIFICA DEL TESTO Codifica di livello zero: associazione biunivoca tra un insieme di caratteri e le loro codifiche binarie. Codifica di alto livello: aggiunge al dato una struttura inserendolo in un sistema di rapporti con altri dati 46

LA CODIFICA DEL TESTO: DIVERSI LIVELLI DI STRUTTURA Struttura del corpus: tipologia del testo,

LA CODIFICA DEL TESTO: DIVERSI LIVELLI DI STRUTTURA Struttura del corpus: tipologia del testo, argomento Struttura del testo: distinzione tra titoli di capitolo, di paragrafo, righe di testo Struttura del contesto: autore, data di produzione Struttura linguistica: informazioni morfologiche, sintattiche, semantiche 47

PRIMA DI TUTTO CLASSIFICARE Aggettivo Avverbio Articolo Congiunzione Nome Esclamazione Pronome Preposizione Verbo 48

PRIMA DI TUTTO CLASSIFICARE Aggettivo Avverbio Articolo Congiunzione Nome Esclamazione Pronome Preposizione Verbo 48

AGGETTIVO MORF 0 = pc "parola contenuto" SONO PAROLE FUNZIONE (pf) I possessivi, i

AGGETTIVO MORF 0 = pc "parola contenuto" SONO PAROLE FUNZIONE (pf) I possessivi, i dimostrativi e gli indefiniti MORF 1 = qu "aggettivo qualificativo"; MORF 1 = po " aggettivo possessivo"; MORF 1 = di " aggettivo dimostrativo"; (sono compresi: stesso e medesimo) MORF 1 = in " aggettivo indefinito"; MORF 1 = ie " aggettivo interrogativo/esclamativo"; (es: che, quale, quanto) MORF 1 = nm " aggettivo numerale"; MORF 2 = ps "grado positivo" MORF 2 = cm "grado comparativo" MORF 2 = sa "grado superlativo assoluto" MORF 2 = sr "grado superlativo relativo“ MORF 4 = ms "genere maschile" MORF 4 = fm "genere femminile" MORF 4 = iv "genere invariabile“ MORF 5 = sg "numero singolare" MORF 5 = pl "numero plurale" 49

AGGETTIVO SINT 0 = sp "regge un SP" SINT 0 = fr "regge una

AGGETTIVO SINT 0 = sp "regge un SP" SINT 0 = fr "regge una frase“ SINT 1 = pn "aggettivo in posizione prenominale" SINT 1 = dn "aggettivo in posizione postnominale" SEM 0 = ps "aggettivo con valore positivo" SEM 0 = ng "aggettivo con valore negativo“ SEM 1 = fm "forma" SEM 1 = cl "colore" SEM 1 = mt "materia" SEM 1 = dm "dimensione" SEM 1 = ps "peso" SEM 1 = tp "tempo" SEM 1 = lg "luogo" SEM 1 = et "etnia" SEM 1 = pz "percezione" SEM 1 = sm "sentimento" SEM 1 = gd "giudizio" SEM 1 = sz "sensazione" SEM 1 = rl "relazione" 50

ARTICOLO MORF 0 = pf "parola funzione“ MORF 1 = dt "articolo determinativo" MORF

ARTICOLO MORF 0 = pf "parola funzione“ MORF 1 = dt "articolo determinativo" MORF 1 = id "articolo indeterminativo" MORF 1 = pt "articolo partitivo“ MORF 4 = ms "genere maschile" MORF 4 = fm "genere femminile“ MORF 5 = sg "numero singolare" MORF 5 = pl "numero plurale" 51

NOME MORF 0 = pc "parola contenuto". MORF 1 = as "nome astratto"; MORF

NOME MORF 0 = pc "parola contenuto". MORF 1 = as "nome astratto"; MORF 1 = cn "nome concreto"; MORF 1 = am "nome animato"; MORF 1 = um "nome umano"; MORF 2 = cm "nome comune" MORF 2 = pp "nome proprio" MORF 3 = in "nome individuale" MORF 3 = cl "nome collettivo" MORF 3 = ma "nome massa" MORF 3 = nm "nome numerale" MORF 4 = ma "genere maschile" MORF 4 = fm "genere femminile" MORF 4 = iv "genere invariabile" MORF 5 = sg "numero singolare" MORF 5 = pl "numero plurale" SINT 0 = sp "regge un SP" SINT 0 = fr "regge una frase" 52

NOME SEM 0 = ev "nome di evento" SEM 0 = en "nome di

NOME SEM 0 = ev "nome di evento" SEM 0 = en "nome di entità“ SEM 4 = fm "forma" SEM 4 = cl "colore" SEM 4 = mt "materia" SEM 4 = dm "dimensione" SEM 4 = ps "peso" SEM 4 = tp "tempo" SEM 4 = lg "luogo" SEM 4 = et "etnia" SEM 4 = pz "percezione" SEM 4 = sm "sentimento" SEM 4 = gd "giudizio" SEM 4 = sz "sensazione" SEM 4 = rl "relazione 53

PRONOME MORF 0 = pf "parola funzione" MORF 1 = pe "pronome personale"; MORF

PRONOME MORF 0 = pf "parola funzione" MORF 1 = pe "pronome personale"; MORF 1 = po "pronome possessivo"; MORF 1 = di "pronome dimostrativo"; (sono compresi: stesso e medesimo) MORF 1 = in "pronome indefinito"; MORF 1 = ie "pronome interrogativo/esclamativo"; (es: che, quale, quanto) MORF 1 = re "pronome relativo"; MORF 1 = nm "pronome numerale"; MORF 2 = pm "prima persona" MORF 2 = sc "seconda persona" MORF 2 = tz "terza persona " 54

PRONOME MORF 4 = ms "genere maschile" MORF 4 = fm "genere femminile" MORF

PRONOME MORF 4 = ms "genere maschile" MORF 4 = fm "genere femminile" MORF 4 = iv "genere invariabile" MORF 5 = sg "numero singolare" MORF 5 = pl "numero plurale" SEM 3 = dt "valore deittico" SEM 3 = af "valore anaforico" SEM 3 = cf "valore cataforico" 55

VERBO MORF 0 = pc "parola contenuto". MORF 1 = id "modo indicativo"; MORF

VERBO MORF 0 = pc "parola contenuto". MORF 1 = id "modo indicativo"; MORF 1 = cg " modo congiuntivo"; MORF 1 = cd "modo condizionale"; MORF 1 = im "modo imperativo"; MORF 1 = in "modo infinito"; MORF 1 = ge "modo gerundio"; MORF 1 = pt "modo participio"; MORF 2 = pr "tempo presente" MORF 2 = ip "tempo imperfetto" MORF 2 = ps "tempo passato" MORF 2 = ft "tempo futuro" MORF 3 = pm "prima persona" MORF 3 = sc "seconda persona" MORF 3 = tz "terza persona " MORF 4 = ma "genere maschile" MORF 4 = fm "genere femminile" MORF 4 = iv "genere invariabile" MORF 5 = sg "numero singolare" MORF 5 = pl "numero plurale" 56

VERBO SINT 0 = cp "verbo copulativo" SINT 0 = au "verbo ausiliare" SINT

VERBO SINT 0 = cp "verbo copulativo" SINT 0 = au "verbo ausiliare" SINT 0 = av "verbo avalente" SINT 0 = mv "verbo monovalente" SINT 0 = bv "verbo bivalente" SINT 0 = tv "verbo trivalente" SINT 0 = pv "verbo polivalente" SINT 1 = tr "verbo transitivo" SINT 1 = ie "verbo inergativo": [Si costruisce con l'ausiliare avere; indica un'azione del soggetto] SINT 1 = ia "verbo inaccusativo": [Si costruisce con l'ausiliare essere; indica cambiamento di stato o di locazione] 57

VERBO SEM 0 = mt "verbo di moto" SEM 0 = mn "verbo di

VERBO SEM 0 = mt "verbo di moto" SEM 0 = mn "verbo di maniera" SEM 0 = pc "verbo di percezione" SEM 0 = cg "verbo di cognizione" SEM 0 = ms "verbo di misura" SEM 2 = in "ingressivo (incoativo)" SEM 2 = cn "conclusivo" SEM 3 = it "iterativo SEM 3 = ni "non iterativo SEM 4 = fm "forma" SEM 4 = cl "colore" SEM 4 = mt "materia" SEM 4 = dm "dimensione" SEM 4 = ps "peso" SEM 4 = tp "tempo" SEM 4 = lg "luogo" SEM 4 = et "etnia" SEM 4 = pz "percezione" SEM 4 = sm "sentimento" SEM 4 = gd "giudizio" SEM 4 = sz "sensazione" SEM 4 = rl "relazione" 58

ELABORAZIONE Un corpus va sottoposto ad elaborazioni che producano: Output linguistici: liste ordinate per

ELABORAZIONE Un corpus va sottoposto ad elaborazioni che producano: Output linguistici: liste ordinate per rango, concordanze, tabelle di distribuzione delle categorie grammaticali. Parametri statistici: riferibili globalmente al corpus o alle singole entità (lemmi o parole) 59

INDICI E PARAMETRI Frequenza assoluta e relativa Rapporto type/token Densità lessicale pc/pf Misure di

INDICI E PARAMETRI Frequenza assoluta e relativa Rapporto type/token Densità lessicale pc/pf Misure di variabilità Indice d’uso 60

INDICI E PARAMETRI R = NUMERO DEI SOTTOINSIEMI NEI QUALI IL LEMMA APPARE (NOMI:

INDICI E PARAMETRI R = NUMERO DEI SOTTOINSIEMI NEI QUALI IL LEMMA APPARE (NOMI: RANGO, RIPARTIZIONE, O CLASSE DI DISPERSIONE) Lemma F F 1 (teatro) F 2 (romanzi) F 3 (cinema) F 4 (periodici) F 5 (sussidiari) R Accertare 15 0 14 0 2 Colloquio 15 0 10 0 2 Deposito 15 0 6 4 3 Divinità 15 0 0 15 1 Finanziario 15 1 0 0 13 1 3 Poliziotto 15 3 3 3 5 Proprietario 15 1 2 1 10 1 5 61

D 1 = FMAX - FMIN Lemma F F 1 (teatro) F 2 (romanzi)

D 1 = FMAX - FMIN Lemma F F 1 (teatro) F 2 (romanzi) F 3 (cinema) F 4 (periodici) F 5 (sussidiari) d 1 L 1 10 2 2 2 0 L 2 10 3 2 2 2 1 2 L 3 10 4 3 1 1 1 3 L 4 10 10 0 0 10 Per i lemmi seguenti si ottengono parametri uguali, mentre L 5 appare ripartito più uniformemente Lemma F F 1 (teatro) F 2 (romanzi) F 3 (cinema) F 4 (periodici) F 5 (sussidiari) d 1 L 5 4600 900 900 100 L 6 105 1 1 101 62 100

D 2 = D 1 / F Lemma F d 1 d 2 L

D 2 = D 1 / F Lemma F d 1 d 2 L 5 4600 100: 4600=0, 02 L 6 105 100: 105=0, 95 Indica in modo inverso l’uniformità della distribuzione. Caratteristiche positive: è indipendente dalla frequenza; varia tra 0 e 1, potendo essere applicato a lemmi con frequenza diversa Perde efficacia con i lemmi seguenti: Lemma F F 1 (teatro) F 2 (romanzi) F 3 (cinema) F 4 (periodici) L 7 100 10 20 20 20 L 8 1000 150 200 250 F 5 (sussidiari) d 1 d 2 30 20 0, 2 300 200 0, 2 63

Lemma F L 7 100 20 10 20/100=0, 2 L 8 1000 200 100

Lemma F L 7 100 20 10 20/100=0, 2 L 8 1000 200 100 50 100 300/1000=0, 3 d 3 64

L f 1 f 2 f 3 f 4 f 5 L 9 1

L f 1 f 2 f 3 f 4 f 5 L 9 1 1 1 0 0 0, 0 L 10 2 1 1 1 0 0 0 1 0, 4 L 11 2 2 1 0 0 1 1 0, 8 L 12 3 1 1 0 0 2 0 0 1 1 0, 8 L 13 3 2 0 0 0 2 1 1 1, 2 L 14 4 1 0 0 0 3 0 1 1, 2 L 15 5 0 0 4 1 1 1, 6 d 3 65

LA VARIABILITÀ Quando il testo è suddiviso in almeno due opere, è possibile calcolare

LA VARIABILITÀ Quando il testo è suddiviso in almeno due opere, è possibile calcolare dei parametri riguardanti la distribuzione dei lemmi e delle forme. Essi sono la dispersione e l'uso. Il loro calcolo si sviluppa nei seguenti passi: 1° Varianza 2° Scarto quadratico medio 66

LA VARIABILITÀ Lo scarto quadratico medio varia col variare della dimensione dei dati. Xi

LA VARIABILITÀ Lo scarto quadratico medio varia col variare della dimensione dei dati. Xi - M (Xi – M)2 2 3, 5 12, 25 4 1, 5 2. 25 7 1, 5 2, 25 9 3, 5 12, 25 Σ 29 Mx = 5, 5 Yi - M (Yi – M)2 4 7 49 8 3 9 14 3 9 18 7 49 Σ 116 My = 11 σ2 = 7, 25 σ = 2, 69 σ2 = 29 σ = 5, 39 Xi Yi 67

LA VARIABILITÀ Dividendo ciascuno scarto quadratico medio per la media dei dati da cui

LA VARIABILITÀ Dividendo ciascuno scarto quadratico medio per la media dei dati da cui sono stati calcolati, otteniamo una misura indipendente dalla dimensione dei dati che si chiama coefficiente di variazione indicato da In entrambi i casi otteniamo il valore 0, 49. CVD 68

LA VARIABILITÀ Dal modo in cui lo abbiamo calcolato, deduciamo che V = 0

LA VARIABILITÀ Dal modo in cui lo abbiamo calcolato, deduciamo che V = 0 quando tutti gli Xi sono uguali tra loro. In questo caso, infatti, sia la varianza che lo scarto quadratico medio sono uguali a 0. Cosa succede se tutte le frequenze sono concentrate in una sola classe? Xi Xi - M (Xi – M)2 σ2 = 363/4 = 90, 75 22 16, 5 272, 25 σ = 9, 53 0 5, 5 30. 25 V = 9, 53/5, 5 = 1, 73 = 0 5, 5 30, 25 Σ 29 69

LA VARIABILITÀ Se dividiamo V per il suo massimo, otteniamo un indice che varia

LA VARIABILITÀ Se dividiamo V per il suo massimo, otteniamo un indice che varia tra 0 e 1 (0 quando le frequenze sono distribuite uniformemente; 1 quando sono concentrate tutte in una classe). Chiamiamo questo indice Coefficiente di variazione standardizzato: Questo indice è tanto più grande quanto più la distribuzione delle frequenze è concentrata. 70

LA VARIABILITÀ per ottenere un indice che sia tanto più grande quanto più la

LA VARIABILITÀ per ottenere un indice che sia tanto più grande quanto più la distribuzione si approssima all’uniformità, calcoliamo il complemento all’unità di Chiamiamo Dispersione l’indice Chiamiamo Uso il prodotto della Frequenza per la Dispersione 71

ELABORAZIONE DI TESTI 72

ELABORAZIONE DI TESTI 72

DARE UN FORMATO AL TESTO : Anatomia degli ipocriti di Alessandro Tomaso Arcudi, 1655

DARE UN FORMATO AL TESTO : Anatomia degli ipocriti di Alessandro Tomaso Arcudi, 1655 -1718, predicatore generale dell’Ordine dei domenicani, nato a Galatina, morì nel Convento di Andrano, dove era stato confinato dai suoi Superiori. 1. Selezionare il testo: ANATOMIA DEGLI IPOCRITI MEMBRO PRIMO: Faccia TAGLIO PRIMO: Prende l’ipocrisia diverse figure, che tutte mirano concordi ad impugnare la bella Sposa di Cristo. Ammirabile sopra tutti i pittori fu quel Parrasio, ch’ebbe ingegno ad esprimere co’ suoi pennelli il genio stravagante d'Atene. Si vedeva l’arguta immagine, fiera insieme e benigna, umile e superba, clemente e spietata, pia ed empia, clemente ed oltraggiosa, intrepida e timida, pacifica e guerriera, dimostrando in se stessa la diversità de’ costumi di quella nazione incostante, di natura strana, e d’operazioni fra loro 73 pugnanti. In qual guisa delineasse la figura mostruosa che aveva gli vizi e le virtù tanto congiunti, io non saprei immaginarlo.

DARE UN FORMATO AL TESTO 74

DARE UN FORMATO AL TESTO 74

DARE UN FORMATO AL TESTO ATAI 36700 TCANATOMIA DEGLI IPOCRITI ATAI 36700 TPMEMBRO PRIMO:

DARE UN FORMATO AL TESTO ATAI 36700 TCANATOMIA DEGLI IPOCRITI ATAI 36700 TPMEMBRO PRIMO: ATAI 36700 STFaccia ATAI 36700 SPTAGLIO PRIMO: ATAI 36701 RIPrende l’ipocrisia diverse figure, che tutte mirano concordi ad impugnare la bella Sposa di Cristo. ATAI 36702 RIAmmirabile sopra tutti i pittori fu quel Parrasio, ch’ebbe ingegno ad esprimere co’ suoi pennelli il genio stravagante d'Atene. ATAI 36703 RISi vedeva l’arguta immagine, fiera insieme e benigna, umile e superba, clemente e spietata, pia ed empia, clemente ed oltraggiosa, intrepida e timida, pacifica e guerriera, dimostrando in se stessa la diversità de’ costumi di quella nazione incostante, di natura strana, e d’operazioni fra loro pugnanti. 75 ATAI 36704 RIIn qual guisa delineasse la figura mostruosa che aveva gli vizi e le virtù tanto congiunti, io non saprei immaginarlo.

DARE UN FORMATO AL TESTO Scelte di formattazione: 1. Il testo è stato suddiviso

DARE UN FORMATO AL TESTO Scelte di formattazione: 1. Il testo è stato suddiviso in frasi; 2. Frase a) porzione di testo che termina con uno dei seguenti segni di interpunzione: punto ( «. » ); punto e virgola ( «; » ); punto esclamativo ( «!» ); punto interrogativo ( «? » ); due punti ( «: » ). b) Ogni porzione di testo racchiusa tra parentesi è frase. c) Al testo indicato sub (b) si applica la procedura sub (a). 76

DARE UN FORMATO AL TESTO 3) Il testo così formattato viene importato nell’archivio TESTI.

DARE UN FORMATO AL TESTO 3) Il testo così formattato viene importato nell’archivio TESTI. 4) IL TESTO è diviso in tre parti: AA, AC, LC. 5) Si incrementa il VOCABOLARIO (Archivio LEMMI) con le parole che non vi siano già comprese. Si completa il campo F_INDICE 6) Si effettua la prelemmatizzazione, la quale verrà corretta manualmente 7) Si costruisce l’archivio LISTA 8) Si sciolgono le ambiguità 9) Si completa LISTA con INDICE ed F_INDICE Alla fine, l’Archivio LISTA sarà costituito da una serie di record con la struttura successiva. 77

78

78

10) Si costruiscono LEMMARIO E FORMARIO 79

10) Si costruiscono LEMMARIO E FORMARIO 79

10) Si costruiscono LEMMARIO … 80

10) Si costruiscono LEMMARIO … 80

10) … e FORMARIO 81

10) … e FORMARIO 81

11) Si calcolano le frequenze: Il programma chiede a) Di indicare in quante parti

11) Si calcolano le frequenze: Il programma chiede a) Di indicare in quante parti si è diviso il testo. b) Di individuare il posto occupato dal primo carattere delle sigle all’interno del campo POSIZIONE. c) Di immettere le sigle che individuano ciascuna delle parti in cui è stato diviso il testo, secondo le indicazioni contenute nella maschera 82

11) Si calcolano le frequenze: Il programma chiede d) Di indicare qual è il

11) Si calcolano le frequenze: Il programma chiede d) Di indicare qual è il numero di record dell’archivio LISTA da cui si vuole iniziare il calcolo. e) Di indicare qual è il numero di record dell’archivio LISTA con cui si vuole terminare il calcolo. 12) Si calcolano gli indici di variabilità. Alla fine del calcolo, l’archivio LEMMARIO si presenterà come nella scheda seguente: 83

84

84

13) Nei due passaggi successivi, vengono costruiti due file che consentiranno la disposizione dei

13) Nei due passaggi successivi, vengono costruiti due file che consentiranno la disposizione dei lemmi in ordine di rango: il file di tipo testo rango. txt e l’archivi RANGO. In entrambi i casi, il programma ci chiederà di introdurre il numero delle parti. 85

14) Per costruire l’archivio dei lemmi distribuiti per categoria grammaticale, occorrerà fornire al programma

14) Per costruire l’archivio dei lemmi distribuiti per categoria grammaticale, occorrerà fornire al programma l’elenco delle categorie utilizzate 86

Il record visualizzato è il numero 2; è relativo all’aggettivo tutto; ha rango 1

Il record visualizzato è il numero 2; è relativo all’aggettivo tutto; ha rango 1 nella categoria degli aggettivi; ha frequenza assoluta pari a 25; il campo Somma contiene le frequenze del lemma corrente più le frequenze dei lemmi precedenti; il campo Parziale contiene le frequenze del lemma corrente sommate a quelle dei lemmi precedenti appartenenti alla stessa categoria. 87

15) Infine, verrà costruito l’archivio CONCORDANZA. Esso è costituito da due tipi di record;

15) Infine, verrà costruito l’archivio CONCORDANZA. Esso è costituito da due tipi di record; per ogni lemma ci sarà un record che nel campo STRINGA contiene il numero d’ordine del lemma secondo l’ordinamento alfabetico, il lemma, e la frequenza assoluta. Tale record sarà seguito da un numero di record di contesto pari alla frequenza del lemma (nel nostro esempio saranno 59) Il secondo lemma è la preposizione latina ab. 88

Le tre parti individuate sono state suddivise in unità più piccole, che costituiscono una

Le tre parti individuate sono state suddivise in unità più piccole, che costituiscono una collezione di unità di contesto entro le quali si collocano le singole occorrenze di parola; si sono, così, individuate 164 unità di contesto, la cui distribuzione nelle tre parti è riportata nella tab. 1. Si è scartata la scelta di considerare come contesto la singola riga di testo, poiché, al contrario di quanto avviene nella poesia, dove il verso rappresenta unità ritmica, nella prosa essa non è sede di processi grammaticali. Si è, pertanto, considerato come contesto una stringa di parole compresa tra due segni di interpunzione diversi dalla virgola. In questo modo, si sono ottenuti contesti all’interno dei quali possono essere identificati precisi rapporti sintattici e semantici tra le parole, anche se, a volte, alquanto lunghi. Paragrafo n. di parole n. di contesti 1 1231 67 lunghezza media 18, 37 2 888 52 17, 08 3 672 45 14, 93 89

Dei 1000 lemmi classificati, ben 729 sono hapax, ossia lemmi con un’unica occorrenza. Dalla

Dei 1000 lemmi classificati, ben 729 sono hapax, ossia lemmi con un’unica occorrenza. Dalla tabella riportata possono essere ricavate le prime misure lessicometriche relative ai testi esaminati: CG Lemmi % Forme % Occorrenze ab 1 0, 100 1 0, 082 2 ag 211 21, 100 260 21, 242 346 ar 8 0, 800 14 1, 144 223 av 33 3, 300 34 2, 778 123 co 17 1, 700 18 1, 471 181 es 1 0, 100 1 0, 082 1 nm 446 44, 600 483 39, 461 663 pn 25 2, 500 29 2, 369 151 pr 19 1, 900 59 4, 820 460 ve 239 23, 900 325 26, 552 398 TOTALE 1000 100, 000 1224 100, 000 2548 tab. 2 distribuzione di frequenze per categorie grammaticali % 0, 078 13, 579 8, 752 4, 827 7, 104 0, 039 26, 020 5, 926 18, 053 15, 620 100, 000 90

Misure lessicometriche Totale delle occorrenze: 2548; (Ampiezza) Totale delle parole grafiche: 1224; Totale dei

Misure lessicometriche Totale delle occorrenze: 2548; (Ampiezza) Totale delle parole grafiche: 1224; Totale dei lemmi: 1000; Le parole contenuto costituiscono il 51, 65% del totale delle occorrenze Ricchezza lessicale: Rapporto tra lemmi e occorrenze: VL/N = 0, 39; (Decresce con l’aumentare della dimensione del testo) Rapporto tra hapax e lemmi: V 1/VL = 0, 73; (Il valore particolarmente elevato si giustifica con le ridotte dimensioni del corpus analizzato. Esso, infatti, tende, a parità di ogni altra condizione, a decrescere al crescere del corpus) Frequenza media dei lemmi: N/VL = 2, 55 Indice di Guiraud: R = VL/√N = 19, 81 VL = numero di lemmi; N = numero di occorrenze; V 1 = numero di hapax. 91

Misure lessicometriche Prendiamo in considerazione i dati relativi alle singole parti in cui si

Misure lessicometriche Prendiamo in considerazione i dati relativi alle singole parti in cui si è diviso il testo CG ag ar av co nm pn pr ve TOTALE Lemmi % Forme % Occorrenze % 114 22, 938 140 23, 064 168 15, 094 8 1, 610 12 1, 977 106 9, 524 18 3, 622 18 2, 965 51 4, 582 15 3, 018 16 2, 636 82 7, 367 191 38, 431 202 33, 278 276 24, 798 17 3, 421 20 3, 295 66 5, 930 16 3, 219 47 7, 743 192 17, 251 118 23, 742 152 25, 041 172 15, 454 497 100, 000 607 100, 000 1113 100, 000 tab. 3 distribuzione di frequenze MEMBRO PRIMO – TAGLIO PRIMO Totale delle occorrenze: 1113; Totale delle parole grafiche: 607; Totale dei lemmi: 497; Le parole contenuto costituiscono il 51, 57% del totale delle occorrenze Ricchezza lessicale: Rapporto tra lemmi e occorrenze: VL/N = 0, 45; Frequenza media dei lemmi: N/VL = 2, 2492 Indice di Guiraud: R = VL/√N = 14, 90 Pendenza della retta: a = log N/log VL = 1, 13

Misure lessicometriche Prendiamo in considerazione i dati relativi alle singole parti in cui si

Misure lessicometriche Prendiamo in considerazione i dati relativi alle singole parti in cui si è diviso il testo CG ab ag ar av co nm pn pr ve TOTALE Lemmi 1 75 8 17 11 187 10 12 89 410 % 0, 244 18, 293 1, 951 4, 146 2, 683 45, 610 2, 439 2, 927 21, 707 100, 000 Forme 1 84 14 17 12 195 11 41 104 479 % Occorrenze 0, 209 1 17, 537 99 2, 923 62 3, 549 42 2, 505 56 40, 710 220 2, 296 43 8, 559 156 21, 712 117 100, 000 796 % 0, 126 12, 437 7, 789 5, 276 7, 035 27, 638 5, 402 19, 598 14, 698 100, 000 tab. 4 distribuzione di frequenze MEMBRO PRIMO – TAGLIO TERZO. Totale delle occorrenze: 796; Totale delle parole grafiche: 479; Totale dei lemmi: 410; Le parole contenuto costituiscono il 51, 57% del totale delle occorrenze Ricchezza lessicale: Rapporto tra lemmi e occorrenze: VL/N = 0, 45; Frequenza media dei lemmi: N/VL = 2, 2493 Indice di Guiraud: R = VL/√N = 14, 90 Pendenza della retta: a = log N/log VL = 1, 13

Misure lessicometriche Prendiamo in considerazione i dati relativi alle singole parti in cui si

Misure lessicometriche Prendiamo in considerazione i dati relativi alle singole parti in cui si è diviso il testo CG Lemm % Forme % Occorrenze % i ab ag ar av co es nm pn pr ve TOTALE 1 0, 290 61 17, 681 8 2, 319 11 3, 188 6 1, 739 1 0, 290 149 43, 188 11 3, 188 14 4, 058 83 24, 058 345 100, 000 1 68 13 11 7 1 152 13 36 95 397 0, 252 17, 128 3, 275 2, 771 1, 763 0, 252 38, 287 3, 275 9, 068 23, 929 100, 000 1 79 55 30 43 1 167 42 112 109 639 0, 156 12, 363 8, 607 4, 695 6, 729 0, 156 26, 135 6, 573 17, 527 17, 058 100, 000 tab. 5 distribuzione di frequenze MEMBRO TERZO – TAGLIO DODICESIMO. Totale delle occorrenze: 639; Totale delle parole grafiche: 397; Totale dei lemmi: 345; Le parole contenuto costituiscono il 51, 96% del totale delle occorrenze Ricchezza lessicale: Rapporto tra lemmi e occorrenze: VL/N = 0, 54; 94 Frequenza media dei lemmi: N/VL = 1, 85 Indice di Guiraud: R=VL/√N = 16, 22 Pendenza della retta: a = log N/log VL = 1, 11

Misure lessicometriche I 729 hapax presenti nel testo sono così distribuiti: 286 nella prima

Misure lessicometriche I 729 hapax presenti nel testo sono così distribuiti: 286 nella prima parte; 247 nella seconda; 196 nella terza. Com’era da attendersi, le categorie grammaticali che contribuiscono alla dispersione lessicale sono i nomi, i verbi e gli aggettivi; nella tabella 6 sono riportati i relativi rapporti tra lemmi e occorrenze per l’intero testo e per le sue tre parti. Par. III Totale Aggettivi 0, 68 0, 76 0, 77 0, 61 Nomi 0, 69 0, 85 0, 89 0, 67 Verbi 0, 69 0, 76 0, 60 tab. 6 rapporto lemmi/occorrenze 95

Parole-tema Saranno prese in considerazione solo alcune delle parole-tema, ossia quelle più frequenti nel

Parole-tema Saranno prese in considerazione solo alcune delle parole-tema, ossia quelle più frequenti nel testo. Riportiamo, di seguito, le parole contenuto con almeno 3 occorrenze, con la relativa distribuzione di frequenza nelle tre parti: tab. 7 parole-tema. Rango Lemma 11 20 21 22 22 23 24 25 25 26 28 28 28 29 29 29 30 30 essere (pred. ) ipocrita cristo ipocrisia avere (pred. ) colore fare apparenza dio moda santo figura pelle uomo dire ingannare restare vedere vivere pieno vario costume modo comparire potere abito occhio CG ve nm nm nm ag nm nm nm ve ve ve ag ag nm nm ve ve nm nm Freq FOP 1 34 14 13 12 12 11 10 9 9 8 6 6 6 6 6 5 5 5 4 4 FOP 2 16 6 7 5 7 7 1 2 5 8 5 6 4 3 3 2 2 3 1 1 4 3 2 1 3 3 0 FOP 3 11 4 1 5 2 2 3 6 4 0 1 2 2 0 3 2 3 3 1 1 2 3 1 1 3 Rango 7 4 5 2 3 2 6 1 0 0 1 1 1 4 1 1 2 1 0 1 30 30 30 31 31 31 31 31 31 Lemma persecuzione veste volto chiamare esprimere affascinato bello bianco diverso falso grande strano virtuoso vivo anima carne chiesa corpo diavolo diversità eva faccia finzione forma membra mondo mostro CG nm nm nm ve ve ag ag ag nm nm nm nm Freq FOP 1 FOP 2 4 4 4 3 4 2 4 3 3 1 3 2 3 3 3 0 3 1 3 2 3 0 3 3 3 2 3 1 3 3 FOP 3 0 1 1 2 0 0 0 3 1 1 2 0 1 0 0 1 2 0 0 0 1 1 0 0 0 1 0 0 2 0 3 0 1 1 0 0 0 96 0 0 1 0 0

Parole-tema Le due principali parole tema sono i lemmi ipocrita e ipocrisia, che rappresentano

Parole-tema Le due principali parole tema sono i lemmi ipocrita e ipocrisia, che rappresentano l’argomento dell’opera. Vediamone i contesti: 465 ipocrita, nm Frequenza = 14 AAATAI 36700 TC ANATOMIA DEGLI IPOCRITI AAATAI 36711 RI Dove osserva, il mellifluo abbate di Chiaravalle, che non si degna dar loro titolo di fratelli, perché oprano come Caino, che fu il primogenito de' presciti e degl'ipocriti; AAATAI 36823 RI Quindi degl'ipocriti disse il Redentore: AAATAI 36829 RI E solo vanno congetturando, i sacri commentatori, che si travestisse con abito penitente e con sembianza d'ipocrita, sperando così più facilmente ingannare la Sapienza increata. AAATAI 36910 RI nel pardo, che nella pelle raduna molti colori, la 97 persecuzione degl'ipocriti, che non cessano astutamente travagliare la Santa Chiesa:

AAATAI 36914 RI E così cogl'ipocriti collegata e di varie forme travestita, fu veduta

AAATAI 36914 RI E così cogl'ipocriti collegata e di varie forme travestita, fu veduta dal Profeta, che aveva os loquens magnalia, bocca piena di gran promesse, ed eloquenza ad insegnar vari dogmi. ACATAI 37007 RI Regna l'ipocrita nelle vesti, nelle mense, ne' complimenti, negli negozi, nell'età, ne' fatti, nelle parole, negl'altari. ACATAI 37008 RI E quando colla morte si lascia il tutto, l'ipocrita vive eziandio entro i sepolcri, agli quali dal Salvatore assomigliati i furono i farisei: ACATAI 37015 RI Volle Aimone che la voce "ipocrita" significasse deauratum, derivata dalla parola chrysos, che esprime l'oro nel greco idioma, tolta la metafora dagl'idoli babilonici descritti dal profeta Baruch: ACATAI 37022 RI Ogni etimologia però spiega l'ipocrita essere un istrione, un mimo, un rappresentator di comedia, che in tanto si trasfigura, in quanto trova pupille spettatrici e sguardi matematici, 98 altrimenti depone gl'abiti surrogati e mentiti del personaggio imitato:

LCATAI 37118 RI Tutti gli pensieri e l'industrie dell'ipocrita sono per ingannare. LCATAI 37121

LCATAI 37118 RI Tutti gli pensieri e l'industrie dell'ipocrita sono per ingannare. LCATAI 37121 RI Così de' scelerati ipocriti discorre Isidoro Pelusiota: LCATAI 37204 RI Compare l'ipocrita così spettabile alle pupille degl'uomini devoti ed alla pietra di Cristo tenacemente attaccati, che restano dall'apparenze delusi, e fra le loro branche laceri e morti: LCATAI 37207 RI L'ipocrita, con mente altiera, piega il collo alla terra, scuotendo recalcitrante e restio il soave giogo del fiorito Nazareno, per accumulare tesori, quasi gli andasse spiando colle pupille de' sardi fin da' sepolcri. 99

 464 ipocrisia, nm Frequenza = 12; F. Relativa = 0 AAATAI 36701 RI

464 ipocrisia, nm Frequenza = 12; F. Relativa = 0 AAATAI 36701 RI Prende l'ipocrisia diverse figure, che tutte mirano concordi ad impugnare la bella Sposa di Cristo. AAATAI 36709 RI Ma questa pittura a me pare un emblema, il più vivo, col quale si possa rappresentare l'ipocrisia, che veste mille divise e varia mille costumi, tanto tra loro opposti, quanto concordi ad impugnare l'unica verità della fede, e sfreggiare il volto glorioso alla sposa del Nazareno, dico la Chiesa, la quale angosciosamente si lagna: AAATAI 36804 RI Quelle mode che introdusse il lupo ne' vestimenti, con discapito de' patrimoni, essercita con maggior detrimento negl'abiti de' costumi l'ipocrisia. AAATAI 36915 RI Non prende tanti colori il camaleonte su la diafana pelle, o il polpo nelle sue molli bianche, quanti l'ipocrisia, che solamente del colore bianco è nemica, e lo stima veste di pazzi; 100

 AAATAI 36918 RI Restringe l'ipocrisia le varietà colorite de' tulipani , che fra

AAATAI 36918 RI Restringe l'ipocrisia le varietà colorite de' tulipani , che fra gli fiori sono tutti vaghezza; ACATAI 36921 RI Pieno è tutto il mondo di finzioni e di ipocrisie. ACATAI 37010 RI Ognuno resta appagato dall'apparenze, perché a tutti aggrada l'ipocrisia: ACATAI 37020 RI Tomaso, seguendo l'etimologia d'Isidoro, disse l'"ipocrisia" derivare ab ypo, cioè falso, e da crisis, cioè giudizio, quasi che fusse un falso giudizio d'occhi ingannati; ACATAI 37029 RI Non si scoprono giornalmente novità d'ipocrisie? ACATAI 37115 RI ma operar bene, ed in maniera alcuna, né diretta né indiretta, né mediata né immediata, farlo per Dio, è un far opere virtuose prive di carità e tinte d'ipocrisia. LCATAI 37124 RI Chi non fuggirebbe inorridito come se incontrasse serpenti, al sentire il nome di eretico, se non l'ingannasse l'ipocrisia? LCATAI 37203 RI ma sotto spoglie sì belle vive un spirito così 101 feroce che ingannando tutti i sassatili, li divora, celando sotto l'ipocrisia del manto la sua perfidia.

Se estraiamo le parole che accompagnano i due lemmi, otteniamo la caratterizzazione che l’autore

Se estraiamo le parole che accompagnano i due lemmi, otteniamo la caratterizzazione che l’autore conferisce al concetto di ipocrisia: IPOCRITA Caino, presciti, travestisse, abito penitente, sembianza, ingannare, pelle, colori, persecuzione, astutamente, travagliare, varie, forme, travestita, vesti, mense, complimenti, negozi, età, fatti, parole, altari, sepolcri, farisei, istrione, mimo, rappresentator di comedia, trasfigura, pupille, sguardi, abiti, surrogati, mentiti, imitato, ingannare, scelerati, compare, spettabile, pupille, apparenza, accumulare tesori, pupille IPOCRISIA diverse, figure, impugnare, pittura, emblema, veste, divise, varia, costumi, opposti, impugnare, sfreggiare, volto, angosciosamente, si lagna, mode, lupo, vestimenti, abiti costumi, colori, camaleonte, pelle, nemica, restringe, varietà colorite, finzioni, apparenza, falso 102 giudizio, occhi ingannati, inorridito, serpenti, ingannasse, spoglie, feroce, ingannando, celando, perfidia

Individuiamo tre direzioni di analisi dell’ipocrisia: come si presenta (travestisse, abito penitente, sembianza, pelle,

Individuiamo tre direzioni di analisi dell’ipocrisia: come si presenta (travestisse, abito penitente, sembianza, pelle, colori, varie forme, travestita, diverse figure, pittura, emblema, veste mille divise, varia mille costumi, mode); come esercita una sorta di fascinazione sul debole animo umano (vesti, mense, complimenti, negozi, età, parole, altari, istrione, mimo, finzioni, appagato, apparenze, occhi ingannati); quali sono i suoi fini (pensieri, industrie, ingannare, accumulare tesori, ingannando, divora, celando… la sua perfidia). 103

Dalla tab. 7, a causa della concentrazione delle frequenze, vediamo che sono specifiche del

Dalla tab. 7, a causa della concentrazione delle frequenze, vediamo che sono specifiche del primo taglio parole come: colore (7/11), moda (8/8), figura (6/6), pelle (4/6), vario (4/5), costume (3/5), abito (3/4), veste (3/4), volto (3/4), bianco (3/3), diversità (3/3), forma (3/3), mostro (3/3), serpe (3/3), travestire (3/3). Lemmi che esprimono il modo di presentarsi dell’ipocrisia nella contraddittorietà tra il suo essere serpe e mostro ed il suo apparire. Tra parentesi sono riportate la frequenza parziale, al numeratore, e la frequenza totale, al denominatore. 104

Il secondo dei tagli analizzati ospita le parole tema: apparenza (6/9), comparire (3/5), occhio

Il secondo dei tagli analizzati ospita le parole tema: apparenza (6/9), comparire (3/5), occhio (3/4), affascinato (2/3), falso (3/3), virtuoso (2/3), finzione (2/3), parola (2/3) Esse mostrano attinenza con la fascinazione operata attraverso lo sguardo e la parola. Nell’ultimo taglio le parole tema sono: fare (6/10), ingannare (4/6), pupilla (2/3), celare (2/3). Gli ultimi due lemmi mostrano un diretto legame col verbo ingannare, mentre il verbo supporto fare mostra quel legame nei contesti di occorrenza: far la ronda fra le galline, fa l'osservante, fa il bacchettone, far raccolta di doppie, fa del bene per poter fare più francamente del 105 male.

Consideriamo il contesto di occorrenza del lemma essere (pred. ), tratto dal secondo taglio:

Consideriamo il contesto di occorrenza del lemma essere (pred. ), tratto dal secondo taglio: ACATAI 37006 RI Insomma, ognuno nel secolo vuol comparire quel che non è, ingegnandosi scostarsi quanto più può da Dio, tutto simplicità, ed accostarsi al Diavolo, tutto finzioni. In esso troviamo espressa in maniera chiara la contrapposizione tra essere e comparire, termini che formano un asse semantico, lungo il quale si oppongono come contrari, secondo lo schema elaborato da Greimas: A. J. Greimas, Interazioni delle costrizioni semiotiche, in P. Fabbri G. Marrone (a cura di), Semiotica in nuce, 2 voll. , Meltemi, 106 Bologna, 2000, vol. I, pp. 195 207.

Le doppie frecce tratteggiate orizzontali indicano relazioni tra contrari; le doppie frecce continue, disposte

Le doppie frecce tratteggiate orizzontali indicano relazioni tra contrari; le doppie frecce continue, disposte sulle diagonali, indicano relazioni tra contraddittori, le linee tratteggiate verticali indicano relazioni di implicazione. 107

Lo schema relativo alla modalità veridittiva, in particolare, è adeguato alla rappresentazione concettuale dell’ipocrisia,

Lo schema relativo alla modalità veridittiva, in particolare, è adeguato alla rappresentazione concettuale dell’ipocrisia, secondo l’analisi che ne offre il padre Arcudi: Nello Schema Narrativo Canonico, per essere del fare si intende lo statuto modale della competenza che sta a monte dell'atto e lo rende possibile; il far essere è la modalità trasformativa, che mo difica gli stati del mondo; l'essere dell'essere è la modalità veridittiva che stabilisce se ciò che sembra corrisponda o meno a ciò che effetti vamente è. Quadrato della veridizione: 108

L’ipocrita non si colloca sull’asse del Falso (non Apparire – non Essere), ma sulla

L’ipocrita non si colloca sull’asse del Falso (non Apparire – non Essere), ma sulla deissi della Menzogna (Apparire – non Essere); e ciò è sostenuto dall’Arcudi, con estrema chiarezza: Tomaso, seguendo l'etimologia d'Isidoro, disse l'"ipocrisia" derivare ab ypo, cioè falso, e da crisis, cioè giudizio, quasi che fusse un falso giudizio d'occhi ingannati; Ogni etimologia però spiega l’ipocrita essere un istrione, un mimo, un rappresentator di comedia, che in tanto si trasfigura, in quanto trova pupille spettatrici e sguardi matematici, altrimenti depone gl’abiti surrogati e mentiti del personaggio imitato Quadrato della veridizione: 109

Più volte l’Arcudi si è posto il problema del linguaggio, scegliendo uno stile che

Più volte l’Arcudi si è posto il problema del linguaggio, scegliendo uno stile che badi più alle cose che alle parole. Scrive Marti: Nell’Anatomia degl’ipocriti, considerato che non si può scrivere «a genio di tutti» , perché diversi sono gli umori, diverse le inclinazioni, diversi i cervelli, egli si propone di scrivere solo «a genio suo» , perché egli scrive «per insegnare la santità del vivere, non la beltà del parlare» . E tante sono, del resto, le regole della lingua che proprio non si sa quale osservare; e su una sillaba – egli rileva – si questiona infinitamente: Alessandro o Alesandro? Tomaso o Tommaso? «Si richiede ne’ cristiani santità di fatti, non amenità di favella (pp. 14 15). » L’essenziale è farsi capire e condurre al bene. 110

Le parole di Marti richiamano uno degli scopi fondamentali dell’arte retorica: animos impellere; e

Le parole di Marti richiamano uno degli scopi fondamentali dell’arte retorica: animos impellere; e diremo, con le parole di Cicerone: Sarà dunque eloquente – e lo cerco dietro le tracce di Antonio – colui che nel foro e nelle cause civili saprà parlare in modo da provare, da dilettare, da commuovere. Il provare è richiesto dalla necessità, il dilettare serve per allettare gli animi, il commuovere occorre per vincere; poiché il saper commuovere più d’ogni altra dote riesce efficace a vincere una causa. Ma quanti sono gli uffici dell’oratore, tanti sono i generi di stile: piano nel provare, temperato nel dilettare, veemente nel commuovere, e in questo riposa tutta la potenza dell’oratore. E. V. D’Arbela, (a cura di), M. Tullio Cicerone, L’Oratore, Istituto Editoriale Italiano, Milano, 1958, XXI, 69; p. 112. 111

E il padre Arcudi sa farsi capire con la semplicità delle parole e conduce

E il padre Arcudi sa farsi capire con la semplicità delle parole e conduce al bene con l’uso sapiente delle armi della retorica. D’altronde, abbiamo già visto che, sin dal titolo, l’uso metaforico del termine anatomia conferisce all’opera un’aura di rigore metodologico e di scientificità. Le figure retoriche, in questa prospettiva, concorrono a rafforzare il potere argomentativo del testo: Ma che dire delle figure di stile, quelle famose figure alle quali alcuni vogliono ridurre l’intera retorica? Una metafora, un’iperbole, un’antitesi sono oratorie in quanto contribuiscono a piacere o a commuovere, e tuttavia sono anche argomentative in quanto esprimono un argomento condensandolo, rendendolo più atto a creare stupore. O. Reboul, Introduzione alla retorica, Il Mulino, Bologna, 1996, 112 p. 23.

il taglio primo presenta i caratteri dell’esordio, evitando, perciò, di porre subito in primo

il taglio primo presenta i caratteri dell’esordio, evitando, perciò, di porre subito in primo piano l’autore, e l’intento è rafforzato dalla presenza di un primo cleuasmo dopo appena sei righi «io non saprei imaginarlo» e di un secondo subito dopo «Se mi fusse lecito indagare… direi» , al quale si somma una preterizione. In primo piano sono posti, invece, Parrasio e Plinio il Vecchio, allo scopo di costruire una analogia tra la rappresentazione pittorica di Atene (Conosciuta attraverso la descrizione di Plinio) e l’ipocrisia. Il motivo centrale dell’esordio è costituito dall’antitesi: • fiera insieme e benigna, umile e superba, clemente e spietata, pia ed empia, clemente ed oltraggiosa, intrepida e timida, pacifica e guerriera • che aveva gli vizi e le virtù tanto congiunti • col volto d’angelo d’una parte e di demonio dall’altra; con una mano chiusa e l’altra aperta; con un piede di leone e l’altro 113 di volpe; ricoperto davanti con pelle di pecora e dietro di lupo

Il taglio terzo del membro primo ha come motivo centrale la domanda retorica, figura

Il taglio terzo del membro primo ha come motivo centrale la domanda retorica, figura studiata sin dall’antichità per i suoi effetti sui destinatari. Nel testo considerato, l’effetto è amplificato dalla condensazione delle interrogative in due luoghi molto vicini fra loro producendo un ritmo incalzante, che sembra non dar tregua all’uditorio: E non sono gli nostri, questi novissimi tempi predetti dal santo Apostolo? Non si scoprono giornalmente novità d’ipocrisie? Non si prattica abbondanza accresciuta di truffatori, di furti, d’amanti di se medesimi? Non si vede ognuno pieno d’astuzie? Non vive tutto il mondo soddisfatto dell’apparenze? Non avrebbe certo ottenuto lo stesso effetto se avesse semplicemente affermato: «Giornalmente si scoprono novità d’ipocrisie» ; al quale 114 effetto deve aggiungersi l’amplificazione dovuta all’enumerazione presente nella terza domanda.

E poco più avanti riprende chiedendo «Qual Senatore o Padre Conscritto ha per fine

E poco più avanti riprende chiedendo «Qual Senatore o Padre Conscritto ha per fine l’utile del comune negli consegli? » fino alla interrogazione più dirompente «Chi amministra sacramenti, instruisce popoli, guida l’anime senza stipendio e senza lucro, per schietto amore di Dio? » ; e nuovamente con enumerazione «A chi sono ignoti gl’imbrogli de’ negozianti, le furberie degl’artisti, le malizie de’ contadini, le fraudolenze delle donne? » Potevano rendersi meglio gli effetti della generale fascinazione esercitata dalle apparenze dell’ipocrisia? (L’asindeto rende il ritmo più incalzante) 115

Il taglio dodicesimo del membro terzo ha come tema l’inganno e come motivo centrale

Il taglio dodicesimo del membro terzo ha come tema l’inganno e come motivo centrale la similitudine; così, il tema viene sviluppato attraverso una serie di paragoni: Per ingannare gl’incauti pesci, si getta da’ marinari l’amo nell’onde, ricoperto coll’esca appetitiva; altrimente, qual guizzante sarebbe così affamato, che corresse ad imboccarsi il ferro, e col ferro la morte? Così de’ scelerati ipocriti discorre Isidoro Pelusiota: che, sotto l’esca di mansuete parole e devozione superficiale, celano astuti l’amo della dottrina ed opinioni mortifere… Chi non fuggirebbe inorridito come se incontrasse serpenti al sentire il nome di eretico… 116

Il lepadro è il più vago animale di quanti vivono nell’acqua; … ma sotto

Il lepadro è il più vago animale di quanti vivono nell’acqua; … ma sotto spoglie sì belle vive un spirito così feroce che, ingannando tutti i sassatili, li divora, celando sotto l’ipocrisia del manto la sua perfidia. Compare l’ipocrita così spettabile alle pupille degl’uomini devoti ed alla pietra di Cristo tenacemente attaccati, che restano dall’apparenze delusi, e fra le loro branche laceri e morti… Non dorme ed è tutto sogni; e sognando travede, come Giacobbe, pianeti adoratori ai suoi piedi per conculcargli… […] e quando dorme si stende sopra lo strame, non già qual Cristo in Betlem, ma qual giumento in Betel… Come volpe di Esopo, finge il morto per allettare gli polli incauti… Qual Giuda, segue Cristo per empirsi la borsa e ‘l ventre 117 senza stento e fatiga.

Alle figure indicate come motivo centrale dei tre brani, altre se ne aggiungono ad

Alle figure indicate come motivo centrale dei tre brani, altre se ne aggiungono ad arricchire il potere emotivo e persuasivo del testo, a volte concentrando la propria azione sullo stesso soggetto; si determina, così, un cumulo che «riesce di solito a commuovere in sommo grado…» . (G. Guidorizzi (a cura di), Anonimo. Il Sublime, Mondatori, Milano, 2015, p. 91. ) Si vedano, ad esempio, l’anafora ad imboccarsi il ferro, e col ferro la morte e l’uso metaforico di esca e amo nella similitudine riportata sopra. 118