Tecniche matematiche Chemiometria Classificazione l Tecniche non supervisionate

  • Slides: 7
Download presentation
Tecniche matematiche Chemiometria Classificazione l Tecniche non supervisionate l Tecniche supervisionate l Regressione l

Tecniche matematiche Chemiometria Classificazione l Tecniche non supervisionate l Tecniche supervisionate l Regressione l Disegno Sperimentale l

Visualizzare i dati Osservando i risultati delle analisi in forma tabulare, quasi sempre è

Visualizzare i dati Osservando i risultati delle analisi in forma tabulare, quasi sempre è piuttosto difficile mettere in evidenza eventuali similitudini o sequenze di composizione tra i reperti. Per questo è opportuno ricorrere a semplici elaborazioni grafiche possono mostrare in modo immediato come i campioni si dispongano in uno spazio delimitato da due o tre variabili. Il metodo grafico più semplice consiste nel rappresentare i dati con diagrammi o plot bivariati: si tratta di grafici cartesiani bidimensionali, nei quali gli assi sono costituiti da coppie di variabili e ciascun campione è rappresentato da un punto le cui coordinate sono i valori assunti dalle due variabili. Ad esempio, nel plot bivariato della figura a lato sono diagrammati la percentuale di Fe. O contro il rapporto Al 2 O 3/Si. O 2 misurati in campioni di ceramica: è facile evidenziare i gruppi di campioni con caratteristiche simili. Risultati più sofisticati si hanno con plot trivariati, nei quali sono diagrammate tre variabili Nei casi più semplici, trovando la combinazione giusta di variabili il raggruppamento dei campioni è già evidente in due o tre dimensioni. In questo caso, se n è il numero di variabili misurate, il numero di plot bivariati disponibili è pari a Sn(n-1)

Analisi multivariata Se non è possibile individuare raggruppamenti in maniera semplice, è necessario ricorrere

Analisi multivariata Se non è possibile individuare raggruppamenti in maniera semplice, è necessario ricorrere all'analisi multivariata, cioè prendendo contemporaneamente in considerazione un numero elevato di variabili, situazione che si ha, ad esempio, nel caso di un'analisi ICP-MS dove gli elementi determinabili sono molti. Naturalmente la rappresentazione grafica, immediata per due variabili e più complessa ma ancora possibile per tre variabili, diventa del tutto impossibile per un numero di variabili più elevato. In questi casi si ricorre a tecniche di display che permettono di ridurre la dimensionalità dello spazio delle variabili senza perdere significativamente informazioni sui dati, cioè mantenendo il più possibile la struttura dei dati nello spazio definito da tutte le variabili. Mentre l'analisi bivariata può essere effettuata con un qualunque software in grado di diagrammare due o tre variabili, per l'analisi multivariata in genere si utilizzano specifici software di calcolo. L'elaborazione dei dati mediante analisi multivariata viene effettuata con le tecniche della chemometria, una disciplina matematica molto utilizzata nel campo della chimica analitica. Tra queste, le più utili sono le tecniche di classificazione o pattern recognition (riconoscimento di gruppi)

Tecniche di classificazione Pattern recognition metodi unsupervised l analisi delle componenti principali l analisi

Tecniche di classificazione Pattern recognition metodi unsupervised l analisi delle componenti principali l analisi a cluster l metodi supervised l analisi discriminante l

Analisi a cluster (CA)

Analisi a cluster (CA)

Analisi delle componenti principali (PCA) Plot bivariato in cui è rappresentato il 2/n %

Analisi delle componenti principali (PCA) Plot bivariato in cui è rappresentato il 2/n % dell’informazione totale Plot degli scores + plot dei loadings: è rappresentata una percentuale molto alta dell’informazione totale

 Elefante di foresta Elefante di savana Mammuth Ippopotamo Capodoglio Plot PC 1 vs.

Elefante di foresta Elefante di savana Mammuth Ippopotamo Capodoglio Plot PC 1 vs. PC 2 degli scores