STATISTICA a a 2002 2003 METODO DEI MINIMI

  • Slides: 28
Download presentation
STATISTICA a. a. 2002 -2003 – METODO DEI MINIMI QUADRATI – REGRESSIONE – CORRELAZIONE

STATISTICA a. a. 2002 -2003 – METODO DEI MINIMI QUADRATI – REGRESSIONE – CORRELAZIONE

RELAZIONE FRA VARIABILI – Spesso si vuole trovare la relazione che lega due o

RELAZIONE FRA VARIABILI – Spesso si vuole trovare la relazione che lega due o più variabili (es. la pressione di un gas dipende da temperatura e volume) – Vogliamo esprimere questa relazione in forma matematica

INTERPOLAZIONE – Dobbiamo raccogliere dati che mostrino valori corrispondenti delle variabili – Riportiamo i

INTERPOLAZIONE – Dobbiamo raccogliere dati che mostrino valori corrispondenti delle variabili – Riportiamo i punti (Xi, Yi) delle due variabili su un sistema di coordinate – Vogliamo individuare una curva (relazione non lineare) o una retta interpolante

INTERPOLAZIONE – Il tipo più semplice è la retta Y = a 0 +

INTERPOLAZIONE – Il tipo più semplice è la retta Y = a 0 + a 1 X – Dati due punti qualsiasi (X 1 Y 1) e (X 2 Y 2) , vogliamo determinare a 0 e a 1.

INTERPOLAZIONE

INTERPOLAZIONE

INTERPOLAZIONE coefficiente angolare e’ Y per X=0 (ordinata all’origine).

INTERPOLAZIONE coefficiente angolare e’ Y per X=0 (ordinata all’origine).

METODO DEI MINIMI QUADRATI

METODO DEI MINIMI QUADRATI

METODO DEI MINIMI QUADRATI • Chiamiamo Dn la deviazione (o errore) fra il valore

METODO DEI MINIMI QUADRATI • Chiamiamo Dn la deviazione (o errore) fra il valore Yn e il corrispondente valore della curva (positiva o negativa) • Una misura della “bontà dell’interpolazione” è la somma D 12 + D 22 …. . + Dn 2

METODO DEI MINIMI QUADRATI • La curva avente la proprietà che D 12 +

METODO DEI MINIMI QUADRATI • La curva avente la proprietà che D 12 + D 22 …. . + Dn 2 è minima è detta migliore interpolante o retta/curva dei minimi quadrati.

METODO DEI MINIMI QUADRATI • La retta dei minimi quadrati può essere espressa nella

METODO DEI MINIMI QUADRATI • La retta dei minimi quadrati può essere espressa nella forma Y = a 0 + a 1 X dove a 0 e a 1 si trovano risolvendo il sistema SY = a 0 N+ a 1 SX SXY = a 0 S X+ a 1 SX 2 equazioni normali della retta dei minimi quadrati.

METODO DEI MINIMI QUADRATI • Si ottiene

METODO DEI MINIMI QUADRATI • Si ottiene

METODO DEI MINIMI QUADRATI • La prima delle due equazioni si ottiene dalla sommatoria

METODO DEI MINIMI QUADRATI • La prima delle due equazioni si ottiene dalla sommatoria di entrambi i membri di Y = a 0 + a 1 X , la seconda moltiplicando i membri per X e poi facendo la sommatoria. – Per derivare le equazioni si minimizzano le derivate della retta

METODO DEI MINIMI QUADRATI Y 1 = a 0 + a 1 X 1

METODO DEI MINIMI QUADRATI Y 1 = a 0 + a 1 X 1 Y 2= a 0 + a 1 X 2 …. S=(a 0 + a 1 X 2 -Y 1)2 +(a 0 + a 1 X 2 – Y 2)2 +…. + (a 0 + a 1 Xn - Yn)2

LA REGRESSIONE • Vogliamo stimare il valore di una variabile Y corrispondente a un

LA REGRESSIONE • Vogliamo stimare il valore di una variabile Y corrispondente a un dato valore di una variabile X. • Si può ottenere questo stimando il valore di Y per mezzo di una curva dei minimi quadrati che interpoli i dati campionari. • Questa è detta CURVA DI REGRESSIONE di X su Y. • Se X è il tempo (variabile indipendente) i dati indicano i valori di Y in diversi tempi e vengono detti SERIE TEMPORALE. • La retta/curva di regressione è detta retta/curva del trend e viene usata per scopi di previsione.

CORRELAZIONE E REGRESSIONE • La correlazione indica il grado di relazione fra le variabili.

CORRELAZIONE E REGRESSIONE • La correlazione indica il grado di relazione fra le variabili. • Cercheremo di determinare quanto bene un’equazione spiega tale relazione • Se tutti i valori delle variabili soddisfano esattamente un’equazione diciamo che le variabili sono perfettamente correlate (esempio: raggio e circonferenza; altezza e peso saranno in parte correlate).

CORRELAZIONE E REGRESSIONE • Date due variabili X e Y costruiamo un diagramma di

CORRELAZIONE E REGRESSIONE • Date due variabili X e Y costruiamo un diagramma di dispersione con i loro valori. • Se tutti i punti giacciono più o meno su una retta, la correlazione è detta lineare e la relazione fra le variabili sarà retta da un’equazione lineare.

CORRELAZIONE E REGRESSIONE • Se Y cresce al crescere di X la correlazione è

CORRELAZIONE E REGRESSIONE • Se Y cresce al crescere di X la correlazione è positiva o diretta:

CORRELAZIONE E REGRESSIONE • Se Y decresce al crescere di X, la correlazione è

CORRELAZIONE E REGRESSIONE • Se Y decresce al crescere di X, la correlazione è detta negativa o inversa: • Se i punti stanno su una curva, la correlazione è non lineare.

CORRELAZIONE E REGRESSIONE • Se non c’è relazione fra le variabili diciamo che sono

CORRELAZIONE E REGRESSIONE • Se non c’è relazione fra le variabili diciamo che sono incorrelate:

CORRELAZIONE E REGRESSIONE (1) Y = a 0 + a 1 X Può essere

CORRELAZIONE E REGRESSIONE (1) Y = a 0 + a 1 X Può essere riscritta come dove

CORRELAZIONE E REGRESSIONE – Chiamiamo Ystim i valori di Y per dati valori di

CORRELAZIONE E REGRESSIONE – Chiamiamo Ystim i valori di Y per dati valori di X secondo una stima compiuta per mezzo della (1). – Una misura della dispersione intorno alla retta di regressione di Y su X è oppure errore standard della stima

CORRELAZIONE E REGRESSIONE – Il denominatore può anche essere posto a N-2. – L’errore

CORRELAZIONE E REGRESSIONE – Il denominatore può anche essere posto a N-2. – L’errore standard della stima ha proprietà analoghe a quelle dello scarto quadratico medio.

COEFFICIENTE DI CORRELAZIONE – Chiamiamo devianza totale di Y la somma dei quadrati degli

COEFFICIENTE DI CORRELAZIONE – Chiamiamo devianza totale di Y la somma dei quadrati degli scarti dei valori di Y dalla media Y¯. – Si può anche scrivere devianza totale devianza residua devianza spiegata

COEFFICIENTE DI DETERMINAZIONE – Se la devianza spiegata è zero (ossia la devianza totale

COEFFICIENTE DI DETERMINAZIONE – Se la devianza spiegata è zero (ossia la devianza totale equivale alla residua), r 2=0 – Se la devianza residua è uguale a zero, cioè devianza totale = devianza spiegata , r 2=1 – Dunque r 2 è sempre positiva e varia fra 0 e 1.

COEFFICIENTE DI CORRELAZIONE – Allora definiamo r coefficiente di correlazione

COEFFICIENTE DI CORRELAZIONE – Allora definiamo r coefficiente di correlazione

COEFFICIENTE DI CORRELAZIONE r varia fra +1 e – 1 (+ o – a

COEFFICIENTE DI CORRELAZIONE r varia fra +1 e – 1 (+ o – a seconda di correlazione positiva o negativa). – Poiché allora

COEFFICIENTE DI CORRELAZIONE – Si dimostra che dove

COEFFICIENTE DI CORRELAZIONE – Si dimostra che dove

COEFFICIENTE DI CORRELAZIONE che dà automaticamente il segno di r. – Si può riscriverla

COEFFICIENTE DI CORRELAZIONE che dà automaticamente il segno di r. – Si può riscriverla come