I dati e le previsioni ovvero la Matematica
- Slides: 20
I dati e le previsioni ovvero la Matematica dell’incertezza
J L. BORGES: La Bibioteca di Babele “Quando si proclamò che la biblioteca comprendeva tutti i libri, la prima impressione fu di straordinaria felicità. Tutti gli uomini si sentirono padroni di un tesoro intatto e segreto. Non v’era problema personale o mondiale la cui eloquente soluzione non esistesse: in qualche scaffale. ”
“Quei ricercatori dimenticavano che la possibilità che un uomo trovi il suo, o qualche perfida variante del suo, è sostanzialmente zero… alla speranza smodata, com’è naturale, successe un’eccessiva depressione. La certezza che un qualche scaffale…. . celava libri preziosi e che questi libri preziosi erano inaccessibili, parve quasi intollerabile”
L’abbondanza di informazioni può rovesciarsi nel suo contrario: non basta avere accesso teorico ad una informazione, occorre anche tale informazione sia effettivamente fruibile. Statistica Raccoglie e restituisce in forma organizzata grandi quantità di informazioni Rende utilizzabili grandi quantità di informazioni, teoricamente disponibili, ma di fatto difficilmente gestibili, relative agli oggetti della sua indagine
la statistica ha esigenze di tipo: Descrittivo: corrisponde al bisogno di ogni comunità di raccogliere dati sulle sue caratteristiche e le sue attività Predittivo: fornendo una fotografia del passato e del presente, aiuta a prevedere i comportamenti futuri e a compiere scelte in mancanza di certezze assolute. Incertezza: si azzardano calcoli e proiezioni a partire da dati a volte essi stessi non esenti da dubbio e comunque incompleti
Il 30% degli italiani preferisce la pastasciutta, il 20% la carne; il 15% il pesce; il 10% la frutta; il 25% il dolce credulità acritica scetticismo
Come si svolge il lavoro statistico? Di quali fasi si compone? Con quali problemi si scontra?
Lavoro statistico • Definizione dei caratteri e della popolazione oggetto dell’indagine; • scelta degli strumenti di rilevazione; • selezione del campione rappresentativo • raccolta dati; • loro elaborazione e rappresentazione.
In ogni fase occorre fare delle scelte Conseguenze rispetto ai risultati Es. Interviste: • formulazione delle domande • modalità di classificazione di risposte anomale • scelta del campione rappresentativo.
Media aritmetica • La media aritmetica di n numeri si calcola sommando gli n numeri e dividendo il risultato per n; • è un valore di sintesi che riassume un insieme di dati; • ha un preciso ambito di significatività; • è una media ponderata cioè i numeri dell’insieme da sintetizzare pesano in misura frequenza con cui ricorrono. proporzionale alla
Altri valori di sintesi • Moda o valore normale • è il numero che è presente con maggior frequenza nell’insieme • Mediana • corrisponde al valore centrale della sequenza ottenuta disponendo in ordine crescente i numeri dell’insieme
Ogni valore di sintesi cancella il modo con cui viene a determinarsi Uno stesso valore può corrispondere a dati articolati in modo diverso. È importante misurare il grado di rappresentatività di un valore di sintesi prescelto. Scostamento medio scarto quadratico medio
Concetti importanti Distribuzione normale: • si trova in tutti i fenomeni casuali Correlazione (positiva o negativa) • due variabili sono distribuite in modo che al crescere di una cresce anche l’altra • non conduce necessariamente ad una relazione di causa effetto ( es. Statura- distanza da casa) Interpolazione si rilevano dati che misurano una relazione tra grandezze:
Interpolazione: ricerca della funzione analitica che approssima i dati nel modo migliore • Metodo dei minimi quadrati: metodo che rende minima la distanza dei punti della linea che rappresenta il fenomeno Retta interpolante Trend= coefficiente angolare dalla retta
La funzione lineare interpolatrice potrebbe non essere • ma essere di 2° grado, un’iperbole, una curva esponenziale • è il fisico, lo statista, l’economista che seleziona la formula che sembra meglio descrivere il fenomeno.
Probabilità? • L’incertezza è condizione normale quando occorre prendere decisioni • siamo guidati quasi sempre da valutazioni di tipo probabilistico • è un tentativo di matematizzare i processi inconsapevoli o intuitivi con cui attribuiamo una determinata probabilità ad un evento • nasce su sollecitazione di giocatori d’azzardo nel 1600
• Probabilità che lanciando un dado venga il numero 2 • …estraendo una carta da un mazzo di 40 carte questa sia un re • se abbiamo lanciato 10 volte una moneta ottenendo testa, all’undicesimo lancio è più conveniente puntare su croce? • E’ più facile indovinare l’ordine di arrivo in una gara a cui partecipano 4 atleti o indovinare la seconda lettera della trecentoquarantesima parola del terzo capitolo di un libro di lettura?
Definizione classica • eventi equiprobabili ( lancio di due monete) TT TC CT CC • Probabilità che domani piova • Probabilità che il primo • dell’anno a Torino nevichi Statistica Definizione frequentista
Si basa su una stima A POSTERIORI DIFETTO: la valutazione della probabilità dipende dal numero di prove che si effettuano Legge dei grandi numeri
1/9 8/9 2/8 Probabilità= 6/8
- Paolo atzeni basi di dati
- Sifead report
- Sistema di acquisizione e distribuzione dati
- Le parole del tempo classe prima
- Pretexting significato
- Gestione informatica dei dati aziendali
- Rappresentazione dei dati
- Dati due vettori a e b di modulo fissato
- Modellazione dei dati
- Esercizi basi di dati modello e-r
- Factorul comun
- Introduzione alle basi di dati
- Analisi micro-dati
- Basi di dati atzeni
- Analisi multidimensionale dei dati
- Datavvocato
- Sistema di acquisizione ed elaborazione dati
- Analisi dati call center
- Circonferenza per tre punti
- I pronomi diretti
- Raccolta dati di prima parte