Variables qualitatives Taules de freqncies freq absolutes percentatges
Variables qualitatives ØTaules de freqüències: freq. absolutes, percentatges i freq. relatives ØGràfiques: barres, sectors, de Pareto, i altres ØDescriptius: § la moda, per a totes les qualitatives § la mediana i els percentils, per a les qualitatives ordinals ØUn exemple de variable nominal: estudi complert ØUn exemple de variable ordinal: estudi complert 1
Taules de freqüències per a variables qualitatives • Consisteixen en un resum dels valors o modalitats diferents que pren la variable qualitativa, amb el recompte del nombre d’aparicions per a cada valor. Exemple: Variable religió majoritària. Casos: països. Pag. 18 Sense valors perduts Valors o modalitats (27/109) x 100 (27/108) x 100 2
Exemple: Variable regió econòmica. Casos: països. Pag. 19 Sense ponderar: tots els països el mateix pes Ponderant segons la població: cada país té un pes proporcional a la seva població 3
Taula de freqüències tipus Pag. 20 4
Taules de freq. per a variables qualitatives: resum k valors o modalitats d’una variable qualitativa, en un total de n casos: k ≤ n Les freq. absolutes o recomptes indiquen, per a cada valor, xi , el nombre de vegades que es repeteix: ni Les freq. relatives o tants per ú indiquen, per a cada valor, xi , la • S’utilitzen per resumir la informació dels • • f proporció de vegades que es repeteix: i • Els percentatges o tants per cent indiquen, per a cada valor, • de vegades que es repeteix: xi , el % pi = 5
Gràfiques per a variables qualitatives: barres • Per a cada valor o modalitat, s’aixeca una barra d’altura igual (o proporcional) a la seva freqüència o percentatge. Pag. 26 Exemple: Variable religió majoritària. Casos: països. Pag. 27 6
Exemple: Variable religió majoritària: tipologies. Casos: països. Pag. 27 Aparentment, les religions cristianes semblen molt més majoritàries, del que en realitat són L’eix no comença al 0 7
Gràfiques per a variables qualitatives: sectors • Per a cada valor o modalitat, es considera un sector d’angle proporcional a la seva freqüència o percentatge. Pag. 27 Exemple: Variable religió majoritària: tipologies. Pag. 28 Els països no estan ponderats: per a cada modalitat, es veu el % de països Els països estan ponderats per població: per a cada modalitat, es veu el % de població 8
Gràfiques per a variables qualitatives: barres de Pareto • Diagrama de barres per als valors o modalitats ordenats de més a menys freqüent. Doble eix vertical: a l’eix principal de l’esquerra freqüències (o %), corresponents a les barres; a l’eix secundari de la dreta, % acumulats, corresponents a la línia poligonal creixent. Pag. 29 Exemple: Variable religió majoritària: països sense ponderar Entre catòlica, musulmana i protestant hi ha gairebé el 80% dels països 9
Gràfiques per a variables qualitatives: pictogrames 10
Descriptius per a variables qualitatives: la moda • La moda (Mo) és el valor o modalitat més freqüent de la variable. Li corresponen màxima freqüència absoluta, relativa i percentatge. Pag. 42 Exemple: La moda de la taula 1. 1, és la religió catòlica, atès que té el % més elevat de països: 38% • Equivalentment, li corresponen la barra més alta i el sector d’angle més gran. Exemples: La moda de les modalitats de religió dels països sense ponderar, és la modalitat de religions cristianes, atès que té el sector més gran: 60. 19% de països. La moda de les modalitats de religió dels països ponderats per població, és la modalitat d’altres religions, atès que té el sector més gran: 48. 47% de població. 11
Remarques i propietats importants de la moda • • És fàcil de calcular. És una característica de posició central. La moda és més significativa, si té una freqüència sensiblement superior a les dels altres valors. • Pot no ser única, si la màxima freqüència correspon a dos o més valors. Es parla de distribucions unimodals, bimodals, etc. Exemple: La distribució de països (sense ponderar per població) segons regions econò-miques, té dues modes: OCDE i Amèrica Llatina, amb un 19. 3% de països. 12
Per contra: La distribució de regions econòmiques, per països ponderats per població, és unimodal: Moda=Àsia/Pacífic, amb un 58. 5% de la població. 13
Descriptius per a variables qualitatives ordinals: la moda, mediana, els quartils i els percentils • La mediana (Md) és el valor que ocupa la posició central quan tenim totes les observacions ordenades: la meitat d’observacions (50%) són menors o iguals que la mediana i l’altra meitat són majors o iguals. Pags. 39, . . Exemples, amb poques dades: n senar La mediana de 3, 27, 30, 51 i 100 és 30, és la que està al mig: Md = 30 La mediana de 3, 3, 3, 5 i 7 és 3, és la que està al mig: Md = 3 Exemples, amb poques dades: n parell La mediana de 3, 27, 51 i 100 és la mitjana de les dues que estan al mig: Md = (27+51)/2 = 39 La mediana de 3, 3, 3 i 5 és 3, és la mitjana de les dues que estan al mig: Md = (3+3)/2 = 3 14
Càlcul de la mediana per a les dades resumides en una taula de freqüències • Els valors han d’estar ordenats • Localitzarem el primer percentatge acumulat que supera el 50%, el valor corresponent és la mediana. • Cas que hi hagi un percentatge acumulat igual al 50%, farem la mitjana entre el valor corresponent i el següent (només pot ocórrer si n és parell) Exemple, a partir d’una taula de freqüencies: n senar Md = 4 15
Exemples, a partir d’una taula de freqüencies: n parell a) Cap percentatge acumulat coincideix amb el 50% Md = 5 b) Un percentatge acumulat coincideix amb el 50% Md =(5+7)/2 = 6 16
Distribució d’una variable de tipus numèric, mesurada en escala ordinal: l’últim interval és obert! 17
Els percentils: quartils i decils (casos particulars): Pgs. 44, . . . • El percentil o centil d’ordre r(Cr) és el valor tal que un (r x 100 %) de les observacions són menors o iguals que Cr i el (100 -r) x 100 % són majors o iguals. Es localitzen a partir dels percentatges acumulats. Per exemple, C 60 és tal que el 60% d’observacions són menors o iguals i el 40% són majors o iguals, etc. Es localitza a partir del primer percentatge acumulat que supera el 60%, el valor corresponent és el centil 60. [25000, 30000) A la taula pag. anterior, veiem que: C 60 correspon a l’interval 25000$ a 29999$, que podem representar pel seu punt mitjà: 27500$ C 90 correspon a l’interval 60000$ a 74999$, que podem representar pel seu punt mitjà: 67500$ 18
La mediana és el centil 50: parteix la distribució en dues parts, cadascuna amb un 50% d’observacions 19
Hi ha tres quartils Q 1= C 25 , Q 2= C 50 = Md , Q 3= C 75 que parteixen la distribució en quatre parts, cadascuna amb un 25% d’observacions (una quarta part de l’àrea) 20
- Slides: 20