Initiation lutilisation du logiciel STATISTICA Joseph LARMARANGE http

  • Slides: 53
Download presentation
Initiation à l’utilisation du logiciel STATISTICA Joseph LARMARANGE http: //joseph. larmarange. net Initiation à

Initiation à l’utilisation du logiciel STATISTICA Joseph LARMARANGE http: //joseph. larmarange. net Initiation à STATISTICA Intervention du 9 janvier 2004 2ème année en Ressources Humaines GEA (Gestion des Entreprises et des Administrations) IUT d’Orléans Joseph LARMARANGE

Plan z. Saisie des données z. Statistiques descriptives z. Corrélation linéaire z. Test du

Plan z. Saisie des données z. Statistiques descriptives z. Corrélation linéaire z. Test du Khi 2 Initiation à STATISTICA Joseph LARMARANGE 2

Principes d’un fichier STATISTICA z. Les données sont saisies sous la forme d’un tableau.

Principes d’un fichier STATISTICA z. Les données sont saisies sous la forme d’un tableau. z. En colonnes, des variables (soit le nombre d’information que nous avons pour chaque individu). z. En lignes, des individus (cela peut-être des personnes physiques, des ménages, des institutions, etc. ). Initiation à STATISTICA Joseph LARMARANGE 3

Exemple de données à saisir z. Il s’agit du montant des ventes d’une équipe

Exemple de données à saisir z. Il s’agit du montant des ventes d’une équipe de 15 vendeurs. Pour chacun d’eux, on dispose du sexe, de l’âge et du chiffre d’affaire réalisé. Initiation à STATISTICA Joseph LARMARANGE 4

Création d’un nouveau fichier (Fichier > Nouveau) z Indiquer le nombre de variables (3)

Création d’un nouveau fichier (Fichier > Nouveau) z Indiquer le nombre de variables (3) z Et le nombre d’observations (ici 15) z Cliquez sur OK. Initiation à STATISTICA Joseph LARMARANGE 5

Création d’un nouveau fichier z Apparition du fichier de données. z On va maintenant

Création d’un nouveau fichier z Apparition du fichier de données. z On va maintenant spécifier le nom des variables Initiation à STATISTICA Joseph LARMARANGE 6

Nommer les variables z On donnera un nom court mais explicite. Mieux vaut éviter

Nommer les variables z On donnera un nom court mais explicite. Mieux vaut éviter les caractères particuliers. z Il est aussi possible de faire une description détaillée des variables. Initiation à STATISTICA Joseph LARMARANGE 7

Nommer les variables z On donnera un nom court mais explicite. Mieux vaut éviter

Nommer les variables z On donnera un nom court mais explicite. Mieux vaut éviter les caractères particuliers. z Il est aussi possible de faire une description détaillée des variables. Initiation à STATISTICA Joseph LARMARANGE 8

Les variables qualitatives z On privilégiera de saisir un code chiffre plutôt qu’un texte

Les variables qualitatives z On privilégiera de saisir un code chiffre plutôt qu’un texte pour éviter les erreurs de saisie. z Cependant, il est toujours possible de donner une étiquette (valeurstexte) aux différentes modalités. ATTENTION : Avant de cliquer, sur Valeurs-Texte, il faut d ’abord sélectionner la variable concernée. Initiation à STATISTICA Joseph LARMARANGE 9

Modifier les Valeurs-Texte z Donner un texte court pour la Valeur-Texte. z Préciser la

Modifier les Valeurs-Texte z Donner un texte court pour la Valeur-Texte. z Préciser la correspondance numérique. z Une étiquette pour préciser la modalité est disponible. z << & >> servent à passer d ’une variable à l’autre. Initiation à STATISTICA Le nom de la variable concernée apparaît en haut à droite Joseph LARMARANGE 10

Saisie des données Exemple 1 : Initiation à STATISTICA Joseph LARMARANGE 11

Saisie des données Exemple 1 : Initiation à STATISTICA Joseph LARMARANGE 11

Saisie des données On peut choisir d’afficher les Valeurs-Texte ou leur équivalent numérique en

Saisie des données On peut choisir d’afficher les Valeurs-Texte ou leur équivalent numérique en allant dans le menu Affichage > Afficher les Valeurs-Texte ou en cliquant sur le bouton Initiation à STATISTICA Joseph LARMARANGE 12

Statistiques descriptives z Aller dans le module Statistiques Élémentaires disponible dans le menu Statistiques.

Statistiques descriptives z Aller dans le module Statistiques Élémentaires disponible dans le menu Statistiques. Initiation à STATISTICA Joseph LARMARANGE 13

Statistiques descriptives z Choisir les statistiques descriptives. Initiation à STATISTICA Joseph LARMARANGE 14

Statistiques descriptives z Choisir les statistiques descriptives. Initiation à STATISTICA Joseph LARMARANGE 14

Choisir les variables z Un clic sur le bouton Variables. Initiation à STATISTICA Joseph

Choisir les variables z Un clic sur le bouton Variables. Initiation à STATISTICA Joseph LARMARANGE 15

Choisir les variables z Sélectionner les variables retenues pour l’analyse z Pour une liste

Choisir les variables z Sélectionner les variables retenues pour l’analyse z Pour une liste continue de variables, utilisez la touche SHIFT (ou ) et pour une liste discontinue la touche CTRL Initiation à STATISTICA Joseph LARMARANGE 16

Statistiques descriptives z Cliquer sur le bouton Synthèse Initiation à STATISTICA Joseph LARMARANGE 17

Statistiques descriptives z Cliquer sur le bouton Synthèse Initiation à STATISTICA Joseph LARMARANGE 17

Résultats Initiation à STATISTICA Joseph LARMARANGE 18

Résultats Initiation à STATISTICA Joseph LARMARANGE 18

Pour poursuivre l’analyse z Cliquer sur ce bouton Initiation à STATISTICA Joseph LARMARANGE 19

Pour poursuivre l’analyse z Cliquer sur ce bouton Initiation à STATISTICA Joseph LARMARANGE 19

Onglet Avancé z Cet onglet donne accès à un nombre plus important de statistiques

Onglet Avancé z Cet onglet donne accès à un nombre plus important de statistiques Initiation à STATISTICA Joseph LARMARANGE 20

Petit rappel sur le coefficient de corrélation r Initiation à STATISTICA Joseph LARMARANGE 21

Petit rappel sur le coefficient de corrélation r Initiation à STATISTICA Joseph LARMARANGE 21

Corrélation Exemple 2 : Initiation à STATISTICA Joseph LARMARANGE 22

Corrélation Exemple 2 : Initiation à STATISTICA Joseph LARMARANGE 22

Saisie des données Initiation à STATISTICA Joseph LARMARANGE 23

Saisie des données Initiation à STATISTICA Joseph LARMARANGE 23

Corrélation z Choisir les matrices de corrélation dans les Statistiques élémentaires. Initiation à STATISTICA

Corrélation z Choisir les matrices de corrélation dans les Statistiques élémentaires. Initiation à STATISTICA Joseph LARMARANGE 24

Définir les variables de l’analyse z Un clic sur le bouton 2 listes. Initiation

Définir les variables de l’analyse z Un clic sur le bouton 2 listes. Initiation à STATISTICA Joseph LARMARANGE 25

Définir les variables de l’analyse Initiation à STATISTICA Joseph LARMARANGE 26

Définir les variables de l’analyse Initiation à STATISTICA Joseph LARMARANGE 26

Lancer l’analyse z Sous l’onglet Options, choisir Tableau détaillé. z Cliquer sur Synthèse. Initiation

Lancer l’analyse z Sous l’onglet Options, choisir Tableau détaillé. z Cliquer sur Synthèse. Initiation à STATISTICA Joseph LARMARANGE 27

Résultats détaillés z r(X, Y) est le coefficient de corrélation. z Les résultats sont

Résultats détaillés z r(X, Y) est le coefficient de corrélation. z Les résultats sont en rouge si les résultats sont significatifs avec un risque d’erreur de 5% (p<0. 05, le seuil est paramétrable sous l’onglet options). La valeur de p est fournie. t correspond à la statistique du test utilisé. Initiation à STATISTICA Joseph LARMARANGE 28

Résultats détaillés z N rappelle le nombre d’observations considérées. z La moyenne et l’écart-type

Résultats détaillés z N rappelle le nombre d’observations considérées. z La moyenne et l’écart-type de chacune des deux variables sont donnés à titre indicatif. Initiation à STATISTICA Joseph LARMARANGE 29

Résultats détaillés z Rappelons que le principe est de trouver une droite qui représente

Résultats détaillés z Rappelons que le principe est de trouver une droite qui représente le mieux les deux variables. On cherche donc à modéliser le rapport entre X et Y de la forme Y = a X + b. z Mais il est aussi possible de modéliser sous la forme X = c Y + d. Initiation à STATISTICA Joseph LARMARANGE 30

Résultats détaillés b a d c z Statistica donne ces 4 coefficients : Y

Résultats détaillés b a d c z Statistica donne ces 4 coefficients : Y = a X + B X = c Y + d z Ainsi ici, Y = 0, 18 X + 1, 39 et X = 4, 87 Y - 4, 34 Initiation à STATISTICA Joseph LARMARANGE 31

Afficher la droite de régression z Un clic sur Nuages de points en 2

Afficher la droite de régression z Un clic sur Nuages de points en 2 D. Initiation à STATISTICA Joseph LARMARANGE 32

Afficher la droite de régression z Statistica trace la droite de régression ainsi que

Afficher la droite de régression z Statistica trace la droite de régression ainsi que les valeurs observées représenté es par un petit cercle. Initiation à STATISTICA Joseph LARMARANGE 33

Autre exemple : Exemple 3 : Un psychologue de l’armée américaine a remarqué que

Autre exemple : Exemple 3 : Un psychologue de l’armée américaine a remarqué que les soldats qui fumaient le plus avaient tendance à contracter plus de rhumes que les fumeurs légers. Par ailleurs il pense que les fumeurs sont des personnalités plus stressées que les non-fumeurs et que ce facteur ‘stress’ pourrait être responsable de leur santé fragile. Variables relevées : CIGA : nombre de cigarettes fumées par semaine RHUM : nombre de rhumes contractés dans l’année écoulée STRE : mesure du stress sur une échelle de 1 (faible) à 5 (élevé) Initiation à STATISTICA Joseph LARMARANGE 34

Autre exemple : Exemple 3 : Initiation à STATISTICA Joseph LARMARANGE 35

Autre exemple : Exemple 3 : Initiation à STATISTICA Joseph LARMARANGE 35

Résultats z Nous avons affiché la matrice de corrélation simple. z Il apparaît à

Résultats z Nous avons affiché la matrice de corrélation simple. z Il apparaît à p=5% qu’il y a une corrélation significative entre le nombre de cigarettes et le nombre de rhumes. z Par contre, le stress n’enregistre aucune corrélation significative avec les deux autres variables. Initiation à STATISTICA Joseph LARMARANGE 36

Test du Khi 2 Exemple 4 : Lors d'une étude sur la connaissance du

Test du Khi 2 Exemple 4 : Lors d'une étude sur la connaissance du sida chez les femmes guinéennes âgées de 15 -49 ans, on a construit un indicateur de connaissance du sida répartie en quatre groupes : faible, moyenne, bonne et très bonne. Les données sont issues de l'Enquête de Démographie et de Santé 1999. On a comparé cet indicateur avec le niveau d'instruction des femmes. Les effectifs sont les suivants (elles portent sur 6. 561 femmes) : Initiation à STATISTICA Joseph LARMARANGE 37

Saisie des données z Nous avons 6. 561 individus et 2 variables. Nous devrions

Saisie des données z Nous avons 6. 561 individus et 2 variables. Nous devrions donc remplir un tableau comportant 6. 561 lignes et 2 colonnes. z Cependant, il apparaît que certains individus sont identiques (c’est-à -dire présentant exactement les mêmes valeurs pour chaque variables). Ainsi, nous avons 888 femmes qui ont toute une faible connaissance du sida et aucun niveau d’instruction. z Nous constatons qu’il y a en tout 16 « profils d’individu » différents. z Au lieu de rentrer les caractéristiques des 6. 561 femmes, nous allons saisir les caractéristiques des 16 profils type et indiquer dans une troisième variable (le poids) le nombre de femmes que ce profil représente. z C’est le principe de la pondération. Initiation à STATISTICA Joseph LARMARANGE 38

Saisie des données z Nous allons donc créer un fichier comportant 16 observations et

Saisie des données z Nous allons donc créer un fichier comportant 16 observations et 3 variables. z Pour la connaissance du sida, nous coderons 1 une faible connaissance, 2 une moyenne, 3 une bonne et 4 une très bonne. z Pour le niveau d’instruction, 0 pour aucun, 1 pour primaire, 2 pour secondaire et 3 pour supérieur. Initiation à STATISTICA Joseph LARMARANGE 39

Saisie des données z. Voici le fichier de données que nous obtenons. Initiation à

Saisie des données z. Voici le fichier de données que nous obtenons. Initiation à STATISTICA Joseph LARMARANGE 40

Test du Khi 2 z Choisir les tableaux et tris croisés dans les Statistiques

Test du Khi 2 z Choisir les tableaux et tris croisés dans les Statistiques élémentaires. Initiation à STATISTICA Joseph LARMARANGE 41

Saisir les variables z Un clic sur Spécifier les tables. Initiation à STATISTICA Joseph

Saisir les variables z Un clic sur Spécifier les tables. Initiation à STATISTICA Joseph LARMARANGE 42

Saisir les variables z Sélectionner les variables de l’analyse Initiation à STATISTICA Joseph LARMARANGE

Saisir les variables z Sélectionner les variables de l’analyse Initiation à STATISTICA Joseph LARMARANGE 43

Préciser la pondération z Cliquer sur ce bouton Initiation à STATISTICA Joseph LARMARANGE Ce

Préciser la pondération z Cliquer sur ce bouton Initiation à STATISTICA Joseph LARMARANGE Ce bouton est accessible dans toutes les fenêtres de Statistica, la pondération pouvant être utilisée pour n’importe quel calcul. 44

Préciser la pondération z Sélectionner la variable de pondération z Activer la pondération Initiation

Préciser la pondération z Sélectionner la variable de pondération z Activer la pondération Initiation à STATISTICA Un double clic dans le champ d’édition du nom de la variable ouvre une liste de l ’ensemble des variables du fichier. Joseph LARMARANGE 45

Lancer l’analyse z Cliquez deux fois sur OK. z Aller sous l’onglet Options. Initiation

Lancer l’analyse z Cliquez deux fois sur OK. z Aller sous l’onglet Options. Initiation à STATISTICA z Sélectionner Chi² & Pearson et Effectifs théoriques Joseph LARMARANGE 46

Premier tableau de résultats Pour naviguer d’un tableau à l’autre Initiation à STATISTICA z

Premier tableau de résultats Pour naviguer d’un tableau à l’autre Initiation à STATISTICA z Il s’agit du tableau croisé des effectifs. Joseph LARMARANGE 47

Second tableau de résultats z Affichage des effectifs théoriques Rappel : il s’agit des

Second tableau de résultats z Affichage des effectifs théoriques Rappel : il s’agit des effectifs que l’on aurait si les deux variables étaient parfaitement indépendantes. z Ici p est inférieur à 0, 05. On en déduit qu’avec une erreur de première espèce de 5% que les deux variables ne sont pas indépendantes. NB : petit hic, normalement on ne doit pas avoir d’effectifs inférieurs à 5 (ou à 10 pour plus de précision). Il serait donc préférable de regrouper auparavant certaines catégories. Initiation à STATISTICA Joseph LARMARANGE 48

Autre exemple : Exemple 5 : Dans une enquête sur le réseau Internet auprès

Autre exemple : Exemple 5 : Dans une enquête sur le réseau Internet auprès de 1006 personnes, une des questions posées était la suivante: " Personnellement quelle est votre attitude à l'égard de cette nouvelle application de la micro-informatique ? Vous êtes. . . Passionné, Intéressé, Indifférent, Dépassé, Agacé, ou ne se prononce pas (NSP). Les personnes interrogées ont été regroupées en 5 catégories d'âge : 18 -24 ans, 25 -34 ans, 34 -49 ans, 50 -64 ans, plus de 65 ans. Initiation à STATISTICA Joseph LARMARANGE 49

Autre exemple : Exemple 5 : Voici les données observées. Étant donné le très

Autre exemple : Exemple 5 : Voici les données observées. Étant donné le très faible nombre de NSP, nous n’en tiendrons pas compte. L’analyse portera donc sur 992 individus. Initiation à STATISTICA Joseph LARMARANGE 50

Fichier de données z. Tableau à 3 colonnes et 25 lignes (puisqu’on ne tient

Fichier de données z. Tableau à 3 colonnes et 25 lignes (puisqu’on ne tient pas compte des NSP) Initiation à STATISTICA Joseph LARMARANGE 51

Résultats z p < 0, 05 L’attitude à l’égard de Internet diffère avec l

Résultats z p < 0, 05 L’attitude à l’égard de Internet diffère avec l ’âge. Initiation à STATISTICA Joseph LARMARANGE 52

Liens z Ce diaporama est disponible, ainsi que les fichiers des exemples, à l’adresse

Liens z Ce diaporama est disponible, ainsi que les fichiers des exemples, à l’adresse http: //joseph. larmarange. free. fr z Les statistiques élémentaires sont disponibles gratuitement dans la version de démonstration de statistica disponible sur internet : http: //www. statsoft. com/french/welcome. html Initiation à STATISTICA Joseph LARMARANGE 53