Les expriences contrles Les expriences Une partie fondamentale

  • Slides: 60
Download presentation
Les expériences contrôlées

Les expériences contrôlées

Les expériences • Une partie fondamentale de la méthode scientifique • Permettent de trouver

Les expériences • Une partie fondamentale de la méthode scientifique • Permettent de trouver des relations causales entres des conditions et leurs effets • En IHM, permettent de trouver si une interface A est plus rapide/cause moins d’erreurs/etc. qu’une interface B

Les expériences • On varie (manipule) au moins une variable (exemple: l’interface à utiliser).

Les expériences • On varie (manipule) au moins une variable (exemple: l’interface à utiliser). C’est la variable indépendante. Chacune de ses valeurs correspond à une condition. • On mesure au moins une variable (exemples: le temps, le nombre d’erreurs, la satisfaction subjective). C’est la variable dépendante. • On analyse les résultats pour voir s’il y a des différences significatives.

Exemple d’expérience • Les « expanding targets » Référence: M. Mc. Guffin, R. Balakrishnan

Exemple d’expérience • Les « expanding targets » Référence: M. Mc. Guffin, R. Balakrishnan (2002). Acquisition of Expanding Targets. Proceedings of ACM Conference on Human Factors in Computing Systems (CHI) 2002, pages 5764, http: //doi. acm. org/10. 1145/503376. 503388

Exemple: Mac OS X • Est-ce que ce genre de grossissement rend la sélection

Exemple: Mac OS X • Est-ce que ce genre de grossissement rend la sélection plus facile ?

D’autres exemples Furnas Generalized fisheye views CHI 1986 Mackinlay, Robertson, Card The Perspective Wall

D’autres exemples Furnas Generalized fisheye views CHI 1986 Mackinlay, Robertson, Card The Perspective Wall CHI 1991 Bederson Fisheye Menus UIST 2000

Fitts’ Law A Target Cursor W

Fitts’ Law A Target Cursor W

Fitts’ Law Target 1 Target 2 Same ID → Same Difficulty

Fitts’ Law Target 1 Target 2 Same ID → Same Difficulty

Fitts’ Law Target 1 Target 2 Smaller ID → Easier

Fitts’ Law Target 1 Target 2 Smaller ID → Easier

Fitts’ Law Target 1 Target 2 Larger ID → Harder

Fitts’ Law Target 1 Target 2 Larger ID → Harder

La loi de Fitts Largeur W Mouvements à boucle ouverte (sans retour) Mouvements à

La loi de Fitts Largeur W Mouvements à boucle ouverte (sans retour) Mouvements à boucle fermée (avec retour) Vitesse “undershoot” (trop court) Distance “overshoot” (trop loin)

Expanding Targets Basic Idea: • Big targets can be acquired faster, but take up

Expanding Targets Basic Idea: • Big targets can be acquired faster, but take up more screen space • So: keep targets small until user heads toward them Click Me ! Okay Cancel

Experimental Setup W Target Start Position A

Experimental Setup W Target Start Position A

Experimental Setup Expansion: • How ? Animated Expansion

Experimental Setup Expansion: • How ? Animated Expansion

Experimental Setup Expansion: • How ? Fade-in Expansion

Experimental Setup Expansion: • How ? Fade-in Expansion

Experimental Setup Expansion: • How ? • When ? P = 0. 25

Experimental Setup Expansion: • How ? • When ? P = 0. 25

Experimental Setup Expansion: • How ? • When ? P = 0. 5

Experimental Setup Expansion: • How ? • When ? P = 0. 5

Experimental Setup Expansion: • How ? • When ? P = 0. 75

Experimental Setup Expansion: • How ? • When ? P = 0. 75

Pilot Study 7 conditions: • No expansion (to establish a, b values) • Expanding

Pilot Study 7 conditions: • No expansion (to establish a, b values) • Expanding targets – Either animated growth or fade-in – P is one of 0. 25, 0. 75 (Expansion was always by a factor of 2)

Pilot Study 7 conditions x 16 (A, W) values x 5 repetitions x 2

Pilot Study 7 conditions x 16 (A, W) values x 5 repetitions x 2 blocks x 3 participants = 3360 trials

Pilot Study: Results Time (seconds) ID (index of difficulty)

Pilot Study: Results Time (seconds) ID (index of difficulty)

Pilot Study: Results Time (seconds) ID (index of difficulty)

Pilot Study: Results Time (seconds) ID (index of difficulty)

Pilot Study: Results Time (seconds) ID (index of difficulty)

Pilot Study: Results Time (seconds) ID (index of difficulty)

Pilot Study: Results Time (seconds) P = 0. 25 ID (index of difficulty)

Pilot Study: Results Time (seconds) P = 0. 25 ID (index of difficulty)

Pilot Study: Results Time (seconds) P = 0. 5 ID (index of difficulty)

Pilot Study: Results Time (seconds) P = 0. 5 ID (index of difficulty)

Pilot Study: Results Time (seconds) P = 0. 75 ID (index of difficulty)

Pilot Study: Results Time (seconds) P = 0. 75 ID (index of difficulty)

Implications • Pilot Study suggests the advantage of expansion doesn’t depend on P •

Implications • Pilot Study suggests the advantage of expansion doesn’t depend on P • So, set P = 0. 9 and perform a more rigorous study

Full Study 2 conditions: • No expansion (to establish a, b values) • Expanding

Full Study 2 conditions: • No expansion (to establish a, b values) • Expanding targets, with – Animated growth – P = 0. 9 – Expansion factor of 2

Full Study 2 conditions x 13 (A, W) values x 5 repetitions x 5

Full Study 2 conditions x 13 (A, W) values x 5 repetitions x 5 blocks x 12 participants = 7800 trials

Results Time (seconds) A, W values

Results Time (seconds) A, W values

Results Time (seconds) ID (index of difficulty)

Results Time (seconds) ID (index of difficulty)

Results Time (seconds) ID (index of difficulty)

Results Time (seconds) ID (index of difficulty)

Results Time (seconds) ID (index of difficulty)

Results Time (seconds) ID (index of difficulty)

Results Time (seconds) P = 0. 9 ID (index of difficulty)

Results Time (seconds) P = 0. 9 ID (index of difficulty)

Implications • For single-target selection task, – Expansion yields a significant advantage, even when

Implications • For single-target selection task, – Expansion yields a significant advantage, even when P=0. 9 • What about multiple targets ?

(Fin des diapos sur les « expanding targets » )

(Fin des diapos sur les « expanding targets » )

Les variables dans une expérience À retenir! • Variables indépendantes: celles qu’on manipule (on

Les variables dans une expérience À retenir! • Variables indépendantes: celles qu’on manipule (on les appelle aussi les facteurs); correspondent aux conditions (ou traitements ou niveaux) • Variables dépendantes: celles qu’on mesure (souvent le temps et les erreurs) • Variables de contrôle: celles qu’on contrôle, c. -à-d. qu’on essaie de garder constantes entre les conditions • Variables aléatoires: celles qu’on laisse varier, de manière le plus aléatoire possible. – Exemples: âge, sexe, profil socio-économique, etc. – Comment assurer une variation aléatoire entre les conditions ? • Affectation aléatoire des participants aux conditions – Désavantage: Ces variables vont introduire plus de variabilité dans nos résultats – Avantage: Nos résultats seront plus généraux; nos conclusions vont s’appliquer à plus de situations • Variables confondantes: celles qui varient de manière systématique entre les conditions. On veut éliminer ces variables!

Régression linéaire Y X • Résultats du calcul: pente, intersection, et coéfficient de corrélation

Régression linéaire Y X • Résultats du calcul: pente, intersection, et coéfficient de corrélation de Pearson r qui est dans l’intervalle [-1, 1]

Un lien causal … • Dans une expérience bien contrôlée, s’il n’y a pas

Un lien causal … • Dans une expérience bien contrôlée, s’il n’y a pas de variables confondantes, et on trouve que les variable dépendantes changent lorsqu’on change les variables indépendantes, on peut conclure qu’il y a un lien causal: le changements dans les variables indépendantes cause le changement dans les variables dépendantes. Dans ce cas, une corrélation impliquerait un lien causal.

… versus une corrélation simple • Par contre, si on ne fait qu’observer une

… versus une corrélation simple • Par contre, si on ne fait qu’observer une corrélation entre deux variables X et Y, sans contrôler les conditions, cela n’implique pas un lien causal entre eux. Il se pourrait que – X a un effet sur Y – Y a un effet sur X – Une troisième variable, Z, a un effet sur X et Y • C’est pour ça qu’on essaie d’éliminer les variables confondantes dans les expériences

Exemple • Des chercheurs voulaient savoir quelle variable pourrait prédire les chances qu’un conducteur

Exemple • Des chercheurs voulaient savoir quelle variable pourrait prédire les chances qu’un conducteur de motocyclette ait un accident de moto. Ils ont cherché des corrélations entre le nombre d’accidents, et l’âge, le niveau socioéconomique, etc. • Ils ont trouvé que la plus forte corrélation était avec le nombre de tatouages du conducteur. • Évidemment, les tatouages ne causent pas les accidents, ni l’inverse.

Exemples de questions qu’on peut cher à répondre avec une expérience • Parmi 3

Exemples de questions qu’on peut cher à répondre avec une expérience • Parmi 3 interfaces, A, B, C, laquelle permet de compléter une tâche donnée la plus vite ? • Est-ce que l'amphétamine a un effet sur la performance des gens à attacher des lacets de souliers ? • Est-ce que la fréquence des annonces de type X à la télévision a un effet sur les élections ? • Est-ce que le fait de jeter un sort à des dés peut avoir un effet sur les résultats de lancer les dés ?

Éléments d’une expérience • Population – L’ensemble de tous les participants possibles • Échantillon

Éléments d’une expérience • Population – L’ensemble de tous les participants possibles • Échantillon (“sample”) – Sous-ensemble de la population choisi pour une étude; un ensemble de participants • Participants (anciennement, on disait sujets) – Les gens ou les utilisateurs qui effectuent des tâches • Observations / Variable(s) dépendente(s) – Données qui sont mesurées • Exemples: temps pour compléter une tâche, nombre d’erreurs commises, préférences subjectives • Condition(s) / Traîtement(s) / Variable(s) independente(s) – Quelque chose qui distingue les échantillons (exemple: prendre un médicament vs un placebo, ou utiliser l’interface A vs B) – Le but de l’expérience est souvent de déterminer si les conditions ont un effet sur les observations

Étapes dans la planification et l’exécution d’une expérience • Le plan de l’expérience (“experimental

Étapes dans la planification et l’exécution d’une expérience • Le plan de l’expérience (“experimental design”) – – Choisir les variable(s) indépendente(s) Choisir les variable(s) dépendente(s) Développer une hypothèse Choisir un paradigme • croisé = “within subjects” OU emboîté = “between subjects” – Choisir une manière de contrôler les variables – Choisur la taille de l’échantillon • Expérience pilote – Une première expérience, souvent pour explorer plusieurs conditions pour sonder l’effet de chaque variable • La “vraie” expérience – Se concentre plus sur l’effet soupçonné; essaie de recueillir beaucoup de données à des conditions optimales pour obtenir un effet prononcé et de conclusions confiantes • Analyser les données – En utilisant un test statitisque comme le ANOVA (analysis of variance) • Interpréter les résultats

Hypothèse • Énoncé, à tester, concernant la relation entre les variables indépendentes et dépendentes

Hypothèse • Énoncé, à tester, concernant la relation entre les variables indépendentes et dépendentes • L’hypothèse nulle dit que les variables indépendentes n’ont pas d’effet sur les variables dépendentes

Les plans expérimentaux ("experimental design") • Between subjects or within subjects manipulation (emboîté vs

Les plans expérimentaux ("experimental design") • Between subjects or within subjects manipulation (emboîté vs croisé) • Example: designs with one independent variable – Between subjects design (emboîté) • One independent variable with 2 or more levels • Subjects randomly assigned to groups • Each subject tested under only 1 condition – Within subject design (croisé) • One independent variable with 2 or more levels • Each subject tested under all conditions • Order of conditions randomized or counterbalanced (why? )

Choses à contrôler • Les caractéristiques des participants – Sexe, droitier vs gaucher, etc.

Choses à contrôler • Les caractéristiques des participants – Sexe, droitier vs gaucher, etc. – Habileté – Expérience (professionnelle, de vie, ou autre) • Les tâches – Directives données aux participants – Matériel / équipment utilisé • L’environnement – Toujours le même local – Bruit, lumière ambiente, etc. • Effets dûs à l’ordonnancement des conditions dans une expérience “within subjects” – L’amélioration du participant dû au pratique de la tâche – La détérioration dû à la fatigue

Comment contrôler pour les effets d’ordonnancement • Contrebalancement – Plan factoriel – Plan en

Comment contrôler pour les effets d’ordonnancement • Contrebalancement – Plan factoriel – Plan en carré latin

Plans expérimentaux contrebalancés pour une variable indépendente avec N niveaux A, B, . .

Plans expérimentaux contrebalancés pour une variable indépendente avec N niveaux A, B, . . . ↓Plan expérimental ↓Nombre de conditions = N 2 3 4 →Emboîté ("between subjects"): chaque participant passe par seulemeunt une condition. Avantage: pas d'effets de transfert. 1/2: A 1/2: B 1/3: A 1/3: B (chaque moitié des 1/3: C 1/4: A 1/4: B 1/4: C 1/4: D →Croisé ("within subjects"): chaque participant passe par toutes les conditions. Avantage: plus de données recueillies pour le même nombre de participants. →Factoriel: tous les (N!) ordonnancements possibles de conditions 1/2: AB 1/2: BA 1/6: ABC 1/6: ACB 1/6: BAC 1/6: BCA 1/6: CAB 1/6: CBA 1/24: ABCD 1/24: . . . →Carré latin: chaque condition apparaît une fois dans chaque position (colonne) possible. 1/2: AB 1/2: BA 1/3: ABC 1/3: BCA 1/3: CAB 1/4: ABCD 1/4: BCDA 1/4: CDAB 1/4: DABC participants fait une condition) (même chose que factoriel) Carré latin versus plan factoriel: si le nombre de conditions est N, le nombre de participants avec un carré latin a seulemeunt besoin d'être un multiple de N, au lieu d'un multiple de N!

Exemple de plan expérimental avec une variable indépendente (diapo 1/2) • Variable indépendente MENU

Exemple de plan expérimental avec une variable indépendente (diapo 1/2) • Variable indépendente MENU avec trois niveaux (c. -à-d. trois conditions) A, B, C, soient trois sortes de menus • Plan expérimental croisé par rapport à MENU, contrebalancé avec un carré latin 3× 3 – C. -à-d. : un tiers des participants font A suivi de B suivi de C; un tiers font B, C, A; un tiers font C, A, B • Il y aura des effets de transfert, mais on espère qu'ils seront symmétriques • Variable dépendente: TEMPS de selection • À la fin de l'expérience, on pourra faire un ANOVA pour savoir si MENU a un effet significatif (p < 0. 05) sur TEMPS

Exemple de plan expérimental avec une variable indépendente (diapo 2/2) • On peut aussi

Exemple de plan expérimental avec une variable indépendente (diapo 2/2) • On peut aussi définir une deuxième variable ORDRE, qui sera emboîtée, avec trois niveaux (un pour chaque tiers des participants) – 1/3: MENU = A, B, C; ORDRE = 1 – 1/3: MENU = B, C, A; ORDRE = 2 – 1/3: MENU = C, A, B; ORDRE = 3 • Donc, notre plan a deux variables indépendentes: MENU qui est croisé, et ORDRE qui est emboîté • À la fin de l'expérience, on fait un ANOVA pour savoir si ORDRE a un effet significatif sur TEMPS – Si non, les effets de transfert sont symmétriques (bonne nouvelle!) – Si oui, on peut simplement supprimer toutes les données recueillies après le premier niveau de MENU; notre plan expérimental se réduit donc à un plan emboîté par rapport à MENU avec seulement un tiers des données qui restent (et donc moins de puissance statistique pour le ANOVA), mais nous n'avons plus d'effets de transfert • On fait un ANOVA pour savoir si MENU a un effet significatif sur TEMPS

Exemple de plan expérimental avec deux variables indépendentes (1/2) • Disons qu'on veut évaluer

Exemple de plan expérimental avec deux variables indépendentes (1/2) • Disons qu'on veut évaluer deux techniques de visualisation de données (TECHNIQUE = A ou B). On ne veut pas demander aux participants de faire des tâches avec le même jeu de données pour les deux techniques, donc on aura deux jeux JEU = J 1 ou J 2 • Un plan possible: – – 1/4: (TECHNIQUE, JEU) = (A, J 1), (B, J 2) 1/4: (TECHNIQUE, JEU) = (A, J 2), (B, J 1) 1/4: (TECHNIQUE, JEU) = (B, J 1), (A, J 2) 1/4: (TECHNIQUE, JEU) = (B, J 2), (A, J 1) • Notre plan et donc croisé par rapport à TECHNIQUE et JEU avec contrebalancement factoriel (ce qui est équivalent au carré latin, dans ce cas) • Peut-être, pour chaque technique, on a une série de tâches T CHE = T 1, T 2, T 3, T 4. Cela rajoute une troisième variable. Si on contrebalance l'ordonnancement de T CHE avec un carré latin 4× 4, ça donne 4 ordonnancements de tâches. Combiné avec nos 4 ordonnancements de (TECHNIQUE, JEU), ça donnerait 16 ordonnancements, ce qui est beaucoup.

Exemple de plan expérimental avec deux variables indépendentes (2/2) • • • Une autre

Exemple de plan expérimental avec deux variables indépendentes (2/2) • • • Une autre approche serait de fixer l'ordre des tâches, de la plus facile à la plus difficile, par exemple. On pourrait aussi définir une variable ORDRE Un plan possible serait donc – – • • • 1/4: (TECHNIQUE, JEU) = (A, J 1), (B, J 2); ORDRE = 1 1/4: (TECHNIQUE, JEU) = (A, J 2), (B, J 1); ORDRE = 2 1/4: (TECHNIQUE, JEU) = (B, J 1), (A, J 2); ORDRE = 3 1/4: (TECHNIQUE, JEU) = (B, J 2), (A, J 1); ORDRE = 4 . . . où T CHE = T 1, T 2, T 3, T 4 pour chaque combinaison de (TECHNIQUE, JEU). Notre plan serait donc croisé par rapport à TECHNIQUE et JEU, emboîté par rapport à ORDRE, et avec un ordonnancement fixe pour T CHE. Il va sûrement y avoir des effets de transfert asymmétriques entre les tâches, nous empêchant de comparer les tâches avec un ANOVA, mais cela peut être acceptable si notre objectif principal est de comparer les techniques A et B de visualisation. Une autre approche aurait été de dire que l'ordonnancement de T CHE sera alléatoire À la fin de l'expérience, on fait un ANOVA pour savoir si ORDRE a un effet significatif sur TEMPS, et ensuite un autre ANOVA pour savoir si TECHNIQUE a un effet significatif sur TEMPS

ANOVA • “Analysis of Variance” • A statistical test that compares the distributions of

ANOVA • “Analysis of Variance” • A statistical test that compares the distributions of multiple samples, and determines the probability that differences in the distributions are due to chance • In other words, it determines the probability p that we would observe the given distributions if the null hypothesis is correct • If probability is below 0. 05 (i. e. 5 %), then we reject the null hypothesis, and we say that we have a (statistically) significant result – Why 0. 05 ? Dangers of using this value ?

Techniques for Making Experiment more “Powerful” (i. e. able to detect effects) • Reduce

Techniques for Making Experiment more “Powerful” (i. e. able to detect effects) • Reduce noise (i. e. reduce variance) – Increase sample size – Control for random variables • E. g. psychologists often use in-bred rats for experiments ! • Increase the magnitude of the effect – E. g. give a larger dosage of the drug

Une petite différence entre les moyennes des échantillons. Est-ce significative, ou simplement dû au

Une petite différence entre les moyennes des échantillons. Est-ce significative, ou simplement dû au hasard ? Une plus grande différence entre les moyennes des échantillons. Est-ce significative, ou simplement dû au hasard ?

Avec une variance plus petite (que sur le diapo précedent), on est plus sûr

Avec une variance plus petite (que sur le diapo précedent), on est plus sûr que la très petite différence ici est dû au hasard … … et la différence plus grande ici est significative.

Avec une taille d’échantillon plus large (que sur les diapos précedents), on est plus

Avec une taille d’échantillon plus large (que sur les diapos précedents), on est plus sûr que la très petite différence ici est dû au hasard … … et la différence plus grande ici est significative.

Uses of Controlled Experiments within HCI • Evaluate or compare existing systems/features/interfaces • Discover

Uses of Controlled Experiments within HCI • Evaluate or compare existing systems/features/interfaces • Discover and test useful scientific principles – Examples ? • Establish benchmarks/standards/guidelines – Examples ?

Exemple d’un plan d’expérience … • Pour chaque participant … – Pour chaque condition

Exemple d’un plan d’expérience … • Pour chaque participant … – Pour chaque condition majeure. . . * • On fait des essais de réchauffement • On a un certain nombre de blocs, séparés par des pauses • Pour chaque bloc … • On répète chaque condition mineure un certain nombre de fois * • * Comment ordonner ces choses ?