click below
click below
Normal Size Small Size show me how
Psychométrie intra
Questions d'étude relatives au cours 1 à 6
Question | Answer |
---|---|
Qu'est-ce que la psychométrie? | Une branche de la psychologie qui se consacre aux tests. |
Quelles-sont les trois questions fondamentales de la psychométrie? | 1) Comment interpréter les scores d'un test? (normes) 2) Quel est la stabilité du test? (fidélité) 3) Que mesure le test? (validité) |
Qu'est-ce qu'un test (5)? | 1) Une méthode ou un outil standardisé 2) Qui fournit de l'information 3) Sur un échantillon 4) De comportements ou de processus cognitifs 5) sous une forme quantifié |
Nommez 5 grandes catégories de test. | Test de rendement, test d'aptitudes intellectuelles, test de personnalité, mesure des intérêts et des attitudes, tests neuropsychologiques |
Quels sont les quatre postulats de base de la psychométrie? | 1) Les êtres humains se distinguent par des traits ou caractères importants 2) Ces traits peuvent être quantifiés 3) Ces traits sont assez stables 4) Les mesures de ces traits sont liées au comportement |
Jusqu'à 1840, à quoi s'intéressaient les philosophes et quel type de tests prédominaient? | Les philosophes s'intéressaient aux traits communs des humains et les tests oraux prédominaient. |
Comment à évoluer la mise en place de la psychométrie de 1840 à 1880 (4)? | 1) Intérêt pour la maladie mentale 2) Adoption des exaens écrits en milieu scolaire 3) Théorie d'évolution de Darwin 4) Établissement de la psychologie expérimentale |
Qui sont les grands pionniers de l'enracinement de la psychométrie de 1880 à 1915 (4)? | Galton, Cattell, Binet, Spearman |
Qui est le fondateur de la psychométrie et comment a-t-il contribué à cette branche de la psychologie (3)? | Francis Galton 1) Mesure des aptitudes intellectuelles 2) Souligne l'existence de variations héritées parmi les membres des espèces (distribution normale) 3)Pionniers dans l'élaboration des échelles auto-rapportées et l'enquête par questionnaire, etc. |
Quelle a été la contribution de James McKeen Cattell? (4) | 1) À l'origine des premiers tests mentaux 2) Élabore une batteries de tests mentaux 3) Fct intellectuelles peuvent être évaluées par des processus mentaux fondamentaux 4) Administré à des étudiants pour prédire leur réussite scolaire |
Quelle a été la contribution de Charles Edward Spearman (3)? | 1) Père de l'analyse factorielle 2) Souligne l'action d'un facteur commun à toutes les opérations psychologiques 3) Propose une théorie fondée sur les résultats aux tests |
Qu'est-ce qui caractérise la période d'essort (1915-1940) de la psychométrie (2)? | 1) Publication abondante de nouveaux tests 2) La publication de revues consacrées aux tests psychométriques et les tests d'intelligence? |
Qu'est-ce qui caractérise la période de consolidation (1940-1965) (3)? | 1) Révision de tests et création de nouveaux tests 2) Expansion des secteurs d'applications 3) Parution d'ouvrages importants |
Qu'est-ce qui caractérise la période du récent passé (1965-2000)? (4) | 1) Théorie classique des test vs théorie de réponse à l'item 2) Activisme législatif et judiciaire 3) Critique publique 4) Influence des ordinateurs |
Qu'est-ce qui caractérise la période actuelle (2000 à aujourd'hui)? (4) | 1) Augmentation du nombre et de la diversité des tests 2)Influence de la gestion intégrée des soins de santé 3)Administration des tests et communication des résultats en ligne 4) Informatisation de l'interprétation des tests |
Quelle a été la contribution d'Alfred Binet? (4) | 1) Père des tests d'aptitudes intellectuelles 2) Élaboration de l'échelle Binet-Simon visant à discriminer les étudiants 3) L'âge doit être utilisé comme facteur indépendant de la compétence intellectuelle 4) Le test donnait l'âge mental |
Quelles sont les 5 caractéristiques des tests? | 1) Échantillon de comportements/processus cognitif 2) Standardisation 3) Objectivité du test 4) Fidélité 5) Validité |
Qu'est-ce qui détermine la représentativité de la mesure? | Le nombre et la nature des items qui composent l'échantillon |
Comment s'assure-t-on d'une bonne représentativité de la mesure? | En montrant qu'il existe une correspondance entre les résultats au test et ce qu'il est censé prédire. |
À quoi réfère la standardisation? | Elle réfère à l'uniformité de la démarche d'administration et de correction du test |
Qu'est-ce qui doit être les mêmes si on veut comparer des individus différents entre eux? | Les conditions de passation |
Nommez quelques exemples de conditions de passation standardisées? | Matériel à utiliser, limites de temps, consignes orales, démonstration préliminaires, façon de répondre aux questions de l'examiné, rétroaction sur la performance de l'examiné, ton de la voix, expression faciale |
Qu'est-ce qu'une norme et à quoi sert-elle? | C'est un résultat moyen pour un groupe donné suite à la passation et à la correction standardisée. Elle corresponds à la performance de personnes typiques. Elle sert à interpréter un résultat en le comparant à celui d'autres individus. |
À quoi réfère l'échantillon de standardisation (ou de normalisation)? | Groupe de personnes qui a servi à l'établissement des normes. |
Dans quelles conditions l'échantillon de standardisation n'est pas représentatif? | Lorsque les conditions de passation du test ne sont pas les mêmes pour tous (non respect de la passation et la correction standardisée) |
En théorie, en quoi l'administration, la correction et l'interprétation sont-elles objectives? (3) | 1) Ne dépends pas de facteurs externes 2) Ne dépends pas de l'examinateur ou du correcteur 3) Certaines choses peuvent être faites pour assurer l'objectivité dans la construction d'un test |
À quoi réfère la fidélité d'un test? | À la reproductibilité des résultats obtenus à ce test. Il s'agit d'évaluer dans quelle mesure les résultats fournis sont contaminées par des erreurs aléatoires. |
Comment évalue-t-on la stabilité temporelle? | Fidélité par test-retest |
Comment évalue-t-on l'équivalence entre deux tests? | Fidélité par versions parallèles |
Comment évalue-t-on la cohérence interne? | Fidélité par bissection |
Comment évalue-t-on l'homogénéité? | Fidélité par la relation entre les items |
Comment évalue-ton la fidélité entre les correcteurs? | Fidélité inter-juge |
À quoi réfère la validité? | Au degré avec lequel celui-ci mesure ce qu'il a pour but de mesurer (dans une situation particulière donnée) |
Comment évalue-t-on la validité? | Avec des critères externes auxquels sont comparés les résultats obtenus au test. La force du lien (coefficient de corrélation) indique dans quelle mesure le test est valide. |
Comment évalue-t-on la représentativité d'un échantillon? | Validation de contenu |
Comment évalue-t-on la relation avec un critère externe? | Validation critériée |
Comment évalue-t-on la cohérence avec la structure théorique? | Validation de construit |
Est-ce qu'un test peu fidèle peut être valide? | Non, si la mesure contient trop d'erreurs aléatoires, elle peut difficilement prétendre mesurer ce qu'elle doit mesurer. |
Est-ce qu'un test fidèle est automatiquement valide? | Non, exemple de thermomètre |
Comment les examinateurs doivent-ils se préparer (4) | 1) Parfaite mémorisation des consignes verbales 2) Matériel bien préparé et installé 3) Excellente connaissance de la situation de testing 4) Capacité à identifier les facteurs spécifiques au testing influençant les résultats |
À quoi les examinateurs doivent-ils faire attention lors du testing? | 1) À l'environnement de testing 2) À ne pas être dérangé 3) Plusieurs autres facteurs (attitude, connaissance de l'examiné, présentation de l'instrument, etc.) |
Quels sont les trois principes importants des conditions de testing? | 1) Respect intégral des consignes fournies avec le test 2) Prise en note de toute condition inhabituelle 3) Considération des conditions lors de l'interprétation |
Quels sont les éléments importants à l'établissement du climat interpersonnel lors de l'administration de test? | 1) Mise en place d'un climat adéquat afin de susciter la performance optimale de l'examiné 2) Attention portée aux caractéristiques de l'examiné 3) Notation de tout écart aux conditions normales de motivation et considération dans l'interprétation |
Quelles sont les quatre variables liées à la situation et à l'examinateur? | 1) Comportement de l'examinateur avant ou pendant 2) Prophétie qui s'autoréalisent (attentes de l'examinateur) 3) Activités pratiquées par l'examiné avant le testage 4) Rétroaction sur la performance antérieur |
Quel est l'impact de l'anxiété sur la performance? (3) | 1) Les scores sont négativement affectés par l'anxiété 2) Mais la relation n'est pas linéaire (un peu d'anxiété est bénéfique) 3) Différences entre les personnes peu anxieuses et très anxieuses |
Quel est l'impact de la composante émotionnelle de l'anxiété (l'émotivité) sur la performance? | Peu d'effet sur la performance |
Quel est l'impact de la composante cognitive de l'anxiété (l'inquiétude) sur la performance? | Impact négatif sur la performance |
Qu'est-ce que l'éthique? | Principes et normes qui guident les conduites (suggestion) |
Qu'est-ce que la déontologie? | Éthique appliquée au profession libérale |
Qu'est-ce qu'une loi? | Ensemble des énoncés qui dicte ce qu'une personne doit et ne doit pas faire (obligation) |
Quelles sont les trois sources principales éthiques en psychométrie? | 1) L'OPQ 2) Norme et pratique du testing en psychologie et en éducation 3) Société canadienne de psychologie |
Quels sont les cinq conditions d'utilisation éthique des tests? | 1) Compétence 2) Consentement éclairé 3) Connaissance des résultats 4) Confidentialité 5) Protection des tests |
Les psychologues doivent être compétents à l'égard de quoi? | Des concepts comme les normes, la fidélité, la validité, l'élaboration de test et de la méthodologie des instruments (administration et correction) |
Le psychologue doit faire preuve de compétence dans... | 1) Le choix du test 2) L'administration et la correction du test 3) L'interprétation et la communication des résultats |
Que doit faire le psychologue pour obtenir un consentement éclairé (5)? | 1) Expliquer la nature et les objectifs du tests 2) Clarifier le rôle des tests 3) Expliquer la porter de l'interprétation du score 4) Doit être fait dans une forme et un langage adapté 5) L'examiné conserve le droit de retirer son consentement |
Quelles sont les responsabilités de l'examinateur quant à la connaissance des résultats? | 1) Responsable d'informer l'examiné des résultats obtenus de façon à qu'ils soient bien interprétés 2) Réglementation sur le partage des scores brutes, des QI, des protocoles de tests |
À quoi servent les rapports d'évaluation? | À consigner et communiquer des informations concernant l'évaluation et la prise en charge d'un client ainsi que l'évaluation de celui=-ci de façon structurée, standardisée et relativement objective |
Quelle est la responsabilité des psychothérapeutes quant à la confidentialité? | 1) Garder les résultats confidentiels, les préserver en lieu sûr et s'en défaire de façon approprié 2) Exception: danger imminent de mort ou de blessure |
Quelle est la responsabilité des psychothérapeutes quant à la protection des tests (2)? | 1) Le matériel de test doit être gardé en lieu sûr 2) Ne pas dévoiler le contenu des tests |
Quels sont les quatre problèmes associés à la diffusion intégrale des tests? | 1) Diminution de la validité 2) Nécessité de préparer continuellement de nouvelles versions 3) Augmentation des coûts 4) Diminution du contrôle de la qualité |
Quelles sont les qualifications des utilisateurs/acheteurs de tests? | Niveau A: formation minimale requise Niveau B: connaissance des caractéristiques techniques Niveau C: formation avancée en théorie des tests et dans les domaines pertinents |
Quels sont les trois contextes qui font le liens entre les tests et la loi? | 1) Emploi 2) Éducation 3) Contexte psycholégale |
Que dis la loi 21? | Balises pour l'évaluation des clientèles vulnérables (Ce n'est pas tout le monde qui a le droit d'évaluer) |
Quelles sont les cinq applications utiles des tests à des fins juridiques? | 1) Compétence du parent à assumer la garde d'un enfant 2) Prédiction de comportements violents ou à risque (dangerosité) 3) Nature et étendue de mauvais traitements 4) Aliénation mentale 5) Inaptitude à subir son procès |
À quoi réfère l'aliénation mentale? | État mental qui rend la personne incapable d'apprécier la nature et la gravité de son geste LORS DU CRIME |
Quels sont les trois critères d'aliénation mentales? | 1) Incapacité à distinguer le bien du mal au moment de l'acte 2) Crime commis en raison d'un trouble mental 3) Incapacité à contrôler son comportement |
À quoi réfère l'inaptitude à subir un procès? | Incapacité mentale à comprendre la nature des accusations et le processus judiciaire. |
Comment trouver un test? | 1) Tests publiés (commerciaux), accès limité 2) Tests non publiés (recherche), disponibles dans articles, livres ou thèses |
Qu'est-ce qu'un score brut? | Résultat plus ou moins immédiat des réponses à un test, mais dépourvu de sens s'il n'est pas accompagné d'autres informations interprétatives. |
De kossé un score normalisé? | Score brut interprété à partir d'un ensemble de normes, c'est-à-dire la performance au test des membres d'un échantillon de normalisation. |
Quels sont les trois niveaux de générabilité des variables? | 1. Construit 2. Mesure 3. Score brute |
Qu'est-ce qu'une variable de construit? | Niveau le plus général de variable. Le concept théorique général qui est mesuré (ex.: anxiété composantes cognitive/émotive) |
Qu'est-ce la variable mesurée? | Définition opérationnelle de la variable. C'est de ses mesures que traite le domaine des tests psychologiques. |
Qu'est ce que la variable "données brutes"? | Concerne l'obtention de données brutes, chiffres résultant de l'application des mesures |
Pourquoi utiliser des nombres pour effectuer des mesures en psychologie? (4) | 1. Fournissent un moyen par lequel les individus sont classés systématiquement 2. Permet de faire des comparaisons intra et inter-individu 3. Facilite la communication des résultats 4. Pour se servir de leurs propriétés arithmétiques |
Quelles sont les quatre types d'échelles de variables? | 1. Échelle nominale 2. Échelle ordinale 3. Échelle à intervalle 4. Échelle de rapport (ou proportionnelle) |
Quelles sont les caractéristiques de l'échelle nominale? (2) | 1. La plus élémentaire 2. Permet de nommer, d'identifier des catégories de façon arbitraire (ex.: dépression majeure vs mineure) |
Quelles sont les caractéristiques de l'échelle ordinale? (2) | 1. Permet de mettre en ordre, en rang 2. Établie la relation "plus grand/petit que" entre les observations, sans préciser la distance qui les séparent (pas du tout, un peu, beaucoup, QI) |
Quelles sont les caractéristiques de l'échelle à intervalle? (2) | 1. Place les observations en ordre à une distance équivalente 2. Absence d'un zéro absolu (ex.: °C, cote Z) |
Quelles sont les caractéristiques de l'échelle de rapport? (1) | 1. Place les observations en ordre à une distance équivalente et avec un zéro absolu. (ex.: nbre de mots mémorisés) |
Pourquoi utiliser la méthode statistique en psychométrie? | Pour organiser et synthétiser les données quantitatives de sorte à en faciliter l'interprétation. |
Quelles sont les étapes de la méthode statistique en psychométrie? | 1) Résumer: organiser les scores sous forme de distribution de fréquences 2) Représenter graphiquement: illustrer visuellement la distribution de fréquences à l'aide d'une courbe |
Qu'est-ce que la moyenne (M)? | Valeur qui constitue la meilleure prédiction pour chaque valeur individuelle. |
Qu'est-ce que le mode (Mo)? | Le score le plus fréquent dans une distribution. |
Qu'est-ce que la médiane (Md)? | Le score qui sépare la distribution en deux parties égales. |
Pourquoi les mesures de tendance centrale ne sont-elles pas suffisantes pour bien représenter la distribution? | Deux distribution peuvent être très différentes tout en ayant le même mode/médiane/moyenne. |
Qu'est-ce qu'indiquent les mesures de tendance centrale? | Indice de la valeur vers laquelle tend l'ensemble des résultats. |
Qu'est-ce qu'une mesure de dispersion? | Indice du degré d'écart des résultats à la valeur de tendance centrale. |
Qu'est-ce que l'étendue (E)? | La valeur comprise entre le score le plus élevé et le score le plus faible. Tenir compte de chaque valeur discrète (ex.: score de 100 à 200 --> 99,5 à 200,5) Très influencée par les scores extrêmes |
Qu'est-ce que l'intervalle interquartile (I)? | Calcul de l'étendue de deux positions autour de la médiane. Distance séparant le 1er quartile du 3e quartile. N'est pas influencé par le poids des valeurs. Tiens compte de la position des valeurs plutôt que de leur grandeur relative. |
Qu'est-ce que la variance (ÉT2)? | La moyenne des déviations individuelles (de la moyenne) au carré. |
Qu'est-ce que l'écart-type (ÉT)? | La racine carré de la variance. Plus il est grand, plus les données sont dispersées autour de la moyenne. |
Pourquoi la mesure de dispersion est-elle fondamentale en psychométrie (3)? | - Caractérise les différences individuelles - Impliquée dans le calcul des normes - Permet de quantifié les sources nuisant à la fidélité/validité |
Sous quelles forment se présentent les distributions de caractéristiques humaines, de la taille du poids, habiletés, traits de personnalité? | Sous la forme d'une distribution normale. Plus l'échantillon est grand, plus la distribution s'en approche. |
Quelles sont les caractéristiques de la distribution normale? | 1. Égalité de la moyenne, de la médiane et du mode 2. Parfaite symétrie 3. Concentration des données autour de la moyenne avec une diminution relative à l'éloignement |
Qu'est-ce qu'une voussure? | Allure plus ou moins pointue de la distribution Leptokurtique: élancée, concentration des scores autour de M, Mesokurtique: situation intermédiaire, Platycurtique: aplatie, étalement des scores |
Qu'est-ce qu'un asymétrie? | Degré de symétrie entre les côtés droits et gauche. 1) Négative: forte répartition des scores vers la droite 2) Positive: forte répartition des scores vers la gauche |
Qu'est-ce que la modalité? | Le nombre de mode de la distribution. Unimodal, bimodal, multimodal |
Quel est le but des normes? | Fournir un cadre de référence uniforme et clairement défini pour interpréter les scores à un test psychologique. |
Comment sont construites les normes d'un test psychométrique? | À partir de la distribution des scores d'un groupe représentatif (échantillon de normalisation) Établi de façon empirique |
Qu'est-ce que représente les normes? | La performance au test des membres d'un échantillon de normalisation. Souvent conceptualisées dans le contexte de la courbe normale. |
Quelles sont les deux fonctions des normes? | 1) Comparaisons entre les individus, pour un même test 2) Comparaisons entre les tests, pour un même individu |
Quelles sont les deux grandes catégories de normes? | 1) Les normes de développement (niveau de développement atteint ex.: âge mental) 2) Les normes intra-groupe (position relative au sein d'un groupe de référence ex.: les centiles, scores T, Z) |
Que sont les normes de développement? | Normes donnant une signification aux résultats d'un test en décrivant l'étape atteinte par l'individu à l'intérieur d'une séquence de développement considéré "normale". |
Que supposent les normes de développement? | 1. que la caractéristiques mesurée se développe dans le temps 2. l'uniformité de la séquence chez tous les individus |
Quels sont les trois types de normes développementales? | 1. Âge mental (test d'intelligence) 2. Équivalents de niveau scolaire (rendement scolaire) 3. Échelles ordinales (fonctions spécifiques) |
En quoi consiste l'âge mental? | À établir le score moyen de la personne à des âges successifs. Suppose que les items du test sont regroupés par niveaux d'âge. En pratique, les scores bruts sont converti en âges mentaux à l'aide d'une table. |
Quelles sont les difficultés de l'évaluation de l'âge mental? | 1. Dispersion des performances individuelles (échec problème facile et réussite problème dur) 2. Variation de l'âge mentale n'est pas constante à tous les âges (dév. + rapide en bas âge), donc un retard d'un an est plus considérable à 2 ans qu'à 18 ans |
À quoi servent les équivalents de niveau scolaire? | 1. Interpréter les tests de rendement scolaire 2. Permet de décrire la performance d'un individu comme "équivalente" à celle des élèves de telle ou telle classe (déterminer ce qui est attendu pour le niveau scolaire) |
Comment sont établies les normes de classe? | En prenant le score moyen des élèves d'un classe |
Quelles sont les difficultés des équivalents de niveau scolaire? (2) | 1. Variations du contenu d'une classe à l'autre 2. Les scores peuvent facilement être mal interprétés (on ne sait pas comment ils sont répartis) |
Quel est l'objectif des échelles ordinales en terme de normes de développement? | Identifier le stade attein par un enfant dans le développement de fonctions comportementales spécifiques. L'âge est moins important, on s'intéresse au stade atteint. Suppose une séquence stricte de développement. |
Quelles sont les forces des normes développementales? | Facile à comprendre (ex.: un ado de 16 ans qui a les capacités mentales d'un enfant de 3 ans) |
Quelles sont les faiblesses des normes développementales? | 1) Usage restreint (s'applique seulement aux construits qui se développent) 2) Score plutôt rudimentaire 3) Se prêtent mal aux analyses statistiques 4) Surtout utiles pour les analyses descriptives de cas spécifiques |
En quoi consiste les normes intra-groupes? | Ces normes donnent une signification aux résultats d'un test en situant la performance d'un individu par rapport à la distribution de celle des membres d'un groupe normatif représentatif. |
Quels sont les avantages des normes intra-groupe? (2) | 1. Signification quantitative clairement définie et uniforme (contrairement n.dév.) 2. Se prêtent bien aux analysent statistiques |
Quels sont les deux types de normes intra-groupes? | 1. Les centiles (percentiles) 2. Les scores pondérés (Scores Z, scores T, stanines) |
À quoi correspond les centiles? | Au pourcentage d'individus de l'échantillon de normalisation qui a obtenu un score inférieur ou égal à un score brut donné. Il s'agit d'un score de position relative à un groupe. C0: score le plus faible C100: score le plus élevé |
Quelles sont les forces des centiles (3)? | 1. Facilité de calcul 2. Compréhension aisée 3. Applicables dans (à peu près) toutes les situations |
Quelles sont les faiblesses des centiles (2)? | 1. Déforment les distances entre les scores individuels (les unités sont inégales) 2. Lorsque la distribution est normale: exagération des différences près de la moyenne et rétrécissement des différences aux extrémités |
Qu'expriment les scores pondérés (ou standard)? | La différence entre un score individuel et la moyenne de l'échantillon de normalisation en prenant l'écart type de la distribution comme unité de mesure. |
Quelle est la différence entre la transformation linéaire et non linéaire? | Linéaire: préserve la distribution Non linéaire: transformer les scores de sorte qu'ils soient répartis normalement |
Que mesure les scores Z? | La variabilité, la dispersion ou l'étendue des scores. Expriment la distance de la personne de la moyenne. La distribution des scores Z possède toours les propriétés suivantes: M = 0 ÉT = 1 |
Quels sont les désavantages des scores Z (2)? | 1. Présence de scores négatifs 2. Nécessite l'usage de décimales (parce que l'étendue st fabile) |
Que sont les scores T? | Une transformation des scores Z permettant d'enlever les chiffres négatifs des scores Z. M = 50 et ÉT = 10 |
Que sont les stanines? | Une échelle en 9 points (sans décimale). M = 5 ÉT = 2. En pratique, on utilise le mode de conversion % --> stanine |
Qu'est-ce que le QI dérivé? | Mesure de quotient de l'âge mental sur l'âge chronologique X 100. |
Quelles sont les deux difficultés du QI dérivé? | 1. Pour comparer des QI à différents niveaux d'âge, les l'ÉT des autres distribution doit demeurer stable (polka) 2. Très difficile de construire des tests vraiment équivalent pour tous les âges |
Quelle est la solution au QI dérivé? | M = 100 et ÉT = 16, mais il ne s'agit plus d'un quotient. Tenir compte de l'ÉT choisi par les auteurs lors de l'interprétation d'n QI (distribution normale) ex.: QI < 70 = déficience Si ÉT = 12 --> 0,7% Si ÉT = 18 --> 5,1% |
Pourquoi faut-il faire attention avant de comparer deux tests portant le même nom (ex.: QI)? | Ils ne sont pas nécessairement comparables! Plusieurs facteurs sont à considérer: le contenu spécifique du test, les échelles de mesure, les caractéristiques de l'échantillon normatif. Consulter le manuel du test! |
Quelles sont les caractéristiques d'un bon échantillon normatif? | - Doit être suffisamment grand pour fournir des valeurs stables (pas trop d'erreur d'échantillonnage) Mais en réalité peu de normes sont vraiment générales, universelles, absolues et permanentes - Doit être représentatif de la population cible |
À quoi réfère la fidélité? | Réfère à la constance et à la reproductibilité des scores obtenus par les mêmes individus lorsqu'on administre... 1) le test à différentes occasions 2) un ensemble différent d'items jugés équivalents 3) le test sous différentes conditions |
De manière générale, comment mesure-t-on la fidélité? | S'intéresse au degré de correspondance ou à la relation entre 2 séries de scores prenant la forme d'un coefficient de corrélation |
Qu'est-ce que la fidélité idéale? | En principe, si on suppose que la caractéristique mesurée est insensible aux différents facteurs non pertinents, les scores obtenus devraient être identiques pour un individu donné dans diverses circonstances. |
Qu'est-ce que la fidélité réelle? | En pratique, les scores fluctuent. Ces fluctuations sont attribuées à l'erreur de mesure. (tous les instruments comportent un certain niveau d'erreur) |
Quelles sont les trois modèles théoriques utilisés pour aborder la notion de fidélité? | 1) Théorie classique des tests 2) Théorie de réponse à l'item 3) Théorie de la généralisabilité |
Que dit la théorie classique des tests? | Le score observé (O) est égal au score vrai (V) moins l'erreur de mesure (E) qui est la somme de toutes les influences aléatoires |
Que dit la théorie de réponse à l'item? | 1)Utilise la notion de précision de la mesure, laquelle peut varier en fonction des différents points de l'échelle. 2) Repose sur la notion de probabilité de réussir un item 3) Adresse la fidélité uniquement sous l'angle de la cohérence interne |
Quelle est la différence entre la théorie classique des tests et la théorie de réponse à l'item? | Contrairement à la théorie classique, la théorie de réponse à l'item ne considère pas que l'erreur de mesure est constante dépendamment des items. |
Que dit la théorie de la généralisabilité? | Adresse simultanément les différentes sources d'erreurs plutôt que de les cibler l'une après l'autre. (plusieurs reprises, plusieurs versions, corrigés par plusieurs) Limites pratiques évidentes |
Qu'est-ce que l'erreur de mesure? | Les fluctuations dans les scores aléatoire et non systématique. |
En quoi consiste l'analyse de la fidélité d'un test? | Consiste à déterminer jusqu'à quel point les différences individuelles observées au niveau des scores peuvent être attribuées à de "vraies" différences quant à la caractéristique mesuré (variance vraie) et à des erreurs de mesures (variance d'erreur) |
Dans quelles conditions certaines fluctuations peuvent-elles être vue comme "vraie"? | Dans les situations ou la caractéristique mesurée fluctue en fonction du temps (ex.: vigilance intellectuelle) |
Globalement, comment peut-on définir la variance? | Comme toutes les conditions non pertinentes à l'objectif d'un test |
Quelles sont les quatre sources importantes d'erreur de mesure? | 1) Type de correction du test 2) Contenu du test 3) Conditions d'administration du test 4) Circonstance personnelle de l'évalué |
Quelles sont les cinq types de fidélité qu'on calcul en pratique? | 1) Stabilité: variation temporelles 2) Équivalence: variations des contenus 3) Cohérence interne: variations des contenus 4. Homogénéité: variation des contenus 5) Fidélité entre les correcteurs: variations interjuges |
Est-ce qu'on peut dire qu'un test est fidèle en soi? | Non, la fidélité d'un test dépend du contexte d'utilisation. Il faut donc parler de la fidélité d'un certain instrument, administré à une certaine population sous certaines conditions. |
Qu'est-ce que doit préciser toute étude de fidélité? (3) | 1) Le type de fidélité évalué 2) Les conditions d'administrations 3) La population à laquelle réfère l'échantillon de l'étude |
Comment s'exprime un coefficient de corrélation (r)? | S'exprime en chiffre allant de -1,0 à +1,0 +1,0 = corrélation positive parfaite 0 = aucune corrélation présente - 1,0 = corrélation négative parfaite |
Que signifie d'avoir une corrélation de 0,84 entre deux tests censés mesurer le même concept? | Cela signifie que les "vraies" variation (différences individuelles) expliqueraient 84% des scores du test. |
Comment se catégorise les coefficients de corrélation? | 0,9 à 1,0: excellent 0,8 à 0,89 bonne 0,7 à 0,79 acceptable moins de 0,7 faible fidélité |
Pourquoi accepte-t-on des coefficients plus faible en recherche qu'en clinique? | Parce qu'en clinique, le résultat du test aura un impact directe et important sur l'évalué contrairement en recherche. |
À quoi réfère le niveau de signification de la corrélation? | Réfère au risque que nous sommes prêts à prendre de nous tromper en tirant une conclusion à partir de nos données. Genre erreur alpha |
Comment diffèrent les types de fidélité (2)? | 1. La source de variance d'erreur considérée 2. La méthode de mesure utilisée |
La fidélité test-retest permet d'évaluer quel type de fidélité? | La stabilité et la sensibilité aux variations temporelles lorsque la caractéristique mesurée est stable à l'intérieur de l'intervalle de temps considéré. |
Comment évalue-t-on la stabilité test retest? | Administration du même test aux mêmes personnes suite à un intervalle de temps. |
Qu'est-ce que le coefficient de fidélité pour la fidélité test-retest? | La corrélation entre les scores obtenus suite à la première et à la seconde administration du test (appelé aussi coefficient de stabilité) |
Qu'est-ce que la variance d'erreur pour la stabilité test-retest? | Lors d'un échantillonnage temporel, les fluctuations aléatoires des performances d'une session de passation à l'autre |
Quelles sont les sources d'erreurs réduisant la stabilité d'un test? | 1. Conditions d'administration mal contrôlées 2. Correction non uniforme 3. Changements mentaux et phyisques non pertinents chez l'examiné |
Pourquoi faut-il porté une attention particulière lorsqu'on choisi l'intervalle de temps entre les deux passations? | 1. Généralement, la corrélation diminue plus l'intervalle augmente 2. Déterminer si l'instabilité résulte de changements réels ou à des fluctuations non pertinentes (ex.: thermomètre) |
Quels sont les inconvénients de la fidélité test-retest? (3) | 1. S'applique surtout aux tests simples et court 2. Peut être difficile de déterminer l'intervalle de temps approprié 3. L'effet de pratique peut modifier de façon différentielle la performance (mémorisation, découverte de stratégie) |
Que permet d'évaluer la fidélité par version parallèle? | Permet d'évaluer l'équivalence du test. Cherche à déterminer dans quelle mesure les scores à un test dépendent des facteurs spécifiquement reliés à l'échantillon particulier de contenus représenté par ses items. |
Pourquoi s'intéresser à l'équivalence du test? | 1) Il existe un très grand nombre d'items possibles pour concevoir un test 2) Un échantillon d'items particulier peut favoriser certains examinés et en défavorisés d'autres |
Qu'indique l'équivalence d'un test? | Indique à quel point les scores fournis sont indépendants du contenu des items qui composent le test. |
Comment évalue-t-on l'équivalence d'un test? | On administre deux versions du même test aux mêmes sujets (avec ou sans délai si on veut évaluer stabilité). Les deux versions doivent être équivalentes ou très semblables |
Qu'est-ce que le coefficient de fidélité pour la fidélité par version parallèle? | La corrélation entre les scores obtenus pour chaque version du test (coefficient d'équivalence) |
Qu'est-ce que la variance d'erreur pour la fidélité par versions parallèles? | Échantillonnages des contenus: fluctuations aléatoires des performances d'une version du test à l'autre |
Quelles sont les sources d'erreur dans l'évaluation de la fidélité par versions parallèles? | 1) Échantillon particulier des items de chaque version 2) Autres sources identifiées das le cas de la stabilité |
Quels aspects devraient être identiques lorsqu'on construit des versions parallèles? | 1) Le nombre de questions 2) La forme de présentation 3) Le types de contenus 4) Les niveaux de difficulté 5) Les consignes et le cadre d'administration |
Quels sont les trois principaux inconvénients de la fidélité par versions parallèles? | 1) Lorsque la caractéristique est sensible à l'effet de pratique 2) Avoir passé une version du test influence le score de la deuxième version 3) Difficile de rédiger assez d'items afin de construire deux versions |
Sur quoi est basée la fidélité par cohérence interne? | Elle est basée sur la cohérence des réponses à tous les items du test, considérés simultanément. |
Qu'est-ce qu'indique la cohérence interne d'un test? | Indique suite à une seule passation à quel point les scores fournis sont indépendants du contenu spécifique des items qui composent le test (échantillonage des contenus) |
Quels sont les deux principaux type de fidélité par cohérence interne? | 1) Fidélité par bissection 2) Fidélité par cohérence inter-items |
Comment évaluer la fidélité par bissection? | On divise le test en deux parties "équivalentes" afin de calculer un sous-score pour chacune de ses parties |
Quel est le coefficient de fidélité pour la fidélité par bissection? | Corrélation entre les deux "sous-score" (coefficient pair-impair) |
Quelle est la variance d'erreur de la fidélité par bissection? | Fluctuations aléatoires des performances dues au choix particulier des items |
Quelle est la source d'erreur dans la fidélité par bissection? | L'échantillon particulier des items qui servent à calculer chaque sous-score |
Lors de la fidélité par bissection, pourquoi ne pouvons-nous pas simplement diviser le test en deux? (3) | 1) Les items difficiles sont souvent à la fin 2) Les candidats sont souvent fatigués pour les derniers items 3) La limite de temps risque d'influencer la performance de la deuxième partie |
Comment divise-t-on le questionnaire pour la fidélité par bissection? | La méthode la plus répandue consiste à comparer les items pairs et les items impairs |
Pourquoi utiliser la formule de Spearman-Brown dans la fidélité par bissection? | Parce que la corrélation entre les deux moitiés du test n'exprime pas la fidélité du test en entier. Plus on a d'items, plus la fidélité augmente |
Comment évalue-t-on la fidélité par cohérence inter-items? | Par un technique basée sur la cohérence des réponses à tous les items du test, considérés simultanément (Alpha de Cronbach) |
Qu'est-ce la variance d'erreur dans la fidélité par cohérence inter-items? | Fluctuations aléatoires des performances sur chacune des questions qui composent le test |
Quelles sont les sources d'erreur lors qu'on évalue la fidélité par cohérence inter-items? | 1) L'échantillon particulier des items 2) L'hétérogénéité des items |
Quand peut-on utiliser les formules de Kuder-Richardson? | 1) Items dichotomiques, bonne/mauvaise réponse (KR-20) 2) Items de même difficulté |
Qu'est-ce que le coefficient alpha, ou alpha de cronbach et que signifie-t-il? | Appelé parfois coefficient d'homogénéité, c'est une formule plus générale que KR. Plus il est élevé, plus les items mesurent sensiblement la même chose et sont cohérents avec le score global |
À quoi réfère le degré d'homogénéité d'un test? | Réfère au degré de cohérence entre les réponses fournies au différents items, i.e. à quel point chacun des items est une mesure de ce que le test dans son ensemble mesure |
Que faire si la caractéristique mesurée est hétérogène (ex.: intelligence)? | Lorsque la définition du test est détaillée sous plusieurs facettes, il faut élaborer plusieurs sous-tests homogènes les mesurant indépendamment afin de rendre l'interprétation non ambigue |
Que permet d'évaluer la fidélité inter-juges? | Si la personne qui évalue ou corrige engendre une certaine forme d'erreur. |
Pourquoi s'intéresser à la fidélité inter-juges (3)? | 1) Si les consignes sont plus souples, moins précises ou font appel au jugement 2) le biais introduits par examinateur/correcteur facilement contrôlable 3) Étroitement liée à l'objectivité des résultats |
Comment évaluer la fidélité inter-juges? | Deux (ou plus) personnes corrigent le même test de façon strictement indépendante |
Qu'est-ce que le coefficient de fidélité inter-juges? | La corrélation entre le score obtenu par le premier et le second correcteur (plusieurs correcteurs: coefficient de corrélation intraclasse (ICC)) |
Quelles sont les méthodes de mesure pour évaluer la variance d'erreur attribuée à l'échantillonnage temporel? | Test re-test, versions parallèles avec délai |
Quelles sont les méthodes de mesure pour évaluer la variance d'erreur attribuée à l'échantillonnage des contenus? | Versions parallèles, bissection, cohérence interne |
Qu'est-ce que l'erreur type de mesure (ÉTM)? | Façon d'exprimée la fidélité. Représente le degré de dispersion "théorique" (i.e. ÉT) des scores d'un individu qui passerait le test de façon répétée |
Comment se calcul l'erreur type de mesure (ÉMT)? | On calcul l'écart-type de la distribution des scores observées chez un même individu, laquelle est centrée sur le socre vrai. On calcul aussi l'intervalle de confiance |
Quels sont les deux avantages de l'erreur type de mesure? | 1. Relativise l'importance accordée à des valeurs numériques précises (plus un intervalle) 2. Importante quand on compare des scores (permet d'avoir un meilleur aperçu du score vrai) |
Quels sont les désavantages de l'erreur type de mesure? | 1. Ne permet pas de comparer la fidélité de tests différents 2. Il faut donc utiliser les coefficients de fidélité |
Comment améliorer la fidélité? | Adresser les sources d'erreur possibles (améliorer la standardisation de l'épreuve, améliorer les critères de cotation, contrôlant max variables, écarter items atypiques, améliorer échantillonnage d'items, augmenter nbre items) |
Quel est le concept le plus important et le plus fondamental en psychométrie? | La validité |
À quoi réfère la validité? | Réfère au degré avec lequel un test mesure ce qu'il est censé mesurer. Il n'y a pas de définition absolue, dépend du contexte d'utilisation du test et de son objectif |
Qu'est-ce qui constitue la démonstration empirique qu'un test mesure ce qu'il prétend mesurer et que les scores peuvent être interprétés de manières significatives à une fin particulière? | La validité |
Quelle est la forme la plus importante de validité? | La validité de construit |
En quoi consiste la validité de contenu? | À faire l'analyse du contenu du test afin de s'assurer qu'il est représentatif du concept visé. |
Quelles sont les deux questions principales de la validité de contenu? | 1) À quel point chaque item qui forme le test appartient à l'univers du construit défini 2) À quel point l'ensemble des items représente tous les aspects de cet univers |
Pourquoi la validité de contenu doit-elle être prise en considération à tout moment dans la construction d'un test? | Parce que la représentativité du test est jugée uniquement par rapport à la définition donnée1) À quel point chaque item qui forme le test appartient à l'univers du construit défini 2) À quel point l'ensemble des items représente tous les aspects de cet |
Mise à part le construit , quels autres éléments sont importants dans l'évaluation de la validité de contenu? | 1) La pertinence des réponses données par les examinés 2) L'échantillon non biaisé (bien représentatif) de l'univers possible des contenus 3)Certains aspects du construit se prêtent mieux aux questions que d'autres |
Quels sont les quatre problèmes associés à la validité de contenu? | 1) Définir clairement le domaine des items est ardu 2) Difficile d'évaluer le degré auquel les items couvrent les éléments des spécifications du contenu 3) Ne fais aucun lien avec les résultats réels du test 4) S'applique moins tests de personnalité |
Qu'est-ce que la validité apparente? | Correspond à ce que le test semble mesurer. N'est pas une véritable validité (non empirique), peut avoir un impact sur le climat de passation (indirectement). On l'évalue par les examinés eux-mêmes. |
Comment augmenter la validité apparente (2)? | 1) Modifier le format et la présentation visuelle du test 2) Modifier les questions afin qu'elles paraissent plus pertinentes |
Est-ce que la validité apparente améliore la validité objective d'un test? | Pas nécessairement mais peut indirectement avoir un impact. Elle n'est absolument pas un substitut à la validité objective. |
Qu'est-ce que la validité critériée? | Réfère à la relation entre les résultats au test et un autre critère considéré comme un important indicateur du construit à l'étude. |
Dans quel circonstance peut-on évaluer la validité critériée? | Dans tous les cas ou il existe une mesure indépendante de la caractéristique que le test est censer mesurer, i.e. un critère (externe). |
Comment évaluer la validité critériée? | En calculant la corrélation entre le résultat au test et le critère. |
Est-ce que la validité critériée évalue à quel point le test mesure le construit théorique? | Non, elle a pour but de prédire ou se situe l'examiné par rapport à ce critère. Le critère est souvent considéré comme une mesure directe de la caractéristique, comme le "score vrai". |
Pourquoi est-il important de bien choisir le critère externe? | Car il n'est pas insensible aux sources d'erreurs, s'il y a de l'erreur de mesure, le coefficient de validité sera afecté à la baisse |
Quels sont les deux types de validité critériée? | 1) La validité concomitante 2) La validité prédictive |
Qu'est-ce qui caractérise la validité concomitante? | 1) L'administration du test et la mesure sont simultanées 2) Concordance entre les résultats à un test et la valeur actuelle d'une autre mesure dont la validité est reconnue |
Qu'est-ce qui caractérise la validité prédictive? | 1) Administration du test précède d'un certain intervalle de temps la mesure du critère 2) Le test vise à prédire la valeur des critères à l'avenir |
Quelle est la différence au niveau de l'objectif de la validité concomitante et prédictive? | Concomitante: le test à valider sera utilisé à des fins de diagnostic Prédictive: le test à valider sera utilisé à des fins de pronostic |
Comment peut-on prédire le score au critère en fonction du score obtenu? | Lorsqu'on connait le coefficient de corrélation (de validité) entre les deux tests, on peut utiliser la formule de la roite: Y' = bX+a |
Qu'est-ce que l'erreur-type d'estimation? | Indice de la marge d'erreur dans la prévision de la position d'une variable selon la position de l'autre. |
Mise à part un autre test, que peut être le critère externe? | La composition d'un groupe, lorsqu'on souhaite démontrer que le test permet de différencié deux groupes. (diagnostic) |
Quel est l'impact de la dichotomisation du critère sur la validité critériée? | Rend la mesure de validité moins précise |
Comment choisi-t-on le critère? | Le choix du critère dépend des objectifs du test. Ex.: réussite d'un cours: appréciation des enseignants vs notes officielles |
Sous quelles conditions la validité critériée est-elle réalisable? | 1) S'il existe un critère, i.e. une mesure directe de la caractéristiques que le test est censé mesurer 2) Cette mesure du critère est peu sensible aux différentes formes d'erreurs de mesure (fidélité) |
Quelles sont les considérations particulières qu'on doit avoir lors de l'évaluation de la validité critériée? | 1) La fidélité du critère 2) La validité du critère (définition opérationnelle du critère et sa pertinence) 3) La contamination du critère (résultat du test influe sur la valeur du critère) |
Est-ce que la validité de construit est une méthode unique pour établir la validité d'un test? | Non, c'est une ensemble de méthodes qui vise à établir jusqu'à quel point le test fournit une mesure adéquate du construit qu'on prétend qu'il mesure. |
Comment s'établit la validité de construit? | C'est une accumulation progressive de données qui viennent appuyer l'hypothèse selon laquelle "le test mesure bien ce qu'il prétend mesurer" |
Qu'est-ce qui est nécessaire à la validité de construit d'un test? | 1) Une définition claire et explicite du construit qu'on prétend mesurer car elle s'établit en montrant la correspondance entre la théorie et certains faits qu'elle prédit 2) Avoir des bases/modèles théoriques auquel se référer |
Que doit spécifier la théorie sur laquelle repose le construit mesuré? | 1) La signification du construit 2) Comment se construit est relié (ou non) à d'autres construits 3) Comment ce construit est relié à certains comportements mesurables |
Quelles sont les diverses méthodes employées pour appuyer la validité de construit? | 1. L'analyse factorielle/structure interne du test 2. L'étude du processus de réponse 3. L'effet des variables expérimentales 4. Les changements développementaux 5. Les corrélations avec d'autres tests 6. La matrice multitraits-multiméthodes |
Qu'est-ce que l'analyse factorielle? | Une famille de techniques statistiques qui aident à déterminer les dimensions communes sous-jacentes aux résultats de nombreuses mesures ou items différents. |
Qu'est-ce que permet l'analyse factorielle? | 1) Peut être utilisée lorsque plusieurs tests sont administrés simultanément ou lorsqu'un test contient plusieurs items 2) Permet d'extraire des dimensions communes à certains tests et simplifie l'interprétation |
Quel est l'objectif de l'analyse factorielle? | Réduire un nombre important d'informations à quelques grandes dimensions. On tente d'expliquer la plus forte proportion de la variance par un nombre restreint de variables (facteurs) |
Qu'est-ce que la variable latente (analyse factorielle)? | Variables qui existent au plan conceptuel sel et qui ne sont pas mesurés (il faut se tourner vers la théorie pour interpréter les facteurs) |
Qu'est-ce que l'étude du processus de réponse? | Consiste à évaluer le processus qu'une personne suit pour répondre aux items d'un test. Ne constitue pas habituellement une démonstration solide et persuasive de la validité. (utilisé lorsqu'élément du processus dans cadre théorique) |
Qu'est-ce que l'effet des variables expérimentales? | La vérification expérimentale d'une hypothèse à propos d'un construit contribue à la validité de construit du test. (ex.: augmenter volontairement le niveau d'anxiété avant de passer un test d'anxiété) |
Pourquoi la vérification expérimentales d'une hypothèse à propos d'un construit est-elle importante? | L'absence de vérification expérimentale de l'hypothèse peut remettre en cause tant la validité du test que le modèle théorique qui engendre l'hypothèse. |
Qu'est-ce que l'étude des changements développementaux dans la validité de construit? | Lorsque le construit mesuré est lié en lui-même à une/des caractéristiques évidentes de l'individu comme l'âge, la mesure du construit doit être sensible à cette caractéristique. (ex.: démontrer que performance à un test d'intelligence corrélée avec âge) |
Qu'est-ce que la corrélation avec d'autres tests comme méthode pour évalué la validité de construit? | Calculer plusieurs corrélations entre les scores obtenus à ce test et ceux fournis par un ensemble d'autres tests. |
Qu'est-ce que la validité convergente comme objectif du calcul de la corrélations avec d'autres tests? | Montrer la présence de corrélations entre le test et d'autres tests qui sont supposés mesurer le même construit ou des construits théoriquement liés |
Qu'est-ce que la validité divergente (discriminante) comme objectif du calcul de la corrélations avec d'autres tests? | Montrer l'absence de corrélation entre le test et d'autres tests qui sont supposés mesurer des construits théoriquement indépendants. |
De manière générale, à quoi sert de faire des corrélations avec d'autres tests? | Montrer que notre test mesure le construit désiré et pas autre chose. (ex.: si on veut mesurer l'anxiété, il faut pas que ce soit extrêmement corrélé avec la dépression) |
En quoi les corrélations avec d'autres tests ressemblent à la validité critériée? | Dans les deux cas, le choix du critère a un impact direct sur la validité de notre test. Il faut choisir un test dont les bonnes propriétés psychométriques ont été démontrées! |
En quoi la fidélité des deux tests doit-elle être prise en considération dans le calcul des corrélations avec d'autres tests? | La fidélité d'un ou des deux tests limite la validité! Sinon, on ne peut pas savoir si la présence ou l'absence de corrélation est causé par de l'erreur de mesure ou réellement en raison des construits mesurer par les tests. |
Qu'est-ce que la matrice multitraits-multiméthodes? | Cette méthode vise à mesurer simultanément la fidélité, la validité convergente et la validité discriminante d'un test. Utilisée lorsqu'on veut évaluer deux ou plusieurs traits psychologiques à l'aide de deux ou plusieurs méthodes de mesures. |
Que doit-on montré afin d'obtenir une bonne validité de construit avec la matrice multitraits-multiméthodes? | Il faut que la validité convergente (corrélation entre deux tests mesurant le même trait par deux méthodes différentes) soit plus élevée que la validité divergente (corrélation entre deux tests mesurant des traits différents par la même méthode) |
Si on veut évaluer à quel point un élève maîtrise bien la matière présentée dans son cours de mathématiques, quel type de validité irons-nous évaluer? | Validité de contenu |
Si on veut prédire la réussite d'un élève du primaire en mathématique lorsqu'il sera au secondaire, quel type de validité irons-nous évaluer? | Validité critériée prédictive |
Si on veut savoir si un élève présente des difficultés d'apprentissage spécifique en mathématique, quel type de validité irons-nous évaluer? | Validité Critériée: concomitante |
Si on veut évaluée les "habiletés mathématiques" d'un élève, quel type de validité irons-nous évaluer? | Validité de construit |
Qu'est-ce que la validité de conséquence? | Renvoie aux conséquences de l'usage d'un test et de ses interprétations |
Qu'est-ce que la validité différentielle? | Renvoie à la validité d'un test pour les différents groupes de la population auxquels il sera appliqué. Concerne le biais des tests, i.e. à savoir si un test fonctionnne différemment selon les groupes |
Est-ce que les validités de contenu, critériée et de construit sont des catégories distinctes ayant des logiques indépendantes? | Non! Habituellement, on considère que la validité de construit est un concept général qui comprend les autres types de validité. |
Quelles sont les six grandes étapes de l'élaboration d'un test? | 1) Définition de l'objectif du test 2) Questions relatives à la conception préliminaire 3) Préparations des items 4) Analyse d'items 5) Étalonnage et programmation de recherches connexes 6. Préparation du matériel définitif et publication |
Quelles sont les quatre parties d'un item de test? | 1) Stimulus (consigne/question) 2) Format de réponse (ex.: choix de réponse) 3) Conditions de réponse à l'item (ex.: limite de temps) 4) Procédures de cotation (ex.: correct/incorrect) |
Quel est le format le plus populaire de réponse? | Les choix de réponse |
Quelles sont les caractéristiques auxquelles il faut penser lorsqu'on choisi un échelle Likert (en X point)? | 1. Volonté de permettre ou non l'indécision (pair vs impair) 2. Capacité à distinguer les nuances entre les points d'ancrage |
Qu'est-ce qui caractérise l'échelle visuelle analogique (ou échelle d'évaluation graphique)? | 1. Identification de la réponse n'importe ou le long de l'échelle entre deux adjectifs contraires 2. Réponse convertie sous forme numérique |
Quels sont les trois avantages des items à choix de réponse? | 1. Fidélité de la cotation (interjuges) 2. Optimisation temporelle (+ items = + fidèle) 3. Optimisation de la cotation (ex.: lecteur optique) |
Quels sont les autres termes pour items à développement? | Item à réponse construite, item à réponse ouverte, item à réponse libre |
Quels sont les trois avantages à l'utilisation d'items à développement? | 1. Facilitent l'observation du comportement et des processus associés au test (indice dans la façon de répondre) 2. Exploration de zones inhabituelles 3. Favorise une étude globale (décourage la mémorisation) |
Quels sont les deux grands objectifs de l'analyse d'items? | 1. Augmenter la fidélité du test 2. Augmenter la validité du test |
Que permet l'analyse d'items? | 1. Sélectionner les meilleurs items 2. Substituer les items qui offrent peu ou pas d'info 3. Réviser les items qui posent problème |
Quelles sont les trois étapes de l'analyse d'items? | 1) Programme de mise à l'essai 2) Analyse statistique 3) Sélection des items |
Quelles sont les trois pratiques courantes de l'analyse d'items? | 1) L'étude indépendante (étude menée dans le seul but d'analyser les items) 2) La méthode des ajouts (ajout d'items à un test existant) 3) L'analyse continue (usage répété d'un test auquel sont ajoutés de nouveaux items ensuite soumis à l'analyse) |
Quels sont les deux indices compris dans l'Analyse statistique des items? | 1) Indice de difficulté des items 2) Indice de discrimination des items |
Comment est calculé l'indice de difficulté des items? | Pourcentage de répondants qui ont répondu correctement à un item = pourcentage de réussite (élevé = facile, faible = difficile) |
Pourquoi calculer le pourcentage de réussite? (2) | 1) Sélectionner les items dont le niveau de difficulté est approprié à la situation 2) Identifier les différences individuelles (vise p = 50%, mais faire varier autour pour discriminer) |
À quoi réfère le pouvoir discriminant des items? | Réfère au degré de précision avec lequel un item considéré de façon isolée mesure bien ce que le test prétend mesurer et discrimine bien les individus sur la caractéristique que 'on souhaite mesurer. |
Comment s'exprime le pouvoir discriminant des items? | Degré de discrimination = D (plus D est grand, plus il discrimine entre les sujets ayant eu un score total élevé et ceux ayant eu un score total faible) |
En quoi consiste la sélection des items? | Consiste à choisir parmi tous les items préparés et mis à l'essai, ceux qui composeront le test à standardiser. |
Quelles sont les cinq lignes directrices quant à la sélection des items? | 1. Le nbre d'items est déterminant de la fidélité 2. Le niveau de difficulté moyen est fonction direct de la valeur de p des items 3. Souhaite items avec bon D 4. Relation importante entre p et la valeur max de D 5. Considération non statistiques |
Que doit-on faire lorsque le test est finalement élaboré et mis à l'essai? | Générer des normes (plan de normalisation ou d'étalonnage). À ce stade, le test (nbre d'items, conditions d'administration) ne devraient plus être changer jusqu'à sa publication |