Save
Busy. Please wait.
Log in with Clever
or

show password
Forgot Password?

Don't have an account?  Sign up 
Sign up using Clever
or

Username is available taken
show password


Make sure to remember your password. If you forget it there is no way for StudyStack to send you a reset link. You would need to create a new account.
Your email address is only used to allow you to reset your password. See our Privacy Policy and Terms of Service.


Already a StudyStack user? Log In

Reset Password
Enter the associated with your account, and we'll email you a link to reset your password.
focusNode
Didn't know it?
click below
 
Knew it?
click below
Don't Know
Remaining cards (0)
Know
0:00
Embed Code - If you would like this activity on your web page, copy the script below and paste it into your web page.

  Normal Size     Small Size show me how

Psychométrie intra

Questions d'étude relatives au cours 1 à 6

QuestionAnswer
Qu'est-ce que la psychométrie? Une branche de la psychologie qui se consacre aux tests.
Quelles-sont les trois questions fondamentales de la psychométrie? 1) Comment interpréter les scores d'un test? (normes) 2) Quel est la stabilité du test? (fidélité) 3) Que mesure le test? (validité)
Qu'est-ce qu'un test (5)? 1) Une méthode ou un outil standardisé 2) Qui fournit de l'information 3) Sur un échantillon 4) De comportements ou de processus cognitifs 5) sous une forme quantifié
Nommez 5 grandes catégories de test. Test de rendement, test d'aptitudes intellectuelles, test de personnalité, mesure des intérêts et des attitudes, tests neuropsychologiques
Quels sont les quatre postulats de base de la psychométrie? 1) Les êtres humains se distinguent par des traits ou caractères importants 2) Ces traits peuvent être quantifiés 3) Ces traits sont assez stables 4) Les mesures de ces traits sont liées au comportement
Jusqu'à 1840, à quoi s'intéressaient les philosophes et quel type de tests prédominaient? Les philosophes s'intéressaient aux traits communs des humains et les tests oraux prédominaient.
Comment à évoluer la mise en place de la psychométrie de 1840 à 1880 (4)? 1) Intérêt pour la maladie mentale 2) Adoption des exaens écrits en milieu scolaire 3) Théorie d'évolution de Darwin 4) Établissement de la psychologie expérimentale
Qui sont les grands pionniers de l'enracinement de la psychométrie de 1880 à 1915 (4)? Galton, Cattell, Binet, Spearman
Qui est le fondateur de la psychométrie et comment a-t-il contribué à cette branche de la psychologie (3)? Francis Galton 1) Mesure des aptitudes intellectuelles 2) Souligne l'existence de variations héritées parmi les membres des espèces (distribution normale) 3)Pionniers dans l'élaboration des échelles auto-rapportées et l'enquête par questionnaire, etc.
Quelle a été la contribution de James McKeen Cattell? (4) 1) À l'origine des premiers tests mentaux 2) Élabore une batteries de tests mentaux 3) Fct intellectuelles peuvent être évaluées par des processus mentaux fondamentaux 4) Administré à des étudiants pour prédire leur réussite scolaire
Quelle a été la contribution de Charles Edward Spearman (3)? 1) Père de l'analyse factorielle 2) Souligne l'action d'un facteur commun à toutes les opérations psychologiques 3) Propose une théorie fondée sur les résultats aux tests
Qu'est-ce qui caractérise la période d'essort (1915-1940) de la psychométrie (2)? 1) Publication abondante de nouveaux tests 2) La publication de revues consacrées aux tests psychométriques et les tests d'intelligence?
Qu'est-ce qui caractérise la période de consolidation (1940-1965) (3)? 1) Révision de tests et création de nouveaux tests 2) Expansion des secteurs d'applications 3) Parution d'ouvrages importants
Qu'est-ce qui caractérise la période du récent passé (1965-2000)? (4) 1) Théorie classique des test vs théorie de réponse à l'item 2) Activisme législatif et judiciaire 3) Critique publique 4) Influence des ordinateurs
Qu'est-ce qui caractérise la période actuelle (2000 à aujourd'hui)? (4) 1) Augmentation du nombre et de la diversité des tests 2)Influence de la gestion intégrée des soins de santé 3)Administration des tests et communication des résultats en ligne 4) Informatisation de l'interprétation des tests
Quelle a été la contribution d'Alfred Binet? (4) 1) Père des tests d'aptitudes intellectuelles 2) Élaboration de l'échelle Binet-Simon visant à discriminer les étudiants 3) L'âge doit être utilisé comme facteur indépendant de la compétence intellectuelle 4) Le test donnait l'âge mental
Quelles sont les 5 caractéristiques des tests? 1) Échantillon de comportements/processus cognitif 2) Standardisation 3) Objectivité du test 4) Fidélité 5) Validité
Qu'est-ce qui détermine la représentativité de la mesure? Le nombre et la nature des items qui composent l'échantillon
Comment s'assure-t-on d'une bonne représentativité de la mesure? En montrant qu'il existe une correspondance entre les résultats au test et ce qu'il est censé prédire.
À quoi réfère la standardisation? Elle réfère à l'uniformité de la démarche d'administration et de correction du test
Qu'est-ce qui doit être les mêmes si on veut comparer des individus différents entre eux? Les conditions de passation
Nommez quelques exemples de conditions de passation standardisées? Matériel à utiliser, limites de temps, consignes orales, démonstration préliminaires, façon de répondre aux questions de l'examiné, rétroaction sur la performance de l'examiné, ton de la voix, expression faciale
Qu'est-ce qu'une norme et à quoi sert-elle? C'est un résultat moyen pour un groupe donné suite à la passation et à la correction standardisée. Elle corresponds à la performance de personnes typiques. Elle sert à interpréter un résultat en le comparant à celui d'autres individus.
À quoi réfère l'échantillon de standardisation (ou de normalisation)? Groupe de personnes qui a servi à l'établissement des normes.
Dans quelles conditions l'échantillon de standardisation n'est pas représentatif? Lorsque les conditions de passation du test ne sont pas les mêmes pour tous (non respect de la passation et la correction standardisée)
En théorie, en quoi l'administration, la correction et l'interprétation sont-elles objectives? (3) 1) Ne dépends pas de facteurs externes 2) Ne dépends pas de l'examinateur ou du correcteur 3) Certaines choses peuvent être faites pour assurer l'objectivité dans la construction d'un test
À quoi réfère la fidélité d'un test? À la reproductibilité des résultats obtenus à ce test. Il s'agit d'évaluer dans quelle mesure les résultats fournis sont contaminées par des erreurs aléatoires.
Comment évalue-t-on la stabilité temporelle? Fidélité par test-retest
Comment évalue-t-on l'équivalence entre deux tests? Fidélité par versions parallèles
Comment évalue-t-on la cohérence interne? Fidélité par bissection
Comment évalue-t-on l'homogénéité? Fidélité par la relation entre les items
Comment évalue-ton la fidélité entre les correcteurs? Fidélité inter-juge
À quoi réfère la validité? Au degré avec lequel celui-ci mesure ce qu'il a pour but de mesurer (dans une situation particulière donnée)
Comment évalue-t-on la validité? Avec des critères externes auxquels sont comparés les résultats obtenus au test. La force du lien (coefficient de corrélation) indique dans quelle mesure le test est valide.
Comment évalue-t-on la représentativité d'un échantillon? Validation de contenu
Comment évalue-t-on la relation avec un critère externe? Validation critériée
Comment évalue-t-on la cohérence avec la structure théorique? Validation de construit
Est-ce qu'un test peu fidèle peut être valide? Non, si la mesure contient trop d'erreurs aléatoires, elle peut difficilement prétendre mesurer ce qu'elle doit mesurer.
Est-ce qu'un test fidèle est automatiquement valide? Non, exemple de thermomètre
Comment les examinateurs doivent-ils se préparer (4) 1) Parfaite mémorisation des consignes verbales 2) Matériel bien préparé et installé 3) Excellente connaissance de la situation de testing 4) Capacité à identifier les facteurs spécifiques au testing influençant les résultats
À quoi les examinateurs doivent-ils faire attention lors du testing? 1) À l'environnement de testing 2) À ne pas être dérangé 3) Plusieurs autres facteurs (attitude, connaissance de l'examiné, présentation de l'instrument, etc.)
Quels sont les trois principes importants des conditions de testing? 1) Respect intégral des consignes fournies avec le test 2) Prise en note de toute condition inhabituelle 3) Considération des conditions lors de l'interprétation
Quels sont les éléments importants à l'établissement du climat interpersonnel lors de l'administration de test? 1) Mise en place d'un climat adéquat afin de susciter la performance optimale de l'examiné 2) Attention portée aux caractéristiques de l'examiné 3) Notation de tout écart aux conditions normales de motivation et considération dans l'interprétation
Quelles sont les quatre variables liées à la situation et à l'examinateur? 1) Comportement de l'examinateur avant ou pendant 2) Prophétie qui s'autoréalisent (attentes de l'examinateur) 3) Activités pratiquées par l'examiné avant le testage 4) Rétroaction sur la performance antérieur
Quel est l'impact de l'anxiété sur la performance? (3) 1) Les scores sont négativement affectés par l'anxiété 2) Mais la relation n'est pas linéaire (un peu d'anxiété est bénéfique) 3) Différences entre les personnes peu anxieuses et très anxieuses
Quel est l'impact de la composante émotionnelle de l'anxiété (l'émotivité) sur la performance? Peu d'effet sur la performance
Quel est l'impact de la composante cognitive de l'anxiété (l'inquiétude) sur la performance? Impact négatif sur la performance
Qu'est-ce que l'éthique? Principes et normes qui guident les conduites (suggestion)
Qu'est-ce que la déontologie? Éthique appliquée au profession libérale
Qu'est-ce qu'une loi? Ensemble des énoncés qui dicte ce qu'une personne doit et ne doit pas faire (obligation)
Quelles sont les trois sources principales éthiques en psychométrie? 1) L'OPQ 2) Norme et pratique du testing en psychologie et en éducation 3) Société canadienne de psychologie
Quels sont les cinq conditions d'utilisation éthique des tests? 1) Compétence 2) Consentement éclairé 3) Connaissance des résultats 4) Confidentialité 5) Protection des tests
Les psychologues doivent être compétents à l'égard de quoi? Des concepts comme les normes, la fidélité, la validité, l'élaboration de test et de la méthodologie des instruments (administration et correction)
Le psychologue doit faire preuve de compétence dans... 1) Le choix du test 2) L'administration et la correction du test 3) L'interprétation et la communication des résultats
Que doit faire le psychologue pour obtenir un consentement éclairé (5)? 1) Expliquer la nature et les objectifs du tests 2) Clarifier le rôle des tests 3) Expliquer la porter de l'interprétation du score 4) Doit être fait dans une forme et un langage adapté 5) L'examiné conserve le droit de retirer son consentement
Quelles sont les responsabilités de l'examinateur quant à la connaissance des résultats? 1) Responsable d'informer l'examiné des résultats obtenus de façon à qu'ils soient bien interprétés 2) Réglementation sur le partage des scores brutes, des QI, des protocoles de tests
À quoi servent les rapports d'évaluation? À consigner et communiquer des informations concernant l'évaluation et la prise en charge d'un client ainsi que l'évaluation de celui=-ci de façon structurée, standardisée et relativement objective
Quelle est la responsabilité des psychothérapeutes quant à la confidentialité? 1) Garder les résultats confidentiels, les préserver en lieu sûr et s'en défaire de façon approprié 2) Exception: danger imminent de mort ou de blessure
Quelle est la responsabilité des psychothérapeutes quant à la protection des tests (2)? 1) Le matériel de test doit être gardé en lieu sûr 2) Ne pas dévoiler le contenu des tests
Quels sont les quatre problèmes associés à la diffusion intégrale des tests? 1) Diminution de la validité 2) Nécessité de préparer continuellement de nouvelles versions 3) Augmentation des coûts 4) Diminution du contrôle de la qualité
Quelles sont les qualifications des utilisateurs/acheteurs de tests? Niveau A: formation minimale requise Niveau B: connaissance des caractéristiques techniques Niveau C: formation avancée en théorie des tests et dans les domaines pertinents
Quels sont les trois contextes qui font le liens entre les tests et la loi? 1) Emploi 2) Éducation 3) Contexte psycholégale
Que dis la loi 21? Balises pour l'évaluation des clientèles vulnérables (Ce n'est pas tout le monde qui a le droit d'évaluer)
Quelles sont les cinq applications utiles des tests à des fins juridiques? 1) Compétence du parent à assumer la garde d'un enfant 2) Prédiction de comportements violents ou à risque (dangerosité) 3) Nature et étendue de mauvais traitements 4) Aliénation mentale 5) Inaptitude à subir son procès
À quoi réfère l'aliénation mentale? État mental qui rend la personne incapable d'apprécier la nature et la gravité de son geste LORS DU CRIME
Quels sont les trois critères d'aliénation mentales? 1) Incapacité à distinguer le bien du mal au moment de l'acte 2) Crime commis en raison d'un trouble mental 3) Incapacité à contrôler son comportement
À quoi réfère l'inaptitude à subir un procès? Incapacité mentale à comprendre la nature des accusations et le processus judiciaire.
Comment trouver un test? 1) Tests publiés (commerciaux), accès limité 2) Tests non publiés (recherche), disponibles dans articles, livres ou thèses
Qu'est-ce qu'un score brut? Résultat plus ou moins immédiat des réponses à un test, mais dépourvu de sens s'il n'est pas accompagné d'autres informations interprétatives.
De kossé un score normalisé? Score brut interprété à partir d'un ensemble de normes, c'est-à-dire la performance au test des membres d'un échantillon de normalisation.
Quels sont les trois niveaux de générabilité des variables? 1. Construit 2. Mesure 3. Score brute
Qu'est-ce qu'une variable de construit? Niveau le plus général de variable. Le concept théorique général qui est mesuré (ex.: anxiété composantes cognitive/émotive)
Qu'est-ce la variable mesurée? Définition opérationnelle de la variable. C'est de ses mesures que traite le domaine des tests psychologiques.
Qu'est ce que la variable "données brutes"? Concerne l'obtention de données brutes, chiffres résultant de l'application des mesures
Pourquoi utiliser des nombres pour effectuer des mesures en psychologie? (4) 1. Fournissent un moyen par lequel les individus sont classés systématiquement 2. Permet de faire des comparaisons intra et inter-individu 3. Facilite la communication des résultats 4. Pour se servir de leurs propriétés arithmétiques
Quelles sont les quatre types d'échelles de variables? 1. Échelle nominale 2. Échelle ordinale 3. Échelle à intervalle 4. Échelle de rapport (ou proportionnelle)
Quelles sont les caractéristiques de l'échelle nominale? (2) 1. La plus élémentaire 2. Permet de nommer, d'identifier des catégories de façon arbitraire (ex.: dépression majeure vs mineure)
Quelles sont les caractéristiques de l'échelle ordinale? (2) 1. Permet de mettre en ordre, en rang 2. Établie la relation "plus grand/petit que" entre les observations, sans préciser la distance qui les séparent (pas du tout, un peu, beaucoup, QI)
Quelles sont les caractéristiques de l'échelle à intervalle? (2) 1. Place les observations en ordre à une distance équivalente 2. Absence d'un zéro absolu (ex.: °C, cote Z)
Quelles sont les caractéristiques de l'échelle de rapport? (1) 1. Place les observations en ordre à une distance équivalente et avec un zéro absolu. (ex.: nbre de mots mémorisés)
Pourquoi utiliser la méthode statistique en psychométrie? Pour organiser et synthétiser les données quantitatives de sorte à en faciliter l'interprétation.
Quelles sont les étapes de la méthode statistique en psychométrie? 1) Résumer: organiser les scores sous forme de distribution de fréquences 2) Représenter graphiquement: illustrer visuellement la distribution de fréquences à l'aide d'une courbe
Qu'est-ce que la moyenne (M)? Valeur qui constitue la meilleure prédiction pour chaque valeur individuelle.
Qu'est-ce que le mode (Mo)? Le score le plus fréquent dans une distribution.
Qu'est-ce que la médiane (Md)? Le score qui sépare la distribution en deux parties égales.
Pourquoi les mesures de tendance centrale ne sont-elles pas suffisantes pour bien représenter la distribution? Deux distribution peuvent être très différentes tout en ayant le même mode/médiane/moyenne.
Qu'est-ce qu'indiquent les mesures de tendance centrale? Indice de la valeur vers laquelle tend l'ensemble des résultats.
Qu'est-ce qu'une mesure de dispersion? Indice du degré d'écart des résultats à la valeur de tendance centrale.
Qu'est-ce que l'étendue (E)? La valeur comprise entre le score le plus élevé et le score le plus faible. Tenir compte de chaque valeur discrète (ex.: score de 100 à 200 --> 99,5 à 200,5) Très influencée par les scores extrêmes
Qu'est-ce que l'intervalle interquartile (I)? Calcul de l'étendue de deux positions autour de la médiane. Distance séparant le 1er quartile du 3e quartile. N'est pas influencé par le poids des valeurs. Tiens compte de la position des valeurs plutôt que de leur grandeur relative.
Qu'est-ce que la variance (ÉT2)? La moyenne des déviations individuelles (de la moyenne) au carré.
Qu'est-ce que l'écart-type (ÉT)? La racine carré de la variance. Plus il est grand, plus les données sont dispersées autour de la moyenne.
Pourquoi la mesure de dispersion est-elle fondamentale en psychométrie (3)? - Caractérise les différences individuelles - Impliquée dans le calcul des normes - Permet de quantifié les sources nuisant à la fidélité/validité
Sous quelles forment se présentent les distributions de caractéristiques humaines, de la taille du poids, habiletés, traits de personnalité? Sous la forme d'une distribution normale. Plus l'échantillon est grand, plus la distribution s'en approche.
Quelles sont les caractéristiques de la distribution normale? 1. Égalité de la moyenne, de la médiane et du mode 2. Parfaite symétrie 3. Concentration des données autour de la moyenne avec une diminution relative à l'éloignement
Qu'est-ce qu'une voussure? Allure plus ou moins pointue de la distribution Leptokurtique: élancée, concentration des scores autour de M, Mesokurtique: situation intermédiaire, Platycurtique: aplatie, étalement des scores
Qu'est-ce qu'un asymétrie? Degré de symétrie entre les côtés droits et gauche. 1) Négative: forte répartition des scores vers la droite 2) Positive: forte répartition des scores vers la gauche
Qu'est-ce que la modalité? Le nombre de mode de la distribution. Unimodal, bimodal, multimodal
Quel est le but des normes? Fournir un cadre de référence uniforme et clairement défini pour interpréter les scores à un test psychologique.
Comment sont construites les normes d'un test psychométrique? À partir de la distribution des scores d'un groupe représentatif (échantillon de normalisation) Établi de façon empirique
Qu'est-ce que représente les normes? La performance au test des membres d'un échantillon de normalisation. Souvent conceptualisées dans le contexte de la courbe normale.
Quelles sont les deux fonctions des normes? 1) Comparaisons entre les individus, pour un même test 2) Comparaisons entre les tests, pour un même individu
Quelles sont les deux grandes catégories de normes? 1) Les normes de développement (niveau de développement atteint ex.: âge mental) 2) Les normes intra-groupe (position relative au sein d'un groupe de référence ex.: les centiles, scores T, Z)
Que sont les normes de développement? Normes donnant une signification aux résultats d'un test en décrivant l'étape atteinte par l'individu à l'intérieur d'une séquence de développement considéré "normale".
Que supposent les normes de développement? 1. que la caractéristiques mesurée se développe dans le temps 2. l'uniformité de la séquence chez tous les individus
Quels sont les trois types de normes développementales? 1. Âge mental (test d'intelligence) 2. Équivalents de niveau scolaire (rendement scolaire) 3. Échelles ordinales (fonctions spécifiques)
En quoi consiste l'âge mental? À établir le score moyen de la personne à des âges successifs. Suppose que les items du test sont regroupés par niveaux d'âge. En pratique, les scores bruts sont converti en âges mentaux à l'aide d'une table.
Quelles sont les difficultés de l'évaluation de l'âge mental? 1. Dispersion des performances individuelles (échec problème facile et réussite problème dur) 2. Variation de l'âge mentale n'est pas constante à tous les âges (dév. + rapide en bas âge), donc un retard d'un an est plus considérable à 2 ans qu'à 18 ans
À quoi servent les équivalents de niveau scolaire? 1. Interpréter les tests de rendement scolaire 2. Permet de décrire la performance d'un individu comme "équivalente" à celle des élèves de telle ou telle classe (déterminer ce qui est attendu pour le niveau scolaire)
Comment sont établies les normes de classe? En prenant le score moyen des élèves d'un classe
Quelles sont les difficultés des équivalents de niveau scolaire? (2) 1. Variations du contenu d'une classe à l'autre 2. Les scores peuvent facilement être mal interprétés (on ne sait pas comment ils sont répartis)
Quel est l'objectif des échelles ordinales en terme de normes de développement? Identifier le stade attein par un enfant dans le développement de fonctions comportementales spécifiques. L'âge est moins important, on s'intéresse au stade atteint. Suppose une séquence stricte de développement.
Quelles sont les forces des normes développementales? Facile à comprendre (ex.: un ado de 16 ans qui a les capacités mentales d'un enfant de 3 ans)
Quelles sont les faiblesses des normes développementales? 1) Usage restreint (s'applique seulement aux construits qui se développent) 2) Score plutôt rudimentaire 3) Se prêtent mal aux analyses statistiques 4) Surtout utiles pour les analyses descriptives de cas spécifiques
En quoi consiste les normes intra-groupes? Ces normes donnent une signification aux résultats d'un test en situant la performance d'un individu par rapport à la distribution de celle des membres d'un groupe normatif représentatif.
Quels sont les avantages des normes intra-groupe? (2) 1. Signification quantitative clairement définie et uniforme (contrairement n.dév.) 2. Se prêtent bien aux analysent statistiques
Quels sont les deux types de normes intra-groupes? 1. Les centiles (percentiles) 2. Les scores pondérés (Scores Z, scores T, stanines)
À quoi correspond les centiles? Au pourcentage d'individus de l'échantillon de normalisation qui a obtenu un score inférieur ou égal à un score brut donné. Il s'agit d'un score de position relative à un groupe. C0: score le plus faible C100: score le plus élevé
Quelles sont les forces des centiles (3)? 1. Facilité de calcul 2. Compréhension aisée 3. Applicables dans (à peu près) toutes les situations
Quelles sont les faiblesses des centiles (2)? 1. Déforment les distances entre les scores individuels (les unités sont inégales) 2. Lorsque la distribution est normale: exagération des différences près de la moyenne et rétrécissement des différences aux extrémités
Qu'expriment les scores pondérés (ou standard)? La différence entre un score individuel et la moyenne de l'échantillon de normalisation en prenant l'écart type de la distribution comme unité de mesure.
Quelle est la différence entre la transformation linéaire et non linéaire? Linéaire: préserve la distribution Non linéaire: transformer les scores de sorte qu'ils soient répartis normalement
Que mesure les scores Z? La variabilité, la dispersion ou l'étendue des scores. Expriment la distance de la personne de la moyenne. La distribution des scores Z possède toours les propriétés suivantes: M = 0 ÉT = 1
Quels sont les désavantages des scores Z (2)? 1. Présence de scores négatifs 2. Nécessite l'usage de décimales (parce que l'étendue st fabile)
Que sont les scores T? Une transformation des scores Z permettant d'enlever les chiffres négatifs des scores Z. M = 50 et ÉT = 10
Que sont les stanines? Une échelle en 9 points (sans décimale). M = 5 ÉT = 2. En pratique, on utilise le mode de conversion % --> stanine
Qu'est-ce que le QI dérivé? Mesure de quotient de l'âge mental sur l'âge chronologique X 100.
Quelles sont les deux difficultés du QI dérivé? 1. Pour comparer des QI à différents niveaux d'âge, les l'ÉT des autres distribution doit demeurer stable (polka) 2. Très difficile de construire des tests vraiment équivalent pour tous les âges
Quelle est la solution au QI dérivé? M = 100 et ÉT = 16, mais il ne s'agit plus d'un quotient. Tenir compte de l'ÉT choisi par les auteurs lors de l'interprétation d'n QI (distribution normale) ex.: QI < 70 = déficience Si ÉT = 12 --> 0,7% Si ÉT = 18 --> 5,1%
Pourquoi faut-il faire attention avant de comparer deux tests portant le même nom (ex.: QI)? Ils ne sont pas nécessairement comparables! Plusieurs facteurs sont à considérer: le contenu spécifique du test, les échelles de mesure, les caractéristiques de l'échantillon normatif. Consulter le manuel du test!
Quelles sont les caractéristiques d'un bon échantillon normatif? - Doit être suffisamment grand pour fournir des valeurs stables (pas trop d'erreur d'échantillonnage) Mais en réalité peu de normes sont vraiment générales, universelles, absolues et permanentes - Doit être représentatif de la population cible
À quoi réfère la fidélité? Réfère à la constance et à la reproductibilité des scores obtenus par les mêmes individus lorsqu'on administre... 1) le test à différentes occasions 2) un ensemble différent d'items jugés équivalents 3) le test sous différentes conditions
De manière générale, comment mesure-t-on la fidélité? S'intéresse au degré de correspondance ou à la relation entre 2 séries de scores prenant la forme d'un coefficient de corrélation
Qu'est-ce que la fidélité idéale? En principe, si on suppose que la caractéristique mesurée est insensible aux différents facteurs non pertinents, les scores obtenus devraient être identiques pour un individu donné dans diverses circonstances.
Qu'est-ce que la fidélité réelle? En pratique, les scores fluctuent. Ces fluctuations sont attribuées à l'erreur de mesure. (tous les instruments comportent un certain niveau d'erreur)
Quelles sont les trois modèles théoriques utilisés pour aborder la notion de fidélité? 1) Théorie classique des tests 2) Théorie de réponse à l'item 3) Théorie de la généralisabilité
Que dit la théorie classique des tests? Le score observé (O) est égal au score vrai (V) moins l'erreur de mesure (E) qui est la somme de toutes les influences aléatoires
Que dit la théorie de réponse à l'item? 1)Utilise la notion de précision de la mesure, laquelle peut varier en fonction des différents points de l'échelle. 2) Repose sur la notion de probabilité de réussir un item 3) Adresse la fidélité uniquement sous l'angle de la cohérence interne
Quelle est la différence entre la théorie classique des tests et la théorie de réponse à l'item? Contrairement à la théorie classique, la théorie de réponse à l'item ne considère pas que l'erreur de mesure est constante dépendamment des items.
Que dit la théorie de la généralisabilité? Adresse simultanément les différentes sources d'erreurs plutôt que de les cibler l'une après l'autre. (plusieurs reprises, plusieurs versions, corrigés par plusieurs) Limites pratiques évidentes
Qu'est-ce que l'erreur de mesure? Les fluctuations dans les scores aléatoire et non systématique.
En quoi consiste l'analyse de la fidélité d'un test? Consiste à déterminer jusqu'à quel point les différences individuelles observées au niveau des scores peuvent être attribuées à de "vraies" différences quant à la caractéristique mesuré (variance vraie) et à des erreurs de mesures (variance d'erreur)
Dans quelles conditions certaines fluctuations peuvent-elles être vue comme "vraie"? Dans les situations ou la caractéristique mesurée fluctue en fonction du temps (ex.: vigilance intellectuelle)
Globalement, comment peut-on définir la variance? Comme toutes les conditions non pertinentes à l'objectif d'un test
Quelles sont les quatre sources importantes d'erreur de mesure? 1) Type de correction du test 2) Contenu du test 3) Conditions d'administration du test 4) Circonstance personnelle de l'évalué
Quelles sont les cinq types de fidélité qu'on calcul en pratique? 1) Stabilité: variation temporelles 2) Équivalence: variations des contenus 3) Cohérence interne: variations des contenus 4. Homogénéité: variation des contenus 5) Fidélité entre les correcteurs: variations interjuges
Est-ce qu'on peut dire qu'un test est fidèle en soi? Non, la fidélité d'un test dépend du contexte d'utilisation. Il faut donc parler de la fidélité d'un certain instrument, administré à une certaine population sous certaines conditions.
Qu'est-ce que doit préciser toute étude de fidélité? (3) 1) Le type de fidélité évalué 2) Les conditions d'administrations 3) La population à laquelle réfère l'échantillon de l'étude
Comment s'exprime un coefficient de corrélation (r)? S'exprime en chiffre allant de -1,0 à +1,0 +1,0 = corrélation positive parfaite 0 = aucune corrélation présente - 1,0 = corrélation négative parfaite
Que signifie d'avoir une corrélation de 0,84 entre deux tests censés mesurer le même concept? Cela signifie que les "vraies" variation (différences individuelles) expliqueraient 84% des scores du test.
Comment se catégorise les coefficients de corrélation? 0,9 à 1,0: excellent 0,8 à 0,89 bonne 0,7 à 0,79 acceptable moins de 0,7 faible fidélité
Pourquoi accepte-t-on des coefficients plus faible en recherche qu'en clinique? Parce qu'en clinique, le résultat du test aura un impact directe et important sur l'évalué contrairement en recherche.
À quoi réfère le niveau de signification de la corrélation? Réfère au risque que nous sommes prêts à prendre de nous tromper en tirant une conclusion à partir de nos données. Genre erreur alpha
Comment diffèrent les types de fidélité (2)? 1. La source de variance d'erreur considérée 2. La méthode de mesure utilisée
La fidélité test-retest permet d'évaluer quel type de fidélité? La stabilité et la sensibilité aux variations temporelles lorsque la caractéristique mesurée est stable à l'intérieur de l'intervalle de temps considéré.
Comment évalue-t-on la stabilité test retest? Administration du même test aux mêmes personnes suite à un intervalle de temps.
Qu'est-ce que le coefficient de fidélité pour la fidélité test-retest? La corrélation entre les scores obtenus suite à la première et à la seconde administration du test (appelé aussi coefficient de stabilité)
Qu'est-ce que la variance d'erreur pour la stabilité test-retest? Lors d'un échantillonnage temporel, les fluctuations aléatoires des performances d'une session de passation à l'autre
Quelles sont les sources d'erreurs réduisant la stabilité d'un test? 1. Conditions d'administration mal contrôlées 2. Correction non uniforme 3. Changements mentaux et phyisques non pertinents chez l'examiné
Pourquoi faut-il porté une attention particulière lorsqu'on choisi l'intervalle de temps entre les deux passations? 1. Généralement, la corrélation diminue plus l'intervalle augmente 2. Déterminer si l'instabilité résulte de changements réels ou à des fluctuations non pertinentes (ex.: thermomètre)
Quels sont les inconvénients de la fidélité test-retest? (3) 1. S'applique surtout aux tests simples et court 2. Peut être difficile de déterminer l'intervalle de temps approprié 3. L'effet de pratique peut modifier de façon différentielle la performance (mémorisation, découverte de stratégie)
Que permet d'évaluer la fidélité par version parallèle? Permet d'évaluer l'équivalence du test. Cherche à déterminer dans quelle mesure les scores à un test dépendent des facteurs spécifiquement reliés à l'échantillon particulier de contenus représenté par ses items.
Pourquoi s'intéresser à l'équivalence du test? 1) Il existe un très grand nombre d'items possibles pour concevoir un test 2) Un échantillon d'items particulier peut favoriser certains examinés et en défavorisés d'autres
Qu'indique l'équivalence d'un test? Indique à quel point les scores fournis sont indépendants du contenu des items qui composent le test.
Comment évalue-t-on l'équivalence d'un test? On administre deux versions du même test aux mêmes sujets (avec ou sans délai si on veut évaluer stabilité). Les deux versions doivent être équivalentes ou très semblables
Qu'est-ce que le coefficient de fidélité pour la fidélité par version parallèle? La corrélation entre les scores obtenus pour chaque version du test (coefficient d'équivalence)
Qu'est-ce que la variance d'erreur pour la fidélité par versions parallèles? Échantillonnages des contenus: fluctuations aléatoires des performances d'une version du test à l'autre
Quelles sont les sources d'erreur dans l'évaluation de la fidélité par versions parallèles? 1) Échantillon particulier des items de chaque version 2) Autres sources identifiées das le cas de la stabilité
Quels aspects devraient être identiques lorsqu'on construit des versions parallèles? 1) Le nombre de questions 2) La forme de présentation 3) Le types de contenus 4) Les niveaux de difficulté 5) Les consignes et le cadre d'administration
Quels sont les trois principaux inconvénients de la fidélité par versions parallèles? 1) Lorsque la caractéristique est sensible à l'effet de pratique 2) Avoir passé une version du test influence le score de la deuxième version 3) Difficile de rédiger assez d'items afin de construire deux versions
Sur quoi est basée la fidélité par cohérence interne? Elle est basée sur la cohérence des réponses à tous les items du test, considérés simultanément.
Qu'est-ce qu'indique la cohérence interne d'un test? Indique suite à une seule passation à quel point les scores fournis sont indépendants du contenu spécifique des items qui composent le test (échantillonage des contenus)
Quels sont les deux principaux type de fidélité par cohérence interne? 1) Fidélité par bissection 2) Fidélité par cohérence inter-items
Comment évaluer la fidélité par bissection? On divise le test en deux parties "équivalentes" afin de calculer un sous-score pour chacune de ses parties
Quel est le coefficient de fidélité pour la fidélité par bissection? Corrélation entre les deux "sous-score" (coefficient pair-impair)
Quelle est la variance d'erreur de la fidélité par bissection? Fluctuations aléatoires des performances dues au choix particulier des items
Quelle est la source d'erreur dans la fidélité par bissection? L'échantillon particulier des items qui servent à calculer chaque sous-score
Lors de la fidélité par bissection, pourquoi ne pouvons-nous pas simplement diviser le test en deux? (3) 1) Les items difficiles sont souvent à la fin 2) Les candidats sont souvent fatigués pour les derniers items 3) La limite de temps risque d'influencer la performance de la deuxième partie
Comment divise-t-on le questionnaire pour la fidélité par bissection? La méthode la plus répandue consiste à comparer les items pairs et les items impairs
Pourquoi utiliser la formule de Spearman-Brown dans la fidélité par bissection? Parce que la corrélation entre les deux moitiés du test n'exprime pas la fidélité du test en entier. Plus on a d'items, plus la fidélité augmente
Comment évalue-t-on la fidélité par cohérence inter-items? Par un technique basée sur la cohérence des réponses à tous les items du test, considérés simultanément (Alpha de Cronbach)
Qu'est-ce la variance d'erreur dans la fidélité par cohérence inter-items? Fluctuations aléatoires des performances sur chacune des questions qui composent le test
Quelles sont les sources d'erreur lors qu'on évalue la fidélité par cohérence inter-items? 1) L'échantillon particulier des items 2) L'hétérogénéité des items
Quand peut-on utiliser les formules de Kuder-Richardson? 1) Items dichotomiques, bonne/mauvaise réponse (KR-20) 2) Items de même difficulté
Qu'est-ce que le coefficient alpha, ou alpha de cronbach et que signifie-t-il? Appelé parfois coefficient d'homogénéité, c'est une formule plus générale que KR. Plus il est élevé, plus les items mesurent sensiblement la même chose et sont cohérents avec le score global
À quoi réfère le degré d'homogénéité d'un test? Réfère au degré de cohérence entre les réponses fournies au différents items, i.e. à quel point chacun des items est une mesure de ce que le test dans son ensemble mesure
Que faire si la caractéristique mesurée est hétérogène (ex.: intelligence)? Lorsque la définition du test est détaillée sous plusieurs facettes, il faut élaborer plusieurs sous-tests homogènes les mesurant indépendamment afin de rendre l'interprétation non ambigue
Que permet d'évaluer la fidélité inter-juges? Si la personne qui évalue ou corrige engendre une certaine forme d'erreur.
Pourquoi s'intéresser à la fidélité inter-juges (3)? 1) Si les consignes sont plus souples, moins précises ou font appel au jugement 2) le biais introduits par examinateur/correcteur facilement contrôlable 3) Étroitement liée à l'objectivité des résultats
Comment évaluer la fidélité inter-juges? Deux (ou plus) personnes corrigent le même test de façon strictement indépendante
Qu'est-ce que le coefficient de fidélité inter-juges? La corrélation entre le score obtenu par le premier et le second correcteur (plusieurs correcteurs: coefficient de corrélation intraclasse (ICC))
Quelles sont les méthodes de mesure pour évaluer la variance d'erreur attribuée à l'échantillonnage temporel? Test re-test, versions parallèles avec délai
Quelles sont les méthodes de mesure pour évaluer la variance d'erreur attribuée à l'échantillonnage des contenus? Versions parallèles, bissection, cohérence interne
Qu'est-ce que l'erreur type de mesure (ÉTM)? Façon d'exprimée la fidélité. Représente le degré de dispersion "théorique" (i.e. ÉT) des scores d'un individu qui passerait le test de façon répétée
Comment se calcul l'erreur type de mesure (ÉMT)? On calcul l'écart-type de la distribution des scores observées chez un même individu, laquelle est centrée sur le socre vrai. On calcul aussi l'intervalle de confiance
Quels sont les deux avantages de l'erreur type de mesure? 1. Relativise l'importance accordée à des valeurs numériques précises (plus un intervalle) 2. Importante quand on compare des scores (permet d'avoir un meilleur aperçu du score vrai)
Quels sont les désavantages de l'erreur type de mesure? 1. Ne permet pas de comparer la fidélité de tests différents 2. Il faut donc utiliser les coefficients de fidélité
Comment améliorer la fidélité? Adresser les sources d'erreur possibles (améliorer la standardisation de l'épreuve, améliorer les critères de cotation, contrôlant max variables, écarter items atypiques, améliorer échantillonnage d'items, augmenter nbre items)
Quel est le concept le plus important et le plus fondamental en psychométrie? La validité
À quoi réfère la validité? Réfère au degré avec lequel un test mesure ce qu'il est censé mesurer. Il n'y a pas de définition absolue, dépend du contexte d'utilisation du test et de son objectif
Qu'est-ce qui constitue la démonstration empirique qu'un test mesure ce qu'il prétend mesurer et que les scores peuvent être interprétés de manières significatives à une fin particulière? La validité
Quelle est la forme la plus importante de validité? La validité de construit
En quoi consiste la validité de contenu? À faire l'analyse du contenu du test afin de s'assurer qu'il est représentatif du concept visé.
Quelles sont les deux questions principales de la validité de contenu? 1) À quel point chaque item qui forme le test appartient à l'univers du construit défini 2) À quel point l'ensemble des items représente tous les aspects de cet univers
Pourquoi la validité de contenu doit-elle être prise en considération à tout moment dans la construction d'un test? Parce que la représentativité du test est jugée uniquement par rapport à la définition donnée1) À quel point chaque item qui forme le test appartient à l'univers du construit défini 2) À quel point l'ensemble des items représente tous les aspects de cet
Mise à part le construit , quels autres éléments sont importants dans l'évaluation de la validité de contenu? 1) La pertinence des réponses données par les examinés 2) L'échantillon non biaisé (bien représentatif) de l'univers possible des contenus 3)Certains aspects du construit se prêtent mieux aux questions que d'autres
Quels sont les quatre problèmes associés à la validité de contenu? 1) Définir clairement le domaine des items est ardu 2) Difficile d'évaluer le degré auquel les items couvrent les éléments des spécifications du contenu 3) Ne fais aucun lien avec les résultats réels du test 4) S'applique moins tests de personnalité
Qu'est-ce que la validité apparente? Correspond à ce que le test semble mesurer. N'est pas une véritable validité (non empirique), peut avoir un impact sur le climat de passation (indirectement). On l'évalue par les examinés eux-mêmes.
Comment augmenter la validité apparente (2)? 1) Modifier le format et la présentation visuelle du test 2) Modifier les questions afin qu'elles paraissent plus pertinentes
Est-ce que la validité apparente améliore la validité objective d'un test? Pas nécessairement mais peut indirectement avoir un impact. Elle n'est absolument pas un substitut à la validité objective.
Qu'est-ce que la validité critériée? Réfère à la relation entre les résultats au test et un autre critère considéré comme un important indicateur du construit à l'étude.
Dans quel circonstance peut-on évaluer la validité critériée? Dans tous les cas ou il existe une mesure indépendante de la caractéristique que le test est censer mesurer, i.e. un critère (externe).
Comment évaluer la validité critériée? En calculant la corrélation entre le résultat au test et le critère.
Est-ce que la validité critériée évalue à quel point le test mesure le construit théorique? Non, elle a pour but de prédire ou se situe l'examiné par rapport à ce critère. Le critère est souvent considéré comme une mesure directe de la caractéristique, comme le "score vrai".
Pourquoi est-il important de bien choisir le critère externe? Car il n'est pas insensible aux sources d'erreurs, s'il y a de l'erreur de mesure, le coefficient de validité sera afecté à la baisse
Quels sont les deux types de validité critériée? 1) La validité concomitante 2) La validité prédictive
Qu'est-ce qui caractérise la validité concomitante? 1) L'administration du test et la mesure sont simultanées 2) Concordance entre les résultats à un test et la valeur actuelle d'une autre mesure dont la validité est reconnue
Qu'est-ce qui caractérise la validité prédictive? 1) Administration du test précède d'un certain intervalle de temps la mesure du critère 2) Le test vise à prédire la valeur des critères à l'avenir
Quelle est la différence au niveau de l'objectif de la validité concomitante et prédictive? Concomitante: le test à valider sera utilisé à des fins de diagnostic Prédictive: le test à valider sera utilisé à des fins de pronostic
Comment peut-on prédire le score au critère en fonction du score obtenu? Lorsqu'on connait le coefficient de corrélation (de validité) entre les deux tests, on peut utiliser la formule de la roite: Y' = bX+a
Qu'est-ce que l'erreur-type d'estimation? Indice de la marge d'erreur dans la prévision de la position d'une variable selon la position de l'autre.
Mise à part un autre test, que peut être le critère externe? La composition d'un groupe, lorsqu'on souhaite démontrer que le test permet de différencié deux groupes. (diagnostic)
Quel est l'impact de la dichotomisation du critère sur la validité critériée? Rend la mesure de validité moins précise
Comment choisi-t-on le critère? Le choix du critère dépend des objectifs du test. Ex.: réussite d'un cours: appréciation des enseignants vs notes officielles
Sous quelles conditions la validité critériée est-elle réalisable? 1) S'il existe un critère, i.e. une mesure directe de la caractéristiques que le test est censé mesurer 2) Cette mesure du critère est peu sensible aux différentes formes d'erreurs de mesure (fidélité)
Quelles sont les considérations particulières qu'on doit avoir lors de l'évaluation de la validité critériée? 1) La fidélité du critère 2) La validité du critère (définition opérationnelle du critère et sa pertinence) 3) La contamination du critère (résultat du test influe sur la valeur du critère)
Est-ce que la validité de construit est une méthode unique pour établir la validité d'un test? Non, c'est une ensemble de méthodes qui vise à établir jusqu'à quel point le test fournit une mesure adéquate du construit qu'on prétend qu'il mesure.
Comment s'établit la validité de construit? C'est une accumulation progressive de données qui viennent appuyer l'hypothèse selon laquelle "le test mesure bien ce qu'il prétend mesurer"
Qu'est-ce qui est nécessaire à la validité de construit d'un test? 1) Une définition claire et explicite du construit qu'on prétend mesurer car elle s'établit en montrant la correspondance entre la théorie et certains faits qu'elle prédit 2) Avoir des bases/modèles théoriques auquel se référer
Que doit spécifier la théorie sur laquelle repose le construit mesuré? 1) La signification du construit 2) Comment se construit est relié (ou non) à d'autres construits 3) Comment ce construit est relié à certains comportements mesurables
Quelles sont les diverses méthodes employées pour appuyer la validité de construit? 1. L'analyse factorielle/structure interne du test 2. L'étude du processus de réponse 3. L'effet des variables expérimentales 4. Les changements développementaux 5. Les corrélations avec d'autres tests 6. La matrice multitraits-multiméthodes
Qu'est-ce que l'analyse factorielle? Une famille de techniques statistiques qui aident à déterminer les dimensions communes sous-jacentes aux résultats de nombreuses mesures ou items différents.
Qu'est-ce que permet l'analyse factorielle? 1) Peut être utilisée lorsque plusieurs tests sont administrés simultanément ou lorsqu'un test contient plusieurs items 2) Permet d'extraire des dimensions communes à certains tests et simplifie l'interprétation
Quel est l'objectif de l'analyse factorielle? Réduire un nombre important d'informations à quelques grandes dimensions. On tente d'expliquer la plus forte proportion de la variance par un nombre restreint de variables (facteurs)
Qu'est-ce que la variable latente (analyse factorielle)? Variables qui existent au plan conceptuel sel et qui ne sont pas mesurés (il faut se tourner vers la théorie pour interpréter les facteurs)
Qu'est-ce que l'étude du processus de réponse? Consiste à évaluer le processus qu'une personne suit pour répondre aux items d'un test. Ne constitue pas habituellement une démonstration solide et persuasive de la validité. (utilisé lorsqu'élément du processus dans cadre théorique)
Qu'est-ce que l'effet des variables expérimentales? La vérification expérimentale d'une hypothèse à propos d'un construit contribue à la validité de construit du test. (ex.: augmenter volontairement le niveau d'anxiété avant de passer un test d'anxiété)
Pourquoi la vérification expérimentales d'une hypothèse à propos d'un construit est-elle importante? L'absence de vérification expérimentale de l'hypothèse peut remettre en cause tant la validité du test que le modèle théorique qui engendre l'hypothèse.
Qu'est-ce que l'étude des changements développementaux dans la validité de construit? Lorsque le construit mesuré est lié en lui-même à une/des caractéristiques évidentes de l'individu comme l'âge, la mesure du construit doit être sensible à cette caractéristique. (ex.: démontrer que performance à un test d'intelligence corrélée avec âge)
Qu'est-ce que la corrélation avec d'autres tests comme méthode pour évalué la validité de construit? Calculer plusieurs corrélations entre les scores obtenus à ce test et ceux fournis par un ensemble d'autres tests.
Qu'est-ce que la validité convergente comme objectif du calcul de la corrélations avec d'autres tests? Montrer la présence de corrélations entre le test et d'autres tests qui sont supposés mesurer le même construit ou des construits théoriquement liés
Qu'est-ce que la validité divergente (discriminante) comme objectif du calcul de la corrélations avec d'autres tests? Montrer l'absence de corrélation entre le test et d'autres tests qui sont supposés mesurer des construits théoriquement indépendants.
De manière générale, à quoi sert de faire des corrélations avec d'autres tests? Montrer que notre test mesure le construit désiré et pas autre chose. (ex.: si on veut mesurer l'anxiété, il faut pas que ce soit extrêmement corrélé avec la dépression)
En quoi les corrélations avec d'autres tests ressemblent à la validité critériée? Dans les deux cas, le choix du critère a un impact direct sur la validité de notre test. Il faut choisir un test dont les bonnes propriétés psychométriques ont été démontrées!
En quoi la fidélité des deux tests doit-elle être prise en considération dans le calcul des corrélations avec d'autres tests? La fidélité d'un ou des deux tests limite la validité! Sinon, on ne peut pas savoir si la présence ou l'absence de corrélation est causé par de l'erreur de mesure ou réellement en raison des construits mesurer par les tests.
Qu'est-ce que la matrice multitraits-multiméthodes? Cette méthode vise à mesurer simultanément la fidélité, la validité convergente et la validité discriminante d'un test. Utilisée lorsqu'on veut évaluer deux ou plusieurs traits psychologiques à l'aide de deux ou plusieurs méthodes de mesures.
Que doit-on montré afin d'obtenir une bonne validité de construit avec la matrice multitraits-multiméthodes? Il faut que la validité convergente (corrélation entre deux tests mesurant le même trait par deux méthodes différentes) soit plus élevée que la validité divergente (corrélation entre deux tests mesurant des traits différents par la même méthode)
Si on veut évaluer à quel point un élève maîtrise bien la matière présentée dans son cours de mathématiques, quel type de validité irons-nous évaluer? Validité de contenu
Si on veut prédire la réussite d'un élève du primaire en mathématique lorsqu'il sera au secondaire, quel type de validité irons-nous évaluer? Validité critériée prédictive
Si on veut savoir si un élève présente des difficultés d'apprentissage spécifique en mathématique, quel type de validité irons-nous évaluer? Validité Critériée: concomitante
Si on veut évaluée les "habiletés mathématiques" d'un élève, quel type de validité irons-nous évaluer? Validité de construit
Qu'est-ce que la validité de conséquence? Renvoie aux conséquences de l'usage d'un test et de ses interprétations
Qu'est-ce que la validité différentielle? Renvoie à la validité d'un test pour les différents groupes de la population auxquels il sera appliqué. Concerne le biais des tests, i.e. à savoir si un test fonctionnne différemment selon les groupes
Est-ce que les validités de contenu, critériée et de construit sont des catégories distinctes ayant des logiques indépendantes? Non! Habituellement, on considère que la validité de construit est un concept général qui comprend les autres types de validité.
Quelles sont les six grandes étapes de l'élaboration d'un test? 1) Définition de l'objectif du test 2) Questions relatives à la conception préliminaire 3) Préparations des items 4) Analyse d'items 5) Étalonnage et programmation de recherches connexes 6. Préparation du matériel définitif et publication
Quelles sont les quatre parties d'un item de test? 1) Stimulus (consigne/question) 2) Format de réponse (ex.: choix de réponse) 3) Conditions de réponse à l'item (ex.: limite de temps) 4) Procédures de cotation (ex.: correct/incorrect)
Quel est le format le plus populaire de réponse? Les choix de réponse
Quelles sont les caractéristiques auxquelles il faut penser lorsqu'on choisi un échelle Likert (en X point)? 1. Volonté de permettre ou non l'indécision (pair vs impair) 2. Capacité à distinguer les nuances entre les points d'ancrage
Qu'est-ce qui caractérise l'échelle visuelle analogique (ou échelle d'évaluation graphique)? 1. Identification de la réponse n'importe ou le long de l'échelle entre deux adjectifs contraires 2. Réponse convertie sous forme numérique
Quels sont les trois avantages des items à choix de réponse? 1. Fidélité de la cotation (interjuges) 2. Optimisation temporelle (+ items = + fidèle) 3. Optimisation de la cotation (ex.: lecteur optique)
Quels sont les autres termes pour items à développement? Item à réponse construite, item à réponse ouverte, item à réponse libre
Quels sont les trois avantages à l'utilisation d'items à développement? 1. Facilitent l'observation du comportement et des processus associés au test (indice dans la façon de répondre) 2. Exploration de zones inhabituelles 3. Favorise une étude globale (décourage la mémorisation)
Quels sont les deux grands objectifs de l'analyse d'items? 1. Augmenter la fidélité du test 2. Augmenter la validité du test
Que permet l'analyse d'items? 1. Sélectionner les meilleurs items 2. Substituer les items qui offrent peu ou pas d'info 3. Réviser les items qui posent problème
Quelles sont les trois étapes de l'analyse d'items? 1) Programme de mise à l'essai 2) Analyse statistique 3) Sélection des items
Quelles sont les trois pratiques courantes de l'analyse d'items? 1) L'étude indépendante (étude menée dans le seul but d'analyser les items) 2) La méthode des ajouts (ajout d'items à un test existant) 3) L'analyse continue (usage répété d'un test auquel sont ajoutés de nouveaux items ensuite soumis à l'analyse)
Quels sont les deux indices compris dans l'Analyse statistique des items? 1) Indice de difficulté des items 2) Indice de discrimination des items
Comment est calculé l'indice de difficulté des items? Pourcentage de répondants qui ont répondu correctement à un item = pourcentage de réussite (élevé = facile, faible = difficile)
Pourquoi calculer le pourcentage de réussite? (2) 1) Sélectionner les items dont le niveau de difficulté est approprié à la situation 2) Identifier les différences individuelles (vise p = 50%, mais faire varier autour pour discriminer)
À quoi réfère le pouvoir discriminant des items? Réfère au degré de précision avec lequel un item considéré de façon isolée mesure bien ce que le test prétend mesurer et discrimine bien les individus sur la caractéristique que 'on souhaite mesurer.
Comment s'exprime le pouvoir discriminant des items? Degré de discrimination = D (plus D est grand, plus il discrimine entre les sujets ayant eu un score total élevé et ceux ayant eu un score total faible)
En quoi consiste la sélection des items? Consiste à choisir parmi tous les items préparés et mis à l'essai, ceux qui composeront le test à standardiser.
Quelles sont les cinq lignes directrices quant à la sélection des items? 1. Le nbre d'items est déterminant de la fidélité 2. Le niveau de difficulté moyen est fonction direct de la valeur de p des items 3. Souhaite items avec bon D 4. Relation importante entre p et la valeur max de D 5. Considération non statistiques
Que doit-on faire lorsque le test est finalement élaboré et mis à l'essai? Générer des normes (plan de normalisation ou d'étalonnage). À ce stade, le test (nbre d'items, conditions d'administration) ne devraient plus être changer jusqu'à sa publication
Created by: stoa07
Popular Psychology sets

 

 



Voices

Use these flashcards to help memorize information. Look at the large card and try to recall what is on the other side. Then click the card to flip it. If you knew the answer, click the green Know box. Otherwise, click the red Don't know box.

When you've placed seven or more cards in the Don't know box, click "retry" to try those cards again.

If you've accidentally put the card in the wrong box, just click on the card to take it out of the box.

You can also use your keyboard to move the cards as follows:

If you are logged in to your account, this website will remember which cards you know and don't know so that they are in the same box the next time you log in.

When you need a break, try one of the other activities listed below the flashcards like Matching, Snowman, or Hungry Bug. Although it may feel like you're playing a game, your brain is still making more connections with the information to help you out.

To see how well you know the information, try the Quiz or Test activity.

Pass complete!
"Know" box contains:
Time elapsed:
Retries:
restart all cards