biostatistique

biostatistique

Kappa de Cohen

0 appréciations
Hors-ligne
Bonjour,

Pour de grands échantillons, je trouve dans la littérature plusieurs formules différentes pour estimer la variance du kappa de Cohen (non pondéré), dans le but d'effectuer un test Z sur une valeur du kappa observé. Je n'ai pas encore trouvé la motivation de me taper le calcul (a priori le calcul exact serait dans un papier de Everitt 1968 mais ça semble bien crade).
- Cohen (1960, papier fondateur) puis Everitt (1968) donnent une formule ultra simple...
- ...immédiatement critiquée par les mêmes (1969) pour le fait qu'elle surestime la variance. Ils fournissent une autre formule plus précise
- Agresti (2002) en fournit une autre
- le package "irr" de R (kappa2) en utilise une autre, visiblement uniquement en kappa=0
...
1) Existe-t-il une approximation de la variance du kappa pour de grands échantillons qui fasse consensus ?

2) Auriez-vous un papier/bouquin qui prouve la convergence vers une loi normale de la distribution du kappa ?
Le kappa n'étant pas directement une somme ou une moyenne, le TCL ne suffit pas.

J.

2 appréciations
Hors-ligne
Bonjour,
Je ne vais pas pouvoir donner de réponses à ces deux questions. Je pense qu'il faudrait trouver un chercheur en psychologie (viser les auteurs psychologues de bouquins de stats) car le kappa de Cohen est vraiment propre à cette discipline. Un statisticien purement théorique pourrait probablement donner des réponses mais quelle valeur appliquée aurait-elle ? Je m'explique ; j'espère ne pas dire de bêtises...
Un kappa est une mesure de cohérence entre les réponses (binaires et donc qualitatives) de 2 évaluateurs concernant des sujets. Les individus statistiques sont ces sujets. Les deux évaluateurs sont en quelque sorte des instruments de mesure qui vont classer les individus en 2 classes. 
De mon point de vue, si je souhaitais faire des comparaisons, je m'orienterais vers les comparaisons de proportions, CPE de Fisher, X²... J'utiliserai plutôt le kappa comme un index de taille d'effet en essayant de trouver une échelle standard pour qualifier l'effet dans une première approche, puis de lâcher cette échelle dès que la connaissance des données et des populations me le permettrait.
Je ne suis pas entré dans les mathématiques de cet indicateur mais simplement par sa définition, je ne suis pas surpris qu'il ne puisse pas y avoir de consensus à son sujet. On a d'autres exemples de ce type en stats comme les statistiques de la MANOVA, ou plus proche du kappa : les indicateurs de taille d'effet souvent multiples pour une même mesure.
Désolé de cette réponse, je continue de penser au sujet...
Xavier Noguès
Vous ne disposez pas des permissions nécessaires pour répondre à un sujet de la catégorie Questions.