biostatistique

biostatistique

Comparaison échantillon vs population

0 appréciations
Hors-ligne
Bonjour,

Je cherche à comparer mon échantillon (n=50) à la population source (n=150). Je connais l'âge de l'ensemble des individus de l'échantillon et de l'ensemble des individus de la population source. La distribution ne me semble pas normale, impression confirmée par le test de Shapiro-Wilk (p < 2,2e-16).

Si j'ai bien compris ce chapitre, vous conseillez le test z dès un échantillon de 60, le test t de Student en dessous de 60 avec une distribution normale et ne précisez rien pour un échantillon inférieur à 60 avec une distribution non normale. Je me suis posée la question du test de Mann Whitney ou du test des rangs signés de Wilcoxon, mais j'ai de nombreux ex-aequo ...

Quel test statistique puis-je utiliser d'après vous ?

En vous remerciant de votre attention,
Cordialement

0 appréciations
Hors-ligne
Bonjour,

Désolé du délai de réponse. Au-delà du fait que j'étais en congés lorsque la question est arrivée, la réponse n'était pas simple !
La question est de savoir si ce que vous appelez "population source" est l'ensemble des individus dont vous disposez pour faire les expériences (auquel cas il s'agit déjà d'un échantillon de la population que vous cherchez à étudier) ou si c'est effectivement la population totale que vous cherchez à étudier (exemple : une promo entière des 5 classes d'un même lycée).
Je note qu'une distinction entre ces différents types de populations devra être faite sur ce blog puis dans une édition ultérieure de l'ouvrage (la 2e est en cours d'impression).
J'essaie donc d'envisager les situations qui me paraissent les plus probables.

En règle générale, les tests sur les rangs (Wilcoxon, Mann-Whitney, Friedman, Kruskall) sont à proscrire s'il y a de nombreux ex-aequo : ils sont très vite beaucoup plus faussés qu'un Student sur distribution s'écartant un peu de la normalité, surtout avec un échantillon de n=50, ce qui est déjà élevé (proche de 60).

Cas 1. Vous voulez décrire les propriétés de la population totale comprenant 150 individus. Dans ce cas il n'y a pas besoin d'extraire un échantillon de 50 : il suffit d'observer sa distribution, sa moyenne, son écart-type (celui de la fiche 15 et non celui qui comporte la correction de Bessel de la fiche 16), éventuellement ses indices d’asymétrie et d’aplatissement (Skewness et Kurtosis)...

Cas 2. Vous voulez extraire un échantillon de 50 individus de votre population de 150 individus pour effectuer une expérimentation (trop couteuse sur les 150) et vous voulez vérifier que l'échantillon (probablement un EAS) reflète correctement les propriétés de la population. Il n'existe pas de test destiné à démontrer une ressemblance. Dans ces cas, on utilise souvent un test (destiné à démontrer une différence) et on se contente du résultat si le résultat n'est pas significatif. Il n'y a donc pas de solution parfaite et chaque solution sera critiquable.
Je suggère donc d'utiliser un t de Student pour échantillons indépendants (on dépasse alors les n=30 par groupe, c'est donc un test z). Mais le fait que 50 individus soient communs aux 2 groupes risque d'attirer les critiques. Je pense donc qu'une comparaison entre les 50 individus de l'échantillon et les 100 individus restants serait plus convaincante et donc moins critiquable pour montrer qu'il n'y a pas de différence significative.

Cas 3. Les 150 individus sont déjà un échantillon de la population totale étudiée. Dans ce cas, je suggère d'utiliser un t de Student pour échantillons indépendants pour comparer les 50 individus de l'échantillon et les 100 individus restants (c'est aussi un test z car on dépasse encore les n=30 par groupe).

Quoi qu'il en soit, je pense qu'il ne faut pas utiliser le t de Student de la fiche 58 qui compare la moyenne d'un échantillon à celle d'une population car dans votre cas, seule la variance de l'échantillon serait prise en compte dans le calcul, or vous disposez de celle des 150 individus. Il serait dommage de se priver de cette information.

Si je n'ai pas répondu à votre question, n'hésitez pas à la reformuler.

Amicalement,
XN
Vous ne disposez pas des permissions nécessaires pour répondre à un sujet de la catégorie Questions.