biostatistique

biostatistique

Complément à la fiche 70. Un facteur doit-il être considéré comme fixe ou aléatoire ?

Un facteur doit-il être considéré comme fixe ou aléatoire ?
La décision de considérer un facteur comme aléatoire ou fixe est à réfléchir et il existe plu-
sieurs façons de considérer la question.
La vision traditionnelle considère que quand vous avez un intérêt particulier dans le facteur
étudié ou lorsque vous avez considéré la quasi totalité des états de ce facteur, alors le fac-
teur est considéré comme fixe. Il en est de même si vous vous intéressez à l’effet de chaque
traitement mais pas à la variance entre les traitements (sauf d’un point de vue technique
pour le calcul statistique). Par contre, considéré comme fixe, vous ne pourrez pas générali-
ser l’effet à des niveaux de traitement que vous n’avez pas mesuré.
Au contraire, vous considérerez un facteur comme aléatoire si les différents niveaux de
traitement du facteur ne vous intéressent pas ou s’ils constituent un sous-ensemble d’un
lot beaucoup plus large que vous auriez pu considérer pour votre étude. Les exemples clas-
siques de facteurs fixes sont le sexe, le genre, ou les variétés de pesticide d’une étude de
toxicologie. Les exemples classiques de facteurs aléatoires sont le temps (mois, jour, année
etc.), les lieux et les emplacements expérimentaux (bloc) ou d’autre unités d’espace au sein
duquel les mesures sont corrélées.
Deux autres arguments plus techniques doivent aussi être pris en considération.
Dans  les  modèles  qui  présentent  des  effets  aléatoires,  le  groupe  des  moyennes  corres-
pondant à chaque modalité du facteur aléatoire doit suivre une loi de distribution, généra-
lement la loi normale (ou parfois une loi de Bernoulli, de Poisson...). Ainsi, les moyennes
correspondant  aux  espèces  (dans  notre  cas)  sont  désormais  considérées  comme  issues
d’une réalisation aléatoire d’une distribution normale. Cette distribution est caractérisée par
ses 2 paramètres (moyenne et variance) qui dans ce cas s’appellent des hyperparamètres,
car ils gouvernent la réalisation des paramètres de moyenne et de variance dans chaque
échantillon de population. Si un facteur est considéré comme aléatoire, le modèle cherche
à estimer les hyperparamètres de la distribution commune. Les moyennes des modalités
constituent  donc  une  variable  aléatoire  à  partir  de  laquelle  sera  estimée  l’hypervariance
de la distribution. Donc même s’il n’est pas nécessaire d’avoir un nombre considérable de
niveau pour le facteur, il est toutefois préférable d’avoir au minimum entre 8 et 10 niveaux.
En effet, estimer une variance avec très de peu de valeurs ne permettra pas d’être assez
précis et pourrait fausser les estimations.
Un  argument  à  prendre  en  considération  consiste  à  considérer  le  «  coût  »  d’un  modèle
en termes de nombre de paramètres estimés. Pour l’exemple des crustacés, si l’on définit
l’espèce  comme  un  effet  fixe,  alors  nous  aurons  à  estimer  sept  paramètres  (nombre  de
modalités du facteur moins un), ce qui représente un coût élevé si nous ne nous intéressons
pas à cet effet. Une solution peut être alors de définir l’effet comme aléatoire.
Il y a donc trois raisons pour considérer un facteur comme aléatoire plutôt que fixe : 1) la
volonté de pouvoir extrapoler les inférences, 2) une meilleure considération de la stochas-
ticité  des  systèmes  (pour  les  mesures  répétées  par  exemple)  et  3)  des  estimations  plus
précises des paramètres d’un modèle.



22/02/2023
0 Poster un commentaire