biostatistique

biostatistique

plan complet vs croisé, plan incomplet vs hiérarchisé

0 appréciations
Hors-ligne
Bonjour,

Je ne saisis pas la différence entre les 2 concepts de plans expérimentaux suivants : 
- plan complet (p.28) : on teste toutes les combinaisons possibles de facteurs principaux.
- plan croisé (p.31) : dans le cas où on n'a que 2 facteurs principaux, toutes les combinaisons de modalités des 2 facteurs sont testées.

Du coup, je ne saisis pas non plus la différence entre un plan incomplet et un plan hiérarchisé, à moins que la différence entre les 2 ne tienne caractère choisi (incomplet) ou subi (hiérarchisé) des modalités des facteurs.

Une petite clarification ne serait pas de refus :)

J.

2 appréciations
Hors-ligne
Bonjour,
Un plan complet est dit "croisé". On peut considérer que les deux termes sont synonymes. Le terme "Plan croisé" est très peu utilisé mais plus intuitif que "complet". Ici, ce coté intuitif nous permettait d'introduire les plans "hiérarchisés" qui ne sont pas croisés mais "avec facteurs imbriqués". Enfin, les plans complets (et donc croisés) ne se limitent pas forcément à 2 facteurs, sauf qu'en expérimentation en recherche fondamentale, on tente d'en limiter le nombre (car des interaction entre 4 facteurs ou plus est généralement extrêmement difficile à interpréter lorsqu'elles apparaissent).
Très trivialement, on va définir les plans incomplets comme des plans... qui ne sont pas complets, c'est-à-dire pour lesquels on ne réussit pas à tester toutes les combinaisons de modalités.
("nested" en anglais)Les plans hiérarchisés sont des cas particuliers de plans incomplets. En plan hiérarchisés, on n'essaie même pas de croiser les modalités (généralement car c'est impossible) : les modalités d'un facteur sont imbriquées dans celles de l'autre facteur.
Schématiquement, pour étudier l'effet du facteur imbriqué, l'analyse statistique tentera de voir si la variance inter-modalités du facteur imbriqué dépasse la variance intra-modalités après neutralisation de la variance inter-modalités de l'autre facteur.
Hiérarchisé : le caractère est subi mais prévu, et contrôlé par l'augmentation du nombre de modalités du facteur imbriqué qui permet d'analyser les variances inter-modalités.
Incomplet : le caractère sera soit choisi dans le cas des plans expérimentaux industriels non abordés dans cet ouvrage (je travaille actuellement sur un ouvrage qui leur est destiné), soit subi en recherche fondamentale. S'il est subi et prévu, on tente de prévoir un plan hiérarchisé ou d'envisager une alternative qui relève parfois du bricolage. S'il est subi et imprévu, on tentera de trouver une alternative pour le traitement des données qui relèvera du bricolage ou on utilisera une méthode de modélisation (classique en plans industriels).
Exemple de plans incomplet subi prévu :
- j'étudie l'influence de la lignée de souris (Balb/c vs C57 Black 6) et de l'âge (jeunes vs adultes vs vieilles) sur la mémoire. Les Balb/c vivent moins longtemps que les Blacks. Je ne dispose donc pas de Vieilles Balb : le plans est incomplet et ne peut pas être hiérarchisé.
Exemple de plans incomplet subi imprévu :
- j'étudie les effets de 3 substances sur la mémoire (pour garder le même exemple). Chaque substance est un facteur à 2 modalités : présence / absence. Nous lançons une expérimentation à 2^3 = 8 combinaisons de modalités. Le plan est normalement complet. Il s'avère que la combinaison des substances 2 et 3 est toxique et létale. En fin d'expérience, il me manquera les groupes ayant pris les cocktails de substances 2+3 et 2+3+1. Je n'ai plus que 6 combinaisons de modalités... Pour traiter les résultats, le plan s'avère être incomplet, pas hiérarchisé... Bon courage pour trouver la solutions idéale de traitement et pour expliquer pourquoi vous avez pris telle ou telle option... Heureusement, c'est de la fiction, mais une fiction courante dans les laboratoires de biologie !
Amicalement,
Xavier Noguès



0 appréciations
Hors-ligne
Bonjour,

Intéressant, je vous remercie.
- plan complet = plan croisé
- plan non complet = plan incomplet
- plan hiérarchisé = plan incomplet où la non couverture de toutes les combinaisons de modalités des facteurs principaux est subie mais prévue et contrôlée.

Mais je suis un peu surpris que vos 2 récents exemples sur la mémoire ne puissent pas être qualifiés de hiérarchisés, car : 
- dans le 1er : on pourrait considérer que le facteur 'âge' est imbriqué dans le facteur 'lignée'
- dans le 2nd : on pourrait considérer que le facteur 'présence de substance 3' est imbriqué dans le facteur 'présence de substance 2'.

• Pour qualifier un plan de hiérarchisé, le côté 'subi' de la non couverture de toutes les combis de modalités des FP doit-il donc tenir à la définition des facteurs (et non à la survie des individus) ?

Pour clarifier ce que j'entends, je reprends l'exemple p.31 : 
Variable dépendante : qualité des épis de maïs
3 facteurs principaux : 
    - variété ∈ {blanc ; jaune ; roux}
    - zone ∈ {bio ; intensive}
    - fertilisant :
        ∈ {engrais A ; engrais B ; engrais C ; engrais D} si zone = 'intensive'
        ∈ {lisier ; algue ; corne} si zone = 'bio'
Le facteur 'fertilisant' est imbriqué dans le facteur 'zone', le plan est donc dit hiérarchisé. L'imbrication tient à la définition de la modalité 'bio' du facteur 'zone' (du bio avec engrais synthétique n'est pas du bio).

• S'il s'avèrait que par exemple la variété de maïs blanc meure en présence d'algues, alors ce plan ne pourrait plus être qualifié de hiérarchisé, est-ce bien ça ?

Amicalement,

J.

2 appréciations
Hors-ligne

Questions difficiles (mais intéressantes) car elles obligent à envisager l'interfaçage entre biologie (au sens très large incluant tout le vivant, de la biologie moléculaire à la sociologie) et mathématiques qui tentent de formaliser les problèmes concrets et de trouver des solutions applicables.

Pour qualifier un plan de hiérarchisé, le côté 'subi' de la non couverture de toutes les combis de modalités des FP doit-il donc tenir à la définition des facteurs (et non à la survie des individus) ?

Je ne comprends pas bien la question ; les facteurs relèvent d'un choix (voir d'un besoin). On décidera donc délibérément de mettre en œuvre un plan hiérarchisé ou pas. Si les individus d'un groupe ne survivent pas, ça relève d'une connaissance incomplète du sujet par celui qui planifie l'expérience. On pourra alors tenter de traiter les données comme celles d'un plan hiérarchisé, mais ça reste du bricolage a posteriori car si l'expérimentateur savait que tels individus allaient mourir, que le contenu de tels tubes allaient se vaporiser instantanément, il n'aurait pas mis en œuvre ces conditions expérimentales.
Il faut voir qu'un plan expérimental est conçu avant de se lancer dans les expériences. La perte de groupes peut mener à un traitement statistique inspiré de celui des plans hiérarchisés mais dans la rédaction du rapport, le scientifique pourra difficilement dire qu'il avait prévu la mort des individus et qu'il savait à l'avance qu'il allait faire un plan hiérarchisé.

Le facteur 'fertilisant' est imbriqué dans le facteur 'zone', le plan est donc dit hiérarchisé.

L'imbrication tient au fait que les modalités possibles en bio sont incompatibles avec les modalités possibles en intensif. En croisant des modalités bio avec des modalités d'engrais intensifs, on ne pourrait plus discriminer l'effet bio vs intensif, on ne répondrait donc pas à la question qu'on s'était posée.

• S'il s’avérait que par exemple la variété de maïs blanc meure en présence d'algues, alors ce plan ne pourrait plus être qualifié de hiérarchisé, est-ce bien ça ?

Le plan pourrait encore être qualifié de hiérarchisé car les modalités du bio ne se retrouvent pas en intensif et réciproquement. Fertilisant est toujours imbriqué dans zone. Par contre la perte d'un groupe entrainerait des difficultés (une improvisation et du bricolage) au moment du traitement statistique de l'interaction avec la variété car le facteur fertilisant n'est pas évalué de la même manière pour les trois variétés...

- dans le 1er : on pourrait considérer que le facteur 'âge' est imbriqué dans le facteur 'lignée'

Formellement non car certaines modalités de l'âge (jeunes et adultes) se retrouvent dans les deux modalités de lignée ; elles peuvent être croisées.
A posteriori, on peut tenter une analyse comme en plan hiérarchique en faisant comme si jeunes et adultes Balb sont de nature différente des jeunes et adultes Blacks... mais ce n'est pas totalement satisfaisant car on perd de l'information.

- dans le 2nd : on pourrait considérer que le facteur 'présence de substance 3' est imbriqué dans le facteur 'présence de substance 2'.

A priori non, car ce n'était par prévu avant l'expérience.
Formellement non car une partie des modalités peuvent être croisées (comme pour age x lignée).
A posteriori, tenter de traiter en plan hiérarchique va conduire à une grosse perte d'information (tout ce qui concerne les interactions), ce ne serait pas ma solution préférée.

Je viens lancer 2 prompts à ChatGPT : j’envoie par mail le résultat commenté.



0 appréciations
Hors-ligne
Merci beaucoup, c'est désormais clair.

L'intrication des facteurs ne tient pas à la survie des individus soumis à certaines combinaisons de modalités. Un plan expérimental est dit hiérachisé si toutes les combinaisons de modalités ne peuvent être logiquement couvertes (du fait de la définition des modalités des facteurs principaux).

En passant, d'après Consensus (que je vous recommande de privilégier à chatGPT et ses semblables, puisqu'il cite des publis), plan hiérarchisé et plan  complet ne s'opposent pas. Dans un plan hiérarchisé, tant que toutes les combinaisons logiquement possibles de modalités de facteurs sont couvertes, on peut apparemment parler de plan complet.

La canicule a bien commencé à Lyon...
Vous ne disposez pas des permissions nécessaires pour répondre à un sujet de la catégorie Questions.