dimanche 22 mai 2011

Etapes de creation d'une étude statistique

I) Formuler la question de recherche
Ex: montrer que les hommes sont plus grands que les femmes.

II) Transformer la question en une formulation statistique (quantitative)
La question doit se spécifier : 1 Outcome, 1 cible
A partir de là on va formuler le test d'hypothèse.

III) Définir H0 et H1
H1 étant ce que l'on veut prouver et H0 ce que l'on veut rejeter.
Ex: Je veux prouver que les hommes dépassent les femmes de 10cm
H0: mu(homme)-mu(femme)<=0
La puissance est maximale à l'égalité.
Toutefois je peux avoir un biais selon l'échantillonnage. Si j'ai prix des femmes suédoises et des hommes vietnamien, mon test est foireux car biaisé et pas représentatif de la population.

IV) Choix du design et définition du risque
Choisir un design, parallèle, cross over, ...

Risque que l'on est prêt à prendre sur l'erreur Type I (erreur alpha, ex:5%) : impact du hazard.
Ensuite on fixe l'erreur Type II (bêta): Ex 10% (probabilité d'atteindre la signification sur un écart donné).
La puissance du test est donnée par 1-bêta
Sur une taille d'échantillon fixe, plus l'écart entre H1 est petit plus la puissance sera faible. Cfr la fonction de puissance.

V) Collecte des données
On va collecter des données sur un échantillon dit EAS (Echantillonnage Aléatoire Simple) pour obtenir une p-value.
p-value: Probabilité que le hasard des tirages des unités statistiques produise un écart aussi important que celui observé dans les données.
A partir des données collectées on va construire une statistique de test, grâce à laquelle on va déterminer la p-value.

VI) Décision
On confronte la p-value à la borne que l'on s'est fixé et le chercheur décide de rejeter ou de garder l'hypothèse H0.
La décision n'appartient pas au statisticien mais au chercheur ou à l'expert du domaine concerné.