dimanche 16 janvier 2011

Les distributions dans R

La distribution uniforme
runif : random uniform : renvoit une série de nombre aléatoire compris entre les limites d’un intervalle
Y=runif(100,-2,2)
Renvoie dans Y 100 nombres aléatoires compris entre -2 et 2. Les paramètres sont le nombre de nombre aléatoire et la taille de l'intervalle dans laquelle les données seront tirées. Remarquez la fréquence d'une distribution uniform vaut 1 dans l'intervalle [0,1] et 0 partout ailleurs.
runif(1,0,1) correspond à la fonction rand() des langages de programmation courant (une seule valeur sera rendue).

La distribution normale
rnorm : random normal : renvoit une série de nombre aléatoire suivant une distribution normale de moyenne u et d’écart type s. Attention il s'agit de l'écart type, pas de la variance.
X=rnorm(100,0,1)
Dans ce cas de figure on ne précise pas les limites max et min elles sont déterminées par la distribution de probabilité de la fonction normale répondant aux paramètres entrés.

dnorm : donne un vecteur contenenant les fréquences de cette distribution.
ex:
Y=dnorm(x)
plot(Y) affichera une gaussienne de moyenne 0 et d'écart type 1.

qnorm(p, mu,sigma): donne la valeur du quantile. Soit la proposition P(x<=xq)=p, qnorm donnera la valeur de xq en fonction de p.
Dans le même ordre d'idée pnorm(xq,mu,sigma) donnera la p-value associée à xq dans la proposition précédente. Ces fonctions sont très utiles pour les réaliser des tests d'hypothèses dont la variance de la population théorique est connue.
Dans le cas contraire (variance inconnue), il est toujours possible d'utiliser pt(xq,df).
df étant le degré de liberté (n-1) dans le cas d'un test t, avec n étant la taille de l'échantillon. On suppose bien sur que la statistique de test donnant xq est une statistique standardisée.

Autres distributions :binom, chisq (khi carré), lnorm (log normale), pois, t, weibul, wilcoxon

Aucun commentaire:

Enregistrer un commentaire