1. Grâce à ce formulaire vous pouvez proposer une astuce ou un script sur R.
  2. Votre script doit pouvoir être lancé en l'état. Veuillez penser à :
    • inclure le chargement des "library" nécessaires
    • construire un petit jeu de données si besoin est.
    • commenter les lignes de codes pour en faciliter la compréhension.
  3. Le titre de votre script ou astuce doit être clair et explicite.
  4. Pensez à mettre votre code entre les balises [R] et [/R]; Pour cela, vous pouvez utiliser le bouton

Vous pouvez utiliser vos comptes Facebook, twitter ou google pour vous identifer (google est compatible yahoo, openID...)
L'ideal étant de vous connecter si vous avez un compte utilisateur, ou faire une demande de compte utilisateur si vous n'en avez pas encore.
Créer un compte va vous permettre de pouvoir éditer vos codes et de mettre en avant votre site internet.
Sinon vous pouvez soumettre anonymement en remplissant les champs ci-après.







Choisissez les catégories correspondantes à votre Code:

  • algorithmique
  • Analyse de survie
  • base indispensable
  • bayésien
  • configuration de R
  • exportation de données
  • fonctions utiles
  • graphique
  • importation de données
  • inférence
  • manipulation de données
  • message d'erreur
  • modélisation
  • Non classé
  • optimisation
  • planification
  • programmer avec R
  • regression linéaire
  • Test
  • tidyverse
  • Transformation de données


Comment comparer deux moyennes avec R grâce au test de Student ? t.test

0
dans Test

Le test de Student permet de tester l’égalité de deux moyennes. L’hypothèse H0 est « les moyennes sont égales » ou « la moyenne vaut une valeur x ».

Pour réaliser ce test il est nécessaire d’avoir un échantillonnage aléatoire de chaque individu et que les ces deux échantillons suivent une loi Normale. Pour tester l’hypothèse H0 on utilise la fonction t.test().

 
data(iris)
A<-subset(iris,Species=="setosa")[,2]
#On isole la 2ème colonne : la largeur des sépales
 
 

On commence par tester la normalité de cette variable grâce au test de Shapiro :

 
shapiro.test(A)
 
        Shapiro-Wilk normality test
 
data:  A
W = 0.9717, p-value = 0.2715
 
 

La p-value est supérieur à 0.05 on accepte donc l’hypothèse de normalité : la variable correspondant à la largeur des sépales suit donc une loi Normale.

On compare la moyenne de la variable et la valeur de 0.5 :

 
t.test(x=A,mu=0.5)
 
        One Sample t-test
 
data:  A
t = 54.6189, df = 49, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0.5
95 percent confidence interval:
 3.320271 3.535729
sample estimates:
mean of x
    3.428
 

Nous constatons que la p-value est bien supérieure à 0.05, nous rejetons donc l’hypothèse H0 : moy(Sepal.Width) = 0.05, la moyenne de cette variable est donc significativement différente de 0.05.

Nous comparons la moyenne de la longueur des sépales des espèces setosa et versicolor :

 
#On isole les 100 premières lignes qui correspondent aux données des espèces Setosa et Versicolor.
t.test(Sepal.Length~Species, data=iris[1:100,])
 
        Welch Two Sample t-test
 
data:  Sepal.Length by Species
t = -10.521, df = 86.538, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -1.1057074 -0.7542926
sample estimates:
    mean in group setosa mean in group versicolor
                   5.006                    5.936
 
 
La probabilité critique est inférieure à 0.05 (< 2.2e-16). Nous rejetons donc l’hypothèse H0 : moy(Sepal.Width)setosa = moy(Sepal.Width)versicolor. Cela signifie qu’en moyenne, la longueur des sépales est significativement différente d’une espèce à l’autre. La longueur des sépales dépend donc de l’espèce de l’Iris.

Proposé par Helene F.

Ce script vous à rendu service? remerciez l'auteur en votant ici:
- ça ne sert à rien -- c\'est interessant - (score de +7 sur 9 votes)
Loading ... Loading ...

Poster un commentaire


Votre email ne seras jamais communiqué champs requis désigné par une *

*
*


6 − deux =

Formation logiciel R