You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
**Ce tutoriel correspond à la version 2021-2022. Il est en cours de révision pour la version 2022-2023. Vous devez probablement penser à installer une version plus récente du package qui contient les exercices finalisés !**
44
-
45
43
## Objectifs
46
44
47
-
Le premier module vous a permis de vous familiariser avec la régression linéaire. Vous avez appris à interpréter une partie des résultats proposés par le résumé du modèle ainsi qu'à interpréter les graphiques d'analyses des résidus. Les objectifs de ce tutoriel sont :
45
+
Le premier module vous a permis de vous familiariser avec la régression linéaire. Vous avez appris à interpréter une partie des résultats renvoyés dans le résumé du modèle, ainsi qu'à réaliser et interpréter les graphiques d'analyse des résidus. Les objectifs de ce tutoriel sont :
48
46
49
-
- Être capable de lire la sortie renvoyée par `summary()`lorsqu'il est appliqué à un objet **lm**.
47
+
- Être capable de lire la sortie renvoyée par `summary()`pour un objet **lm**.
50
48
- Maîtriser la régression linéaire multiple dans R avec la fonction `lm()`.
51
49
52
50
## Description des données
53
51
54
52
Le tableau de données `fat` traite du pourcentage de masse grasse sur 252 hommes. Les participants à cette étude ont été immergés afin de déterminer leur densité corporelle. Cette méthode bien que très fiable n'est pas des plus simples à mettre en place. Les scientifiques font donc appel à vous afin d'estimer la densité des participants à l'aide de mesures biométriques plus simples à obtenir.
Modélisez la densité (`density`) en fonction du tour de taille (`abdom`) sur les données du tableau `fat`.
71
71
72
72
```{r reglin_h2, exercise = TRUE}
73
-
summary(densi_lm1 <- lm(data = ___, ___ ~ ___))
73
+
summary(fat_lm1 <- lm(data = ___, ___ ~ ___))
74
74
```
75
75
76
76
```{r reglin_h2-hint}
77
-
summary(densi_lm1 <- lm(data = DF, FORMULA))
77
+
summary(fat_lm1 <- lm(data = DF, FORMULA))
78
78
79
79
#### ATTENTION: Hint suivant = solution !####
80
80
```
81
81
82
82
```{r reglin_h2-solution}
83
83
## Solution ##
84
-
summary(densi_lm1 <- lm(data = fat, density ~ abdom))
84
+
summary(fat_lm1 <- lm(data = fat, density ~ abdom))
85
85
```
86
86
87
87
```{r reglin_h2-check}
88
88
grade_code("D'accord, on a maintenant une régression linéaire simple comme point de départ.")
89
89
```
90
90
91
-
Analysez le tableau des résultats et répondez aux questions suivantes:
91
+
Analysez le tableau des résultats et répondez aux questions suivantes:
92
92
93
93
```{r qu_reglin}
94
94
quiz(
@@ -121,12 +121,12 @@ quiz(
121
121
L'analyse des résidus n'est pas l'objectif de cette séance d'exercice. Prenez cependant le temps de critiquer chaque graphique.
122
122
123
123
```{r}
124
-
chart$residuals(densi_lm1)
124
+
chart$residuals(fat_lm1)
125
125
```
126
126
127
127
## Régression linéaire multiple
128
128
129
-
Tentez de réaliser à présent une régression linéaire multiple afin d'améliorer votre modèle. Réalisez à présent un modèle de la densité (`density`) en fonction du tour de taille (`abdom`) et du tour de hanche (`hip`). Le graphique de la densité en fonction du tour de taille vous a été présenté précédemment. Vous trouverez ci-dessous le graphique de la densité en fonction du tour de hanches.
129
+
Tentez de réaliser à présent une régression linéaire multiple afin d'améliorer votre modèle. Ajustez un modèle de la densité (`density`) en fonction du tour de taille (`abdom`) et du tour de hanche (`hip`). Le graphique de la densité en fonction du tour de taille vous a été présenté précédemment. Vous trouverez ci-dessous le graphique de la densité en fonction du tour de hanches.
summary(densi_lm2 <- lm(data = DF, Y ~ VAR1 + VAR2))
142
+
summary(fat_lm2 <- lm(data = DF, Y ~ VAR1 + VAR2))
143
143
144
144
#### ATTENTION: Hint suivant = solution !####
145
145
```
146
146
147
147
```{r regmulti_h2-solution}
148
148
## Solution ##
149
-
summary(densi_lm2 <- lm(data = fat, density ~ abdom + hip))
149
+
summary(fat_lm2 <- lm(data = fat, density ~ abdom + hip))
150
150
```
151
151
152
152
```{r regmulti_h2-check}
@@ -178,28 +178,28 @@ quiz(
178
178
L'analyse des résidus n'est pas l'objectif de cette séance d'exercice. Prenez cependant le temps de critiquer chaque graphique.
179
179
180
180
```{r}
181
-
chart$residuals(densi_lm2)
181
+
chart$residuals(fat_lm2)
182
182
```
183
183
184
184
## Choix du meilleur modèle
185
185
186
-
Vous venez de réaliser deux modèles. Il s'agit d'un cas particulier. Ces deux modèles sont imbriqués. Le premier modèle de la densité en fonction du tour de taille se nomme `densi_lm1` et le second modèle de la densité en fonction du tour de taille et du tour de hanche se nomme `densi_lm2`. Comment pourriez-vous départager ces deux modèles ? Outre l'analyse du résumé des modèles et des résidus, il existe des outils pour départager ces deux modèles. L'ANOVA ci-dessus vous permet de définir qu'il y a une différence significative entre ces deux modèles.
186
+
Vous venez de réaliser deux modèles. Il s'agit d'un cas particulier. Ces deux modèles sont imbriqués. Le premier modèle de la densité en fonction du tour de taille se nomme `fat_lm1` et le second modèle de la densité en fonction du tour de taille et du tour de hanche se nomme `fat_lm2`. Comment pourriez-vous départager ces deux modèles ? Outre l'analyse du résumé des modèles et des résidus, il existe des outils pour départager ces deux modèles. L'ANOVA ci-dessus vous permet de définir qu'il y a une différence significative entre ces deux modèles.
187
187
188
188
```{r, echo = TRUE}
189
-
anova(densi_lm1, densi_lm2)
189
+
anova(fat_lm1, fat_lm2)
190
190
```
191
191
192
192
Le critère d'Akaike est une métrique adaptée à la comparaison de modèles. Le meilleur modèle selon le critère d'Akaike est le modèle ayant obtenu la valeur la plus faible.
193
193
194
194
```{r}
195
-
AIC(densi_lm1, densi_lm2)
195
+
AIC(fat_lm1, fat_lm2)
196
196
```
197
197
198
198
Suite à l'analyse des résumés des deux modèles, l'interprétation des graphiques des résidus et des valeurs du critère d'Akaike, le second modèle est plus performant afin de modéliser la densité des personnes étudiées.
199
199
200
200
## Conclusion
201
201
202
-
Vous venez de terminer votre séance d'exercices relative à la régression multiple.
202
+
Vous venez de terminer votre séance d'exercices relative à la régression multiple. Vous êtes maintenant prêt à vous attaquer à un projet GitHub Classroom sur ce sujet.
0 commit comments