Skip to content

Commit 94b489e

Browse files
committed
polynomial regression with diabetes (B02Lb_reg_poly) revised
1 parent a26dcd4 commit 94b489e

File tree

7 files changed

+1281
-92
lines changed

7 files changed

+1281
-92
lines changed

inst/tutorials/B02La_reg_multi/B02La_reg_multi.Rmd

Lines changed: 25 additions & 25 deletions
Original file line numberDiff line numberDiff line change
@@ -1,7 +1,7 @@
11
---
22
title: "Régression linéaire multiple"
33
author: "Guyliann Engels & Philippe Grosjean"
4-
description: "**SDD II Module 2** Aborder la régression linéaire multiple dans R."
4+
description: "**SDD II Module 2** Résumé de lm et régression linéaire multiple."
55
tutorial:
66
id: "B02La_reg_multi"
77
version: 2.3.0/7
@@ -20,14 +20,14 @@ SciViews::R("model",lang = "fr")
2020
fat <- read("fat", package = "faraway")
2121
2222
# lm
23-
densi_lm1 <- lm(data = fat, density ~ abdom)
24-
lm_lin_result <- tidy(densi_lm1)
25-
lm_lin_param <- glance(densi_lm1)
23+
fat_lm1 <- lm(data = fat, density ~ abdom)
24+
lm_lin_result <- tidy(fat_lm1)
25+
lm_lin_param <- glance(fat_lm1)
2626
2727
# lm multi
28-
densi_lm2 <- lm(data = fat, density ~ abdom + hip)
29-
lm_mult_result <- tidy(densi_lm2)
30-
lm_mult_param <- glance(densi_lm2)
28+
fat_lm2 <- lm(data = fat, density ~ abdom + hip)
29+
lm_mult_result <- tidy(fat_lm2)
30+
lm_mult_param <- glance(fat_lm2)
3131
```
3232

3333
```{r, echo=FALSE}
@@ -40,20 +40,20 @@ BioDataScience2::learnr_server(input, output, session)
4040

4141
------------------------------------------------------------------------
4242

43-
**Ce tutoriel correspond à la version 2021-2022. Il est en cours de révision pour la version 2022-2023. Vous devez probablement penser à installer une version plus récente du package qui contient les exercices finalisés !**
44-
4543
## Objectifs
4644

47-
Le premier module vous a permis de vous familiariser avec la régression linéaire. Vous avez appris à interpréter une partie des résultats proposés par le résumé du modèle ainsi qu'à interpréter les graphiques d'analyses des résidus. Les objectifs de ce tutoriel sont :
45+
Le premier module vous a permis de vous familiariser avec la régression linéaire. Vous avez appris à interpréter une partie des résultats renvoyés dans le résumé du modèle, ainsi qu'à réaliser et interpréter les graphiques d'analyse des résidus. Les objectifs de ce tutoriel sont :
4846

49-
- Être capable de lire la sortie renvoyée par `summary()` lorsqu'il est appliqué à un objet **lm**.
47+
- Être capable de lire la sortie renvoyée par `summary()` pour un objet **lm**.
5048
- Maîtriser la régression linéaire multiple dans R avec la fonction `lm()`.
5149

5250
## Description des données
5351

5452
Le tableau de données `fat` traite du pourcentage de masse grasse sur 252 hommes. Les participants à cette étude ont été immergés afin de déterminer leur densité corporelle. Cette méthode bien que très fiable n'est pas des plus simples à mettre en place. Les scientifiques font donc appel à vous afin d'estimer la densité des participants à l'aide de mesures biométriques plus simples à obtenir.
5553

5654
```{r, echo = TRUE}
55+
SciViews::R("model",lang = "fr")
56+
5757
fat <- read("fat", package = "faraway")
5858
skimr::skim(fat)
5959
```
@@ -70,25 +70,25 @@ chart(data = fat, density ~ abdom) +
7070
Modélisez la densité (`density`) en fonction du tour de taille (`abdom`) sur les données du tableau `fat`.
7171

7272
```{r reglin_h2, exercise = TRUE}
73-
summary(densi_lm1 <- lm(data = ___, ___ ~ ___))
73+
summary(fat_lm1 <- lm(data = ___, ___ ~ ___))
7474
```
7575

7676
```{r reglin_h2-hint}
77-
summary(densi_lm1 <- lm(data = DF, FORMULA))
77+
summary(fat_lm1 <- lm(data = DF, FORMULA))
7878
7979
#### ATTENTION: Hint suivant = solution !####
8080
```
8181

8282
```{r reglin_h2-solution}
8383
## Solution ##
84-
summary(densi_lm1 <- lm(data = fat, density ~ abdom))
84+
summary(fat_lm1 <- lm(data = fat, density ~ abdom))
8585
```
8686

8787
```{r reglin_h2-check}
8888
grade_code("D'accord, on a maintenant une régression linéaire simple comme point de départ.")
8989
```
9090

91-
Analysez le tableau des résultats et répondez aux questions suivantes :
91+
Analysez le tableau des résultats et répondez aux questions suivantes :
9292

9393
```{r qu_reglin}
9494
quiz(
@@ -121,12 +121,12 @@ quiz(
121121
L'analyse des résidus n'est pas l'objectif de cette séance d'exercice. Prenez cependant le temps de critiquer chaque graphique.
122122

123123
```{r}
124-
chart$residuals(densi_lm1)
124+
chart$residuals(fat_lm1)
125125
```
126126

127127
## Régression linéaire multiple
128128

129-
Tentez de réaliser à présent une régression linéaire multiple afin d'améliorer votre modèle. Réalisez à présent un modèle de la densité (`density`) en fonction du tour de taille (`abdom`) et du tour de hanche (`hip`). Le graphique de la densité en fonction du tour de taille vous a été présenté précédemment. Vous trouverez ci-dessous le graphique de la densité en fonction du tour de hanches.
129+
Tentez de réaliser à présent une régression linéaire multiple afin d'améliorer votre modèle. Ajustez un modèle de la densité (`density`) en fonction du tour de taille (`abdom`) et du tour de hanche (`hip`). Le graphique de la densité en fonction du tour de taille vous a été présenté précédemment. Vous trouverez ci-dessous le graphique de la densité en fonction du tour de hanches.
130130

131131
```{r, echo = TRUE}
132132
chart(data = fat, density ~ hip) +
@@ -135,18 +135,18 @@ chart(data = fat, density ~ hip) +
135135

136136
```{r regmulti_h2, exercise = TRUE}
137137
# régression multiple
138-
summary(densi_lm2 <- lm(data = ___, ___ ~ ___))
138+
summary(fat_lm2 <- lm(data = ___, ___ ~ ___))
139139
```
140140

141141
```{r regmulti_h2-hint}
142-
summary(densi_lm2 <- lm(data = DF, Y ~ VAR1 + VAR2))
142+
summary(fat_lm2 <- lm(data = DF, Y ~ VAR1 + VAR2))
143143
144144
#### ATTENTION: Hint suivant = solution !####
145145
```
146146

147147
```{r regmulti_h2-solution}
148148
## Solution ##
149-
summary(densi_lm2 <- lm(data = fat, density ~ abdom + hip))
149+
summary(fat_lm2 <- lm(data = fat, density ~ abdom + hip))
150150
```
151151

152152
```{r regmulti_h2-check}
@@ -178,28 +178,28 @@ quiz(
178178
L'analyse des résidus n'est pas l'objectif de cette séance d'exercice. Prenez cependant le temps de critiquer chaque graphique.
179179

180180
```{r}
181-
chart$residuals(densi_lm2)
181+
chart$residuals(fat_lm2)
182182
```
183183

184184
## Choix du meilleur modèle
185185

186-
Vous venez de réaliser deux modèles. Il s'agit d'un cas particulier. Ces deux modèles sont imbriqués. Le premier modèle de la densité en fonction du tour de taille se nomme `densi_lm1` et le second modèle de la densité en fonction du tour de taille et du tour de hanche se nomme `densi_lm2`. Comment pourriez-vous départager ces deux modèles ? Outre l'analyse du résumé des modèles et des résidus, il existe des outils pour départager ces deux modèles. L'ANOVA ci-dessus vous permet de définir qu'il y a une différence significative entre ces deux modèles.
186+
Vous venez de réaliser deux modèles. Il s'agit d'un cas particulier. Ces deux modèles sont imbriqués. Le premier modèle de la densité en fonction du tour de taille se nomme `fat_lm1` et le second modèle de la densité en fonction du tour de taille et du tour de hanche se nomme `fat_lm2`. Comment pourriez-vous départager ces deux modèles ? Outre l'analyse du résumé des modèles et des résidus, il existe des outils pour départager ces deux modèles. L'ANOVA ci-dessus vous permet de définir qu'il y a une différence significative entre ces deux modèles.
187187

188188
```{r, echo = TRUE}
189-
anova(densi_lm1, densi_lm2)
189+
anova(fat_lm1, fat_lm2)
190190
```
191191

192192
Le critère d'Akaike est une métrique adaptée à la comparaison de modèles. Le meilleur modèle selon le critère d'Akaike est le modèle ayant obtenu la valeur la plus faible.
193193

194194
```{r}
195-
AIC(densi_lm1, densi_lm2)
195+
AIC(fat_lm1, fat_lm2)
196196
```
197197

198198
Suite à l'analyse des résumés des deux modèles, l'interprétation des graphiques des résidus et des valeurs du critère d'Akaike, le second modèle est plus performant afin de modéliser la densité des personnes étudiées.
199199

200200
## Conclusion
201201

202-
Vous venez de terminer votre séance d'exercices relative à la régression multiple.
202+
Vous venez de terminer votre séance d'exercices relative à la régression multiple. Vous êtes maintenant prêt à vous attaquer à un projet GitHub Classroom sur ce sujet.
203203

204204
```{r comm_noscore, echo=FALSE}
205205
question_text(

0 commit comments

Comments
 (0)