Learnrs modules 2 & 3

phgrosjean · phgrosjean · commit 2e142f6701ae · 2025-10-02T15:39:51.000+02:00
diff --git a/inst/tutorials/B01La_reg_lin/B01La_reg_lin.Rmd b/inst/tutorials/B01La_reg_lin/B01La_reg_lin.Rmd
@@ -210,7 +210,7 @@ Complétez à présent les instructions ci-dessous afin de réaliser une régres
 ```{r bull_lm_h2, exercise=TRUE, exercise.lines=7, warning=FALSE}
 bull_lm <- lm(data = ___, ___ ~ ___)
 # Tableau résumé de la régression linéaire
-summary(___) |>
+summary_(___) |>
   tabularise()
 # Graphique de la régression
 ___(___)
@@ -219,7 +219,7 @@ ___(___)
 ```{r bull_lm_h2-hint-1, warning=FALSE}
 bull_lm <- lm(data = ___, ___ ~ age)
 # Tableau résumé de la régression linéaire
-summary(___) |>
+summary_(___) |>
   tabularise()
 # Graphique de la régression
 chart(___)
@@ -231,7 +231,7 @@ chart(___)
 ## Solution ##
 bull_lm <- lm(data = bull, weight ~ age)
 # Tableau résumé de la régression linéaire
-summary(bull_lm) |>
+summary_(bull_lm) |>
   tabularise()
 # Graphique de la régression
 chart(bull_lm)
diff --git a/inst/tutorials/B01Lb_residuals/B01Lb_residuals.Rmd b/inst/tutorials/B01Lb_residuals/B01Lb_residuals.Rmd
@@ -150,7 +150,7 @@ Réalisez à présent la régression linéaire demandée de la variable `area` e
 ```{r rice_lm_h2, exercise=TRUE, warning=FALSE}
 rice_lm <- lm(data = ___, ___ ~ ___) 
 # Résumé de la régression linéaire
-summary(___) |>
+summary_(___) |>
   tabularise()
 # Graphique de la régression
 chart(___)
@@ -159,7 +159,7 @@ chart(___)
 ```{r rice_lm_h2-hint-1, warning=FALSE}
 rice_lm <- lm(data = rice, ___ ~ ___) 
 # Résumé de la régression linéaire
-summary(rice_lm) |>
+summary_(rice_lm) |>
   tabularise()
 # Graphique de la régression
 chart(rice_lm)
@@ -171,7 +171,7 @@ chart(rice_lm)
 ## Solution ##
 rice_lm <- lm(data = rice, area ~ major_axis_length) 
 # Résumé de la régression linéaire
-summary(rice_lm) |>
+summary_(rice_lm) |>
   tabularise()
 # Graphique de la régression
 chart(rice_lm)
diff --git a/inst/tutorials/B02La_reg_multi/B02La_reg_multi.Rmd b/inst/tutorials/B02La_reg_multi/B02La_reg_multi.Rmd
@@ -15,6 +15,38 @@ runtime: shiny_prerendered
 ```{r setup, include=FALSE}
 BioDataScience2::learnr_setup()
 SciViews::R("model",lang = "fr")
+# Required for RSConnect
+# SciViews::R
+library(rlang)
+library(data.table)
+library(ggplot2)
+library(tibble)
+library(tidyr)
+library(dplyr)
+library(dtplyr)
+library(broom)
+library(forcats)
+library(collapse)
+library(fs)
+library(data.trame)
+library(svFast)
+library(svTidy)
+library(svMisc)
+library(svBase)
+library(svFlow)
+library(data.io)
+library(chart)
+library(tabularise)
+library(SciViews)
+# ... more
+library(readxl)
+library(testthat)
+library(equatags)
+# 'model' and 'infer' packages
+library(modelit)
+library(distributional)
+library(inferit)
+library(faraway)
 
 # fat dataset
 fat <- read("fat", package = "faraway")
@@ -95,18 +127,18 @@ chart(data = fat, density ~ abdom) +
 Ajustez maintenant une régression linéaire simple de `density` en fonction de `abdom` du jeu de données `fat`. Vous placerez le résultat dans `fat_lm1` et vous imprimerez le résumé.
 
 ```{r reglin_h2, exercise=TRUE}
-summary(fat_lm1 <- lm(data = ___, ___ ~ ___))
+summary_(fat_lm1 <- lm(data = ___, ___ ~ ___))
 ```
 
 ```{r reglin_h2-hint}
-summary(fat_lm1 <- lm(data = DF, FORMULA))
+summary_(fat_lm1 <- lm(data = DF, FORMULA))
 
 #### ATTENTION: Hint suivant = solution !####
 ```
 
 ```{r reglin_h2-solution}
 ## Solution ##
-summary(fat_lm1 <- lm(data = fat, density ~ abdom))
+summary_(fat_lm1 <- lm(data = fat, density ~ abdom))
 ```
 
 ```{r reglin_h2-check}
@@ -177,18 +209,18 @@ La corrélation linéaire entre `density` et `abdom` est bonne. Elle l'est moins
 
 ```{r regmulti_h2, exercise=TRUE}
 # régression multiple
-summary(fat_lm2 <- lm(data = ___, ___ ~ ___))
+summary_(fat_lm2 <- lm(data = ___, ___ ~ ___))
 ```
 
 ```{r regmulti_h2-hint}
-summary(fat_lm2 <- lm(data = DF, Y  ~ VAR1 + VAR2))
+summary_(fat_lm2 <- lm(data = DF, Y  ~ VAR1 + VAR2))
 
 #### ATTENTION: Hint suivant = solution !####
 ```
 
 ```{r regmulti_h2-solution}
 ## Solution ##
-summary(fat_lm2 <- lm(data = fat, density ~ abdom + thigh))
+summary_(fat_lm2 <- lm(data = fat, density ~ abdom + thigh))
 ```
 
 ```{r regmulti_h2-check}
@@ -243,7 +275,7 @@ AIC(fat_lm1, fat_lm2)
 Dans les deux cas, le modèle multiple se démarque de justesse. En effet, la valeur *p* de l'ANOVA étant légèrement supérieure à 1%, elle est moyenne, mais reste inférieure au seuil alpha de 5% choisi. Nous rejetons donc l'hypothèse nulle que le terme supplémentaire n'apporte rien. D'autre part, le critère d'Akaike est très, très légèrement plus faible en faveur du modèle multiple. C'est ténu et le gain en part de variance expliquée (*R*^2^) l'est aussi puisque l'on ne gagne même pas un pour cent. Une présentation "soignée" de ca modèle avec `tabularise()` donne :
 
 ```{r, echo=TRUE, warning=FALSE}
-summary(fat_lm2) |> tabularise()
+summary_(fat_lm2) |> tabularise()
 ```
 
 Le modèle paramétré est extrait ici en utilisant ``` `r eq__(fat_lm2, use_coefs = TRUE, coef_digits = c(2, 5, 6))` ``` dans une balise équation Markdown commençant et terminant par deux signes dollars (`$$...$$`). Ici, l'ajustement manuel du nombre de chiffres significatifs pour les coefficients estimés est *obligatoire* :
@@ -356,13 +388,13 @@ Ici, nous sommes en présence de corrélations très faibles entre les variables
 ```{r regmulti2_h2, exercise=TRUE}
 map_lm <- lm(data = ___, ___ ~ ___)
 # Résumé du modèle
-summary(___)
+summary_(___)
 ```
 
 ```{r regmulti2_h2-hint-1}
 map_lm <- lm(data = ___, ___ ~ ___)
 # Résumé du modèle
-summary(map_lm)
+summary_(map_lm)
 
 #### ATTENTION: Hint suivant = solution !####
 ```
@@ -371,7 +403,7 @@ summary(map_lm)
 ## Solution ##
 map_lm <- lm(data = diabetes, map ~ age + chol + weight)
 # Résumé du modèle
-summary(map_lm)
+summary_(map_lm)
 ```
 
 ```{r regmulti2_h2-check}
@@ -408,7 +440,7 @@ quiz(
 Dans le cas où ces résultats devraient être présentés dans un rapport soigné, vous sortirez évidemment la version `tabularise()` de ce résumé :
 
 ```{r, echo=TRUE, warning=FALSE}
-summary(map_lm) |> tabularise()
+summary_(map_lm) |> tabularise()
 ```
 
 Vous n'oubliez évidemment pas de paramétrer votre modèle en utilisant dans une balise Markdown d'équation encadrée par deux signes dollars (`\$\$`), le chunk en ligne ``` `r eq__(map_lm, use_coefs = TRUE)` ```, comme ci-dessous (vous pouvez aussi ajuster manuellement les chiffres significations avec `coef_digits = c(w, x, y, z)` où `w`, `x`, `y`, `z` sont des entiers indiquant le nombre de chiffres significatifs désirés pour les quatre paramètres, ici `c(1, 3, 4, 3)`) :
diff --git a/inst/tutorials/B02Lb_reg_poly/B02Lb_reg_poly.Rmd b/inst/tutorials/B02Lb_reg_poly/B02Lb_reg_poly.Rmd
@@ -15,6 +15,38 @@ runtime: shiny_prerendered
 ```{r setup, include=FALSE}
 BioDataScience2::learnr_setup()
 SciViews::R("model", lang = "fr")
+# Required for RSConnect
+# SciViews::R
+library(rlang)
+library(data.table)
+library(ggplot2)
+library(tibble)
+library(tidyr)
+library(dplyr)
+library(dtplyr)
+library(broom)
+library(forcats)
+library(collapse)
+library(fs)
+library(data.trame)
+library(svFast)
+library(svTidy)
+library(svMisc)
+library(svBase)
+library(svFlow)
+library(data.io)
+library(chart)
+library(tabularise)
+library(SciViews)
+# ... more
+library(readxl)
+library(testthat)
+library(equatags)
+# 'model' and 'infer' packages
+library(modelit)
+library(distributional)
+library(inferit)
+library(UsingR)
 
 # datasets
 reddrum <- read("reddrum", package = "UsingR")
@@ -87,15 +119,15 @@ La croissance de ces poissons est particulière. Les juvéniles ont une croissan
 ```{r reglin_h2, exercise=TRUE}
 reddrum_lm1 <- lm(data = ___, ___ ~ ___)
 # Résumé du modèle
-summary(___)
+summary_(___)
 # Graphique du modèle
 chart(___)
 ```
 
 ```{r reglin_h2-hint-1}
 reddrum_lm1 <- lm(data = ___, ___ ~ ___)
 # Résumé du modèle
-summary(reddrum_lm1)
+summary_(reddrum_lm1)
 # Graphique du modèle
 chart(reddrum_lm1)
 
@@ -106,7 +138,7 @@ chart(reddrum_lm1)
 ## Solution ##
 reddrum_lm1 <- lm(data = reddrum, length ~ age)
 # Résumé du modèle
-summary(reddrum_lm1)
+summary_(reddrum_lm1)
 # Graphique du modèle
 chart(reddrum_lm1)
 ```
@@ -126,15 +158,15 @@ Réalisez ensuite une **régression linéaire polynomiale d'ordre deux** avec le
 ```{r regpoly_h2, exercise=TRUE}
 reddrum_lm2 <- lm(data = ___, ___ ~ ___ + ___(___))
 # Résumé du modèle
-summary(___)
+summary_(___)
 # Graphique du modèle
 chart(___)
 ```
 
 ```{r regpoly_h2-hint-1}
 reddrum_lm2 <- lm(data = ___, ___ ~ ___ + I(___))
 # résumé du modèle
-summary(reddrum_lm2)
+summary_(reddrum_lm2)
 # Graphique du modèle
 chart(reddrum_lm2)
 
@@ -145,7 +177,7 @@ chart(reddrum_lm2)
 ## Solution ##
 reddrum_lm2 <- lm(data = reddrum, length ~ age + I(age^2))
 # résumé du modèle
-summary(reddrum_lm2)
+summary_(reddrum_lm2)
 # Graphique du modèle
 chart(reddrum_lm2)
 ```
@@ -165,15 +197,15 @@ Réalisez à présent une **régression linéaire polynomiale d'ordre trois** av
 ```{r regpoly3_h2, exercise=TRUE}
 reddrum_lm3 <- lm(data = ___, ___ ~ ___ + ___(___) + ___(___))
 # Résumé du modèle
-summary(___)
+summary_(___)
 # Graphique du modèle
 chart(___)
 ```
 
 ```{r regpoly3_h2-hint-1}
 reddrum_lm3 <- lm(data = ___, ___ ~ ___ + I(___) + ___(___))
 # résumé du modèle
-summary(reddrum_lm3)
+summary_(reddrum_lm3)
 # Graphique du modèle
 chart(reddrum_lm3)
 
@@ -184,7 +216,7 @@ chart(reddrum_lm3)
 ## Solution ##
 reddrum_lm3 <- lm(data = reddrum, length ~ age + I(age^2) + I(age^3))
 # résumé du modèle
-summary(reddrum_lm3)
+summary_(reddrum_lm3)
 # Graphique du modèle
 chart(reddrum_lm3)
 ```
@@ -211,7 +243,7 @@ quiz(
     answer(sprintf("%.4f", lm_poly_coef$statistic[3])),
     answer(sprintf("%.4f", lm_poly_param$r.squared[1])),
     allow_retry = TRUE, random_answer_order = TRUE
-    ),
+  ),
   question(text = "Quelle est la part de la variance exprimée par ce modèle ?",
     answer(sprintf("%.3f", lm_poly_coef$estimate[1])),
     answer(sprintf("%.3f", lm_poly_coef$estimate[2])),
@@ -221,7 +253,7 @@ quiz(
     answer(sprintf("%.3f", lm_poly_coef$statistic[2])),
     answer(sprintf("%.3f", lm_poly_param$adj.r.squared[1]), correct = TRUE),
     allow_retry = TRUE, random_answer_order = TRUE
-    )
+  )
 )
 ```
 
@@ -232,7 +264,7 @@ Nous avons pu observer que notre modèle s'ajuste de mieux en mieux en augmentan
 ```{r, echo=TRUE}
 reddrum_lm6 <- lm(data = reddrum, length ~ age + I(age^2) + I(age^3) +
   I(age^4) + I(age^5) + I(age^6))
-summary(reddrum_lm6)
+summary_(reddrum_lm6)
 chart(reddrum_lm6)
 ```
 
@@ -247,7 +279,7 @@ Voici à présent le résultat pour un polynôme d'ordre sept.
 ```{r, echo=TRUE}
 reddrum_lm7 <- lm(data = reddrum, length ~ age + I(age^2) + I(age^3) +
   I(age^4) + I(age^5) + I(age^6) + I(age^7))
-summary(reddrum_lm7)
+summary_(reddrum_lm7)
 chart(reddrum_lm7)
 ```
 
@@ -310,7 +342,7 @@ Nous pouvons observer un gain de performance des modèles jusqu'au modèle polyn
 Pour une présentation propre du modèle retenu, nous utilisons `tabularise()` :
 
 ```{r, echo=TRUE, warning=FALSE}
-summary(reddrum_lm6) |> tabularise()
+summary_(reddrum_lm6) |> tabularise()
 ```
 
 Enfin, il est indispensable de paramétrer le modèle. Nous laissons R le faire grâce à la fonction `eq__()` que nous avons déjà employée plusieurs fois :
diff --git a/inst/tutorials/B03La_mod_lin/B03La_mod_lin.Rmd b/inst/tutorials/B03La_mod_lin/B03La_mod_lin.Rmd