Learnrs for module 1 ready (2025-2026)

phgrosjean · phgrosjean · commit 0fcce39cb45b · 2025-09-08T08:32:17.000+02:00
diff --git a/DESCRIPTION b/DESCRIPTION
@@ -1,5 +1,5 @@
 Package: BioDataScience2
-Version: 2025.0.1
+Version: 2025.1.0
 Title: A Series of Learnr Documents for Biological Data Science 2
 Description: Interactive documents using learnr for studying biological data science (second course).
 Authors@R: c(
diff --git a/NEWS.md b/NEWS.md
@@ -1,3 +1,7 @@
+# BioDataScience2 2025.1.0
+
+-   Learnrs **B00La_refresh**, **B01La_reg_lin** and **B01Lb_residuals** revised for 2025-2026.
+
 # BioDataScience2 2025.0.1
 
 -   Argument `envir=` added to `learnr_server()` to accomodate changes for compatibility with a Posit Connect server.
diff --git a/inst/tutorials/B01La_reg_lin/B01La_reg_lin.Rmd b/inst/tutorials/B01La_reg_lin/B01La_reg_lin.Rmd
@@ -4,7 +4,7 @@ author: "Guyliann Engels & Philippe Grosjean"
 description: "**SDD II Module 1** Réaliser une régression linéaire simple dans R."
 tutorial:
   id: "B01La_reg_lin"
-  version: 2.4.0/9
+  version: 3.0.0/9
 output: 
   learnr::tutorial:
     progressive: true
@@ -15,6 +15,37 @@ runtime: shiny_prerendered
 ```{r setup, include=FALSE}
 BioDataScience2::learnr_setup()
 SciViews::R("model", lang = "fr")
+# Required for RSConnect
+# SciViews::R
+library(rlang)
+library(data.table)
+library(ggplot2)
+library(tibble)
+library(tidyr)
+library(dplyr)
+library(dtplyr)
+library(broom)
+library(forcats)
+library(collapse)
+library(fs)
+library(data.trame)
+library(svFast)
+library(svTidy)
+library(svMisc)
+library(svBase)
+library(svFlow)
+library(data.io)
+library(chart)
+library(tabularise)
+library(SciViews)
+# ... more
+library(readxl)
+library(testthat)
+library(equatags)
+# 'model' and 'infer' packages
+library(modelit)
+library(distributional)
+library(inferit)
 
 # crabs
 crabs <- read("crabs", package = "MASS")
@@ -45,7 +76,7 @@ BioDataScience2::learnr_server(input, output, session)
 
 ## Objectifs
 
-Ce tutoriel sur la régression linéaire débute par un rappel sur la corrélation et les corrélogrammes. Cette matière est détaillée dans le [module 6 de science des données I](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/correlation.html). Les objectifs de ce tutoriel sont :
+Ce tutoriel sur la régression linéaire débute par un rappel sur la corrélation et les corrélogrammes. Cette matière est détaillée dans le [module 6 de science des données I](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2025/correlation.html). Les objectifs de ce tutoriel sont :
 
 -   Revoir la corrélation et les indices de Pearson et Spearman
 
@@ -66,34 +97,34 @@ La fonction `skimr::skim()` vous permet d'obtenir de nombreuses informations sur
 
 Réalisez une matrice de corrélation avec le coefficient de corrélation de Pearson sur ce jeu de données. N'utilisez que les variables pertinentes. Sélectionnez ces variables sur base de leur nom. Affichez un corrélogramme avec la partie supérieure uniquement (`upper`).
 
-```{r corr1_h3, exercise=TRUE, exercise.lines=3}
+```{r corr1_h3, exercise=TRUE, exercise.lines=3, warning=FALSE}
 crabs_corr <- correlation(sselect(___, ___:___),
   use = ___, method = ___)
 plot(crabs_corr, ___ = ___)
 ```
 
-```{r corr1_h3-hint-1}
+```{r corr1_h3-hint-1, warning=FALSE}
 crabs_corr <- correlation(sselect(___, ___:___),
   use = "complete.obs", method = "pearson")
 plot(crabs_corr, type = ___)
 # Relisez le chapitre 12 du livre science des données 1 <https://wp.sciviewg/sdd-umons/>
 ```
 
-```{r corr1_h3-hint-2}
+```{r corr1_h3-hint-2, warning=FALSE}
 correlation(sselect(crabs, ___:___),
   use = "complete.obs", method = "pearson")
 plot(crabs_corr, type = "upper")
 #### ATTENTION: Hint suivant = solution !####
 ```
 
-```{r corr1_h3-solution}
+```{r corr1_h3-solution, warning=FALSE}
 ## Solution ##
 crabs_corr <- correlation(sselect(crabs, front:depth),
   use = "complete.obs", method = "pearson")
 plot(crabs_corr, type = "upper")
 ```
 
-```{r corr1_h3-check}
+```{r corr1_h3-check, warning=FALSE}
 grade_code("Vous vous rappelez comment réaliser une matrice de corrélation et un corrélogramme. Présenter une matrice de corrélation sous la forme d'un graphique, c'est quand même plus convivial.")
 ```
 
@@ -114,8 +145,6 @@ question("Quelles sont les combinaisons de variables les plus corrélées ? (sé
 
 *L'analyse de la corrélation est utile comme première approche afin de déterminer si une régression linéaire est intéressante avec nos données.*
 
-<!-- PhG: je ne comprend pas du tout pourquoi on fait de la corrélation sur crabs, et puis on passe à la régression sur bull. C'est décousu et cela n'a aucun sens. Comment les étudiants penvent comprendre la logique d'une analyse autour d'une régression linéaire sur base de problèmes aussi peu construits !!!- -->
-
 ## Taureaux reproducteurs
 
 Pour aborder la régression linéaire, nous revenons sur le jeu de données `bull` déjà utilisé lors du learnr de révision et issu de données de l'association wallonne de l'élevage. Ce jeu de données `bull` contient les variables suivantes :
@@ -124,7 +153,7 @@ Pour aborder la régression linéaire, nous revenons sur le jeu de données `bul
 
 Votre objectif sera de réaliser une régression linéaire de la masse des taureaux (mesurée en kg) en fonction de leur âge (en mois).
 
-#### Description des données
+### Description des données
 
 Toute analyse commence par la description des données, surtout si elles sont nouvelles pour vous ! Commencez donc en réalisant un graphique en nuage de point de la masse en fonction de l'âge des taureaux.
 
@@ -160,20 +189,19 @@ skimr::skim(bull)
 
 Le tableau contient deux variables qualitatives et trois variables quantitatives avec `r nrow(bull)` taureaux qui ont été mesurés et il n'y a pas de valeurs manquantes. La quantité de données disponibles est acceptable pour une régression linéaire. Les distributions de l'âge et de la masse montrent qu'il y a plus de données pour les faibles valeurs, la distribution dans la plage d'âges étudiée -entre 13 et 40 mois- n'est pas homogène, mais sans que cela ne soit dramatique (cela se voit aussi sur le graphique, plus haut, avec comparativement un peu moins de données pour des âges de 30 à 40 mois).
 
-```{r, echo=TRUE}
+```{r, echo=TRUE, warning=FALSE}
 correlation(num_vars(bull)) |>
   tabularise()
 ```
 
 Toutes les corrélations sont positives et élevées. La corrélation entre la masse et l'âge est la plus forte.
 
-*Souvenez-vous que `tabularise()` est une nouvelle fonction qui permet de réaliser un tableau propre des résultats (nous l'avons découvert dans le learnr précédent).*
 
-#### Modèle de la masse des taureaux en fonction de leur âge
+### Modèle de la masse des taureaux en fonction de leur âge
 
 Complétez à présent les instructions ci-dessous afin de réaliser une régression linéaire de la masse en fonction de l'âge de nos taureaux.
 
-```{r bull_lm_h2, exercise=TRUE, exercise.lines=7}
+```{r bull_lm_h2, exercise=TRUE, exercise.lines=7, warning=FALSE}
 bull_lm <- lm(data = ___, ___ ~ ___)
 # Tableau résumé de la régression linéaire
 summary(___) |>
@@ -182,7 +210,7 @@ summary(___) |>
 ___(___)
 ```
 
-```{r bull_lm_h2-hint-1}
+```{r bull_lm_h2-hint-1, warning=FALSE}
 bull_lm <- lm(data = ___, ___ ~ age)
 # Tableau résumé de la régression linéaire
 summary(___) |>
@@ -193,7 +221,7 @@ chart(___)
 #### ATTENTION: Hint suivant = solution !####
 ```
 
-```{r bull_lm_h2-solution}
+```{r bull_lm_h2-solution, warning=FALSE}
 ## Solution ##
 bull_lm <- lm(data = bull, weight ~ age)
 # Tableau résumé de la régression linéaire
@@ -203,7 +231,7 @@ summary(bull_lm) |>
 chart(bull_lm)
 ```
 
-```{r bull_lm_h2-check}
+```{r bull_lm_h2-check, warning=FALSE}
 
 grade_code("Vous avez réalisé votre première régression linéaire. Analysez le tableau et le graphique issus de ce modèle et répondez aux questions qui suivent.")
 ```
diff --git a/inst/tutorials/B01Lb_residuals/B01Lb_residuals.Rmd b/inst/tutorials/B01Lb_residuals/B01Lb_residuals.Rmd
@@ -5,7 +5,7 @@ description: "**SDD II Module 1** Analyser les résidus d'une régression linéa
 bibliography: references.bib
 tutorial:
   id: "B01Lb_residuals"
-version: 2.1.0/6
+version: 3.0.0/6
 output:
   learnr::tutorial:
   progressive: true
@@ -29,18 +29,24 @@ library(broom)
 library(forcats)
 library(collapse)
 library(fs)
+library(data.trame)
+library(svFast)
+library(svTidy)
 library(svMisc)
 library(svBase)
 library(svFlow)
 library(data.io)
 library(chart)
 library(tabularise)
 library(SciViews)
-# model
-library(modelit)
 # ... more
+library(readxl)
 library(testthat)
 library(equatags)
+# 'model' and 'infer' packages
+library(modelit)
+library(distributional)
+library(inferit)
 
 rice <- read("rice", package = "BioDataScience2")
 rice <- labelise(rice,
@@ -118,7 +124,7 @@ grade_code("Ce graphique en nuage de points est un pré-requis indispensable pou
 
 Nous pouvons continuer la description des données avec une matrice de corrélation de Pearson :
 
-```{r, echo=TRUE}
+```{r, echo=TRUE, warning=FALSE}
 correlation(num_vars(rice), method = "pearson") |>
   tabularise()
 ```
@@ -135,7 +141,7 @@ Les distributions des deux variables sont univariées et les moyennes assez proc
 
 Réalisez à présent la régression linéaire demandée de la variable `area` en fonction de la variable `major_axis_length`du tableau `rice`.
 
-```{r rice_lm_h2, exercise=TRUE}
+```{r rice_lm_h2, exercise=TRUE, warning=FALSE}
 rice_lm <- lm(data = ___, ___ ~ ___) 
 # Résumé de la régression linéaire
 summary(___) |>
@@ -144,7 +150,7 @@ summary(___) |>
 chart(___)
 ```
 
-```{r rice_lm_h2-hint-1}
+```{r rice_lm_h2-hint-1, warning=FALSE}
 rice_lm <- lm(data = rice, ___ ~ ___) 
 # Résumé de la régression linéaire
 summary(rice_lm) |>
@@ -155,7 +161,7 @@ chart(rice_lm)
 #### ATTENTION: Hint suivant = solution !####
 ```
 
-```{r rice_lm_h2-solution}
+```{r rice_lm_h2-solution, warning=FALSE}
 ## Solution ##
 rice_lm <- lm(data = rice, area ~ major_axis_length) 
 # Résumé de la régression linéaire
@@ -165,7 +171,7 @@ summary(rice_lm) |>
 chart(rice_lm)
 ```
 
-```{r rice_lm_h2-check}
+```{r rice_lm_h2-check, warning=FALSE}
 grade_code("Vous avez calculé votre objet `lm_rice`. Vous l'avez résumé et représenté graphiquement. Vous avez du matériel à examiner pour déterminer si cette régression tient la route. Avec un R^2 de 0.815, la régression est bonne, mais pouvez-vous repérer des éléments importants dans le tableau via le Quiz ci-dessous ?")
 ```
 
@@ -200,13 +206,13 @@ quiz(
 )
 ```
 
-#### Paramétrisation du modèle
+### Paramétrisation du modèle
 
 Une fois que vous avez les estimateurs des différents paramètres de votre modèle, vous pouvez placer ces valeurs dans son équation. Cette étape importante se nomme la **paramétrisation** du modèle.
 
-##### Comment faire en pratique ?
+#### Comment faire en pratique ?
 
-Dans la SciViews Box 2024, vous avez des outils pour vous y aider. La fonction `eq__()` extrait l'équation du modèle et son argument `use_coefs = TRUE` indique de remplacer les paramètres par les valeurs estimées. Ainsi, pour obtenir cette équation, vous pouvez écrire un chunk en ligne `` `r eq__(rice_lm, use_coefs = TRUE)` `` à l'intérieur de balises Markdown d'équation dite "display" (équation sur sa propre ligne, hors texte, par opposition à l'équation "inline", directement dans le texte). Cela s'écrit comme suit :
+Avec SciViews-R, vous avez des outils pour vous y aider. La fonction `eq__()` extrait l'équation du modèle et son argument `use_coefs = TRUE` indique de remplacer les paramètres par les valeurs estimées. Ainsi, pour obtenir cette équation, vous pouvez écrire un chunk en ligne `` `r eq__(rice_lm, use_coefs = TRUE)` `` à l'intérieur de balises Markdown d'équation dite "display" (équation sur sa propre ligne, hors texte, par opposition à l'équation "inline", directement dans le texte). Cela s'écrit comme suit :
 
 -   à une nouvelle ligne, vous entrez deux dollars `$$`, c'est la balise Markdown d'entrée d'une équation "display"
 -   à la ligne suivante, vous écrivez le chunk en ligne `` `r eq__(...)` `` qui viendra placer le contenu de l'équation calculé par R lors du rendu du document
@@ -220,7 +226,7 @@ $$
 
 **Astuce:** vous contrôlez le nombre de chiffres derrière la virgule pour chaque estimateur à l'aide de l'argument supplémentaire `coef_digits =` qui accepte un nombre entier (même nombre de chiffres derrière la virgule pour tous les estimateurs), ou un vecteur d'entiers pour varier la précision de chaque estimateur successif. Il est important de limiter les valeurs à un nombre de chiffres **significatifs** par rapport au calcul qui est réalisé. Ne jamais conserver un grand nombre de décimales inutiles dans les équations ! L'équation ci-dessus a été obtenue à l'aide de `` `r eq__(rice_lm, use_coefs = TRUE, coef_digits = c(0, 1))` ``.
 
-##### Compréhension de la paramétrisation du modèle
+#### Compréhension de la paramétrisation du modèle
 
 Maintenant que les aspects techniques sont expliqués, concentrez-vous sur le contenu de cette dernière équation et sa signification.