Intégration de l’intelligence artificielle dans l’enseignement, le soutien académique et la recherche en science des données

Aurélien Nicosia

Je me présente

Aurélien Nicosia

  • Chargé d’enseignement, Université Laval
  • Département de mathématiques et statistique
  • Intérêt en science des données et en intégration de l’IA dans l’enseignement

Pourquoi parler d’IA aujourd’hui à l’université

  • Constat : L’IA générative est déjà massivement utilisée par les étudiantes et étudiants (et nous aussi!).
  • Enjeu : Comment l’intégrer de manière pédagogique, responsable et institutionnelle ?
  • Approche : Partage d’expérience personnelle (enseignement et recherche).
    • Il ne s’agit pas d’une vérité universelle, mais d’un retour sur des usages concrets et testés.

Fil conducteur de la présentation

Même technologie.

Trois contextes très différents :

  • soutien académique,

  • enseignement (pour les étudiants et les enseignants),

  • recherche.

La valeur n’est pas dans l’outil, mais dans le cadre d’usage.

Axe 1 – Soutien académique

Le Centre de dépannage et d’apprentissage (CDA)

  • Service facultaire : Rattaché à la Faculté des Sciences et Génie, mais dessert 6 facultés.
  • Offre : Soutien en mathématiques et statistiques pour une vingtaine de cours (incluant cours compensateurs).
  • Volume : ~3 000 visites/session (historique)
  • Public : Étudiants de 32 programmes différents.
  • Fonctionnement : ouvert 40h par semaine, 3 auxiliaires en tout temps. Consultation en ligne et en personne, avec et sans rendez-vous.

Les auxiliaires d’enseignement

Une trentaines d’auxiliaires d’enseignement sont sélectionnés chaque session.

  • Rôle : Accompagner la compréhension, la résolution de problèmes et la méthode de travail.
  • Profil : Sélectionnés parmi les meilleurs (excellence, communication, empathie).
  • Formation : Ateliers de tutorat, écoute active et kits pédagogiques.
  • Défi : Perte de contact humain face à des solutions IA apportées par les étudiants.

Un constat de terrain

  • Contexte : Baisse de fréquentation du CDA (-60%) et usage croissant de l’IA (ChatGPT).
  • Problème : Les étudiants obtiennent des réponses (correctes) mais en dehors du cadre du cours, comprennent mal les concepts.
  • Objectif : Intégrer l’IA pour soutenir un apprentissage responsable.
  • Vision : Reconnecter l’aide humaine et l’usage de l’IA.

Le projet GPT-CDA

  • Dispositif : Stations GPT en libre-service sur iPad au CDA.
  • Mission : Offrir des explications détaillées basées sur les références du cours.
  • Complémentarité : Détecter quand l’aide humaine est requise et rediriger vers un auxiliaire.
  • Innovation : Un pont entre le tutorat humain et l’assistance automatisée.

Vision pédagogique

  • Rôle : Guide interactif pour l’apprentissage actif et la confiance.
  • Approche : Adaptative, inclusive et centrée sur l’étudiant.
  • Comportement attendu :
    • Chaleureux, professionnel et patient.
    • Valoriser l’effort plutôt que la réponse correcte.
    • Jamais condescendant.

Directives et Logique d’intervention

  • Règle d’or : Ne jamais donner la réponse directement.
  • Méthode : Indices progressifs, analogies, questions ouvertes.
  • Scénarios :
    • Exercice non débuté : Clarifier l’énoncé, aider au démarrage.
    • En cours : Localiser l’erreur, encourager l’auto-correction.
    • Bloqué : Aider sur la difficulté spécifique uniquement.

Architecture et Connaissances

  • Base de connaissances (RAG) :
    • Google Drive sécurisé (Plans de cours, Notes, Cahiers d’exercices).
    • Lecture seule pour l’assistant.
  • Infrastructure :
    • GPT personnalisé dans l’environnement OpenAI Teams (Confidentialité).

Tests et Validation

  • Cadre de test rigoureux :
    • Questions théoriques (reformulation, quiz).
    • Exercices (guidage pas à pas sans donner la solution).
    • Détection d’erreurs (amener l’étudiant à se corriger).
  • Impact observé : Réduction de l’attente et modernisation de l’image du CDA.

À venir

  • Étude à grande échelle : Satisfaction du GPT-CDA (relâche hiver 2026).
  • Déploiement : Système en ligne accessible pour tous, partout.
  • Organisation : Refonte du fonctionnement du CDA.

Axe 2 – Enseignement

Interdire l’IA ou l’intégrer

Les étudiantes et étudiants utilisent déjà des LLMs.

Les stratégies de détection sont peu fiables.

Alternative : intégrer l’IA comme un objet pédagogique explicite.

  • Modalités d’intégration :
    • Suggérer l’utilisation d’un modèle paramétré par l’enseignant.
    • Documenter l’utilisation faite par l’étudiant.
    • Rendre l’utilisation obligatoire pour certaines tâches.

Un choix pédagogique assumé

“Treating AI use as an intended learning outcome rather than a threat.” Wang et al (2025)

  • Stratégie : Évaluation centrée sur le processus.
  • Contexte : Obliger l’utilisation de LLM dans un cours de programmation en R.

Wang S, Xu L, Liu J, Zhai Y (2025). Addressing the Challenges of AI-Generated Assignment Submissions in Education: Insights and Strategies. Journal of Data Science.

Le projet contextR : un package qui “parle”

  • Objectif : Créer des fonctions statistiques (ex: lm, t.test) qui retournent aussi une interprétation contextuelle.
  • Outil : Utilisation du package ellmer pour l’intégration de LLM.
  • Défi : “Prompt engineering” pour garantir des interprétations fidèles aux résultats.
  • Règle d’or : “Ne rien inventer”.

Exemple d’utilisation

# Exemple d'utilisation fictif
mod <- lm_context(body_mass_g ~ bill_length_mm,
data = penguins)
summary(mod)
=== LM output ===
Coefficients:
                 Estimate Std. Error t value Pr(>|t|)    
(Intercept)       -1500.2      250.3   -5.99  3.1e-08 ***
bill_length_mm       98.7        5.2   18.95  < 2e-16 ***

Residual standard error: 410 on 340 df
Multiple R-squared: 0.514, Adjusted R-squared: 0.512

=== Contextual interpretation (LLM) ===
In this sample of penguins, the model suggests a strong positive
linear association between bill length and body mass. According to
the dataset documentation, species with longer bills also tend to be
larger birds. The positive slope indicates that, on average, each
additional millimetre of bill length is associated with an increase
in body mass, and the very small p-value indicates that this pattern
is unlikely to be explained by random variation alone in this study.

Architecture du package contextR

flowchart LR
    A[Fct stat] --> B[Obj. S3]
    C[Doc. data] --> B
    D[Contexte<br/>optionnel] --> B
    B --> E[LLM]
    E --> F[Sortie]
    
    style A fill:#e1f5ff
    style C fill:#e1f5ff
    style D fill:#fff4e1
    style E fill:#ffe1e1
    style F fill:#e1ffe1

Ce qui est réellement évalué

  • Intégration LLM : Robustesse des prompts et intégration du LLM.
  • Qualité logicielle : Structure de package, documentation, qualité du code.
  • Reproductibilité : Choix du modèle et des paramètres enregistrés dans l’objet S3.
  • Documentation : Expliquer comment l’IA a été utilisée.

Apprentissages clés pour les étudiants

  • Collaboration disciplinée : Valider et éditer chaque sortie de l’IA.
  • Compréhension technique : POO (S3) pour stocker les métadonnées de l’IA.
  • Esprit critique : Transformer les erreurs du modèle en opportunités de clarification conceptuelle.

Retours d’expérience et suite

  • Satisfaction globale : 4.83/5 (n=12).

  • Suite : Le projet devient communautaire sur GitHub.

  • Voir le dépôt GitHub

  • Discussion à venir dans Journal of Data Science

Wang S, Xu L, Liu J, Zhai Y (2025). Addressing the Challenges of AI-Generated Assignment Submissions in Education: Insights and Strategies. Journal of Data Science.

Axe 3 – Enseignement augmenté

Les GPTs personnalisés dans les cours

  • Des assistants alignés sur un cours précis.

  • Un vocabulaire, des attentes et des contraintes définies.

  • Un même modèle, des comportements très différents.

J’ai testé cela dans les cours suivants:

Comme dans le projet GPT-CDA, l’assistant ne donne pas directement des réponses (apprentissage actif).

NotebookLM

  • Principe : Dialogue avec un corpus fermé (Notes, articles, consignes).

  • Outputs générés : Résumé audio et vidéo, Présentation, Guide d’étude… De nouveaux s’ajoutent.

  • Usage : Centré sur la compréhension et la synthèse.

Ce que NotebookLM change:

  • Transformation des notes passives en objets d’exploration.

  • Appropriation active du contenu.

Démonstration

Axe 4 – Recherche

Les utilités de l’IA dans la recherche

  • Revue de littérature : Synthèse des affirmations scientifiques, réseaux de citations.
  • Codage : aide à la production de code, vérification de la cohérence.
  • Developpement d’idees

Revue de littérature : Recherche bibliographique

Outils spécialisés :

  • Elicit :
    • Automatise la revue systématique.
    • Extraction de données structurées (taille d’échantillon, résultats) à partir de PDFs.
  • Consensus :
    • Moteur de recherche basé sur l’IA pour trouver des affirmations scientifiques.
    • Synthétise le consensus scientifique sur une question.
  • ResearchRabbit :
    • Cartographie visuelle des citations (réseaux de papiers).
    • Découverte de papiers similaires par connexions

Revue de littérature : Recherche bibliographique

Outils “classiques” :

  • ChatGPT : (mode “recherche approfondie”)

  • Gemini : (mode “Deep research”)

  • perplexity : (mode “deep”)

Temps de réponse plus long

On peut observer le “raisonnement” de l’IA

Outils d’IA intégrés (RStudio/Positron)

  • Positron IDE :
    • AI-powered assistance : Contextualisé pour la data science.
    • Positron/Rstudio Assistant : Chat et complétion de code conscients de l’environnement.
    • Databot : Agent expérimental pour l’exploration de données.

LLMs pour R

🛑 copier-coller entre une IA et un environnement R

  • Ressource clé : Large Language Model tools for R (Luis D. Verde Arregoitia).
  • Veille technologique :
    • Recensement des nouveaux packages (14 nouveaux en Jan 2026).
    • Agents autonomes (deputy), assistants locaux (side, localLLM).
    • Gestion des prompts (promptmanageR).
  • Lien : luisdva.github.io/llmsr-book

AI Council : Discussion multi-LLM

  • Concept : Faire interagir plusieurs modèles (GPT-4, Claude, Gemini) sur une même problématique.
  • Objectif :
    • Confronter les “points de vue” et les biais de chaque modèle.
    • Obtenir une synthèse plus robuste et nuancée.
    • Simuler un débat contradictoire pour affiner les arguments.

Lien Github

Antigravity : L’IA Agentique

  • Concept : Un assistant qui ne se contente pas de parler, mais qui agit.
  • Capacités :
    • Planification et exécution de tâches complexes.
    • Accès complet à l’environnement (Fichiers, Terminal, Navigateur).
    • Correction autonome d’erreurs (boucle de feedback).
  • Démonstration :

L’IA comme accélérateur

  • Exploration d’idées.

  • Structuration d’articles.

  • Prototypage rapide.

  • Révision d’article.

  • Toujours sous validation/vérification humaine.

Enjeux transversaux

Risques bien identifiés

  • Hallucinations.

  • Confiance excessive.

  • Perte de traçabilité.

Donner des directives claires

Exemple de directives (System Prompt - le mien) :

  • Vérité : Ne jamais inventer. Si non vérifiable \(\rightarrow\) “Je ne sais pas”.
  • Sources : Baser sur des sources crédibles et citer clairement (auteur, date, lien).
  • Rigueur : Prioriser l’exactitude sur le style. Rester neutre.
  • Méta-cognition : Vérifier “Tout est-il factuel ?” avant d’envoyer.

Conditions de succès

  • Cadres explicites d’utilisation

  • Formation sur l’usage de l’IA et les risques associés.

  • Documentation des usages.

Message clé et conclusion

  • L’IA n’est ni une menace ni une solution miracle.

  • C’est un outil puissant, dont la valeur dépend du cadre pédagogique et scientifique.

  • Questions? Retours d’expérience.

  • Échanges sur les usages à HEC.