Topic Modeling: la modélisation thématique avec R, Quanteda… et ChatGPT

Ce tutoriel présuppose que vous avez fait vos premiers pas avec le module R Quanteda et que vous maîtrisez les notions stemming, stopwords, matrice document-terme, etc. On part du principe que vous avez installé et activé les modules quanteda, quanteda.textstats, quanteda.textplots, readtext, seededlda et magrittr. Créez un corpus de textes à partir de données existantes […]

Analyse de séries temporelles avec R

Une « série temporelle » est une suite d’enregistrements d’une variable faits au cours du temps. Cette variable peut être la température, la fréquence d’accidents routiers ou l’amplitude du son enregistré par un microphone. Les mesures peuvent être prises à des intervalles réguliers ou pas. Pour avoir une base de discussion, préparons d’abord quelques données fictives. Ne […]

Cartographie et géomatique avec R (2024)

Deux modules R principaux servent aujourd’hui pour le traitement de données géomatiques: Pour comprendre ces modules R en détail, je vous recommande l’excellente documentation de Timothée Giraud & Hugues Pecout. Le présent exercice vise à vous familiariser avec les éléments de base de la cartographie vectorielle avec R. Le prérequis pour comprendre les instructions ci-dessous […]

Premiers pas avec le module R « Quanteda » pour l’analyse linguistique

Cet exercice a pour but de vous familiariser avec le module Quanteda pour l’analyse linguistique. Il présuppose que vous avez fait les premiers pas avec R et Rstudio. Installez et activez les modules Installez les modules quanteda, quanteda.textstats, quanteda.textplots, readtext, ggplot2 et udpipe: Créez un nouveau script R pour sauvegarder la progression de votre travail. […]