Visualiser des données avec R (2): réductions dimensionnelles, clustering, composantes principales

Cet exercice fait suite à l’exercice Visualiser des données avec R (1). Il présuppose que vous avez chargé les données et créé les variables de cet exercice précédent, faute de quoi les scripts R ci-dessous ne fonctionneront pas. De 1 dimension à 0 dimensions: le nombre unique qui résume les données Réduisons d’abord nos données […]

Unknown column? Force encoding of an entire table from “unknown” to “UTF-8” in R on Windows

A common knitr issue on Windows Running R scripts on a Windows machine is equivalent to a dive into enconding hell. In effect, your non-English data most likely contains characters like Ä, ü, è or š, or even 语言. In all cases, the only serious way of dealing with these, in fact with any data […]

Cleaning up PDFs of pre-1990s scanned texts for text mining in R with Quanteda

Text sources are often PDF’s. If optical character recognition (OCR) has been applied, the pdftools R package allows you to extract text from all PDFs to text files stored in a folder. The readtext package converts the set of text files into something useful for Quanteda. Nevertheless, some cleaning is necessary before transforming your text […]

Cartographie avec R

Pour cartographier avec R, vous avez besoin des bibliothèques logicielles GDAL (Geospatial Data Abstraction Library) et GEOS (Geometry Engine – Open Source). On peut faciliter leur installation en installant qGIS, qui les inclut. Installer spécifiquement GDAL et GEOS Mais vous pouvez aussi les installer directement. Pour cela: Allez sur le site GEOS. Parmi les téléchargements […]

Visualiser des données avec R: barchart, boxplot, bubblechart 3D, histogramme, parallel coordinates, radar chart, stripchart

Cet exercice vous conduit à travers le processus de visualisation de données dans R. Il présuppose que vous avez installé R et RStudio. que vous connaissez déjà les bases de maniement de R et de RStudio. Charger les données Téléchargement Téléchargez le fichier depuis le site du cours. Décompressez le contenu de l’archive zip […]

A mobility network

Methods and tools After a day and a half of work and fine-tuning, here we go: the commuting network of all individuals either residing, working or studying in the canton Valais. I’ve used R, with the RStudio GUI, and the igraph library for R. My staring point was the mobility matrix between all communes, including […]

RStudio – one big step towards user-friendliness of R

R is the greatest open source statiscal programming package around. It is all a mapper need to pretreat data. Yet it suffers from interfaces that are either uggly, tedious to set up, clumsy to use or all of these. After years of glaring at the Windows interface of R, I’ve finally sutmbled upon a nice […]