Visualiser des données avec R: barchart, boxplot, bubblechart 3D, clustering, histogram, parallel coordinates, radar chart, stripchart

André Ourednik, Thursday, December 1, 2016

Cet exercice vous conduit à travers le processus de visualisation de données dans R. Il présuppose que vous avez installé R et RStudio.

Charger les données

Téléchargement

Téléchargez le fichier unine_exercice1.zip depuis le site du cours.

Décompressez le contenu de l’archive zip dans le dossier du projet que vous avez créé.

Charger les donées dans R

Pour charger les données, exécutez la commande suivante. Si vous êtes sur une machine Windows remplacez “/” par “\\“.

Si la commande précédente ne fonctionne pas, essayez avec celle-ci

Examinez vos données en sélectionnant des sous-ensembles (subsetting)

Vous venez de stocker un tableau de données dans la variable rfpdata. R permet d’accéder aux colonnes du tableau à l’aide du signe $. Essayez:

rfpdata$P00B21

Essayez de lister les valeurs d’autres colonnes.

R permet également d’afficher un sous-ensemble de données. Avec la commande suivant, affichez la 1ère colonne et les colonnes 5  à 10 :

Affichez les 2 premières lignes :

Affichez les 2 premières colonnes:

Affichez les valeurs de la variable P00BTOT pour les 2 premières lignes:

Listez toutes les données des communes dont la population est inférieure à 2000 personnes:

Listez les noms des communes dont la population est inférieure à 2000

Vous pouvez aussi stocker le sous-ensemble de données dans une variable

Apprenez davantage sur la sélection de sous-ensembles dans R sur cette page internet. Testez les différentes options sur vos données.

Calculez les données proportionnelles

Créez de nouvelles colonnes en calculant de nouvelles variables (vecteurs) qui seront ajoutées comme colonnes au tableau de données (data.frame) rfpdata:

Stripchart et scatterplots

R vous permet aussi d’afficher trois graphiques sur la même feuille:

Bubblechart locuteurs suisses

Bubblechart locuteurs suisses

Scatterplot et bubblechart 3D

Explorez la troisième dimension de l’espace.

Parallel coordinates

Radar charts et wind-rose chart

Wind-rose chart locuteurs suisses

Wind-rose chart locuteurs suisses

Boxplots

Histogram

Estimation par noyau. (Kernel density)

Estimation par noyau. (Kernel density)

Barchart

La fonction geom_bar(stat=”identity”) a besoin du package plyr pour fonctionner. Vérifiez qu’il soit bien installé avant d’exécuter les lignes suivantes.

Réductions dimensionnelles

1 dimension à 0 dimensions

Ici nous réduisons une série de données en un point. C’est à dire réduire une série de nombres en un seul nombre. Un nombre est, en effet, un point dans une dimension.

Moyenne, écart type, corrélation etc.

Test du Chi2

On crée d’abord des donnés catégorielles fictives. Ensuite on obtient la p-value du Chi2.

Surfaces de régression

orthogonal_regression
Il existe des régressions ordinaires et des régressions orthogonales. Voici quelques régressions ordinaires en 3 dimensions:

Analyse en composantes principales

Analyse en compostantes principales pour les langues parlées en Suisse.

Analyse en composantes principales pour les langues parlées en Suisse.

Clustering ascendant hiérarchique

  •  
  •  
  •  
  •  
  •  
  •  
Cite as: André Ourednik (2016) « Visualiser des données avec R: barchart, boxplot, bubblechart 3D, clustering, histogram, parallel coordinates, radar chart, stripchart » in Maps and Spaces from https://ourednik.info/maps/2016/12/01/visualiser-des-donnees-avec-r/ [Last-seen April 25th 2018].
Category: Courses, Tools