Visualiser des données avec R (2): réductions dimensionnelles, clustering, composantes principales

André Ourednik, Wednesday, May 23, 2018

Cet exercice fait suite à l’exercice Visualiser des données avec R (1). Il présuppose que vous avez chargé les données et créé les variables de cet exercice précédent, faute de quoi les scripts R ci-dessous ne fonnctionneront pas.

De 1 dimension à 0 dimensions: le nombre unique qui résume les données

Réduisons d’abord nos données en un seul point, en réduisant une série de nombres en un seul nombre. Un nombre unique peut, en effet, être considéré comme un point dépourvu de dimension.

Moyenne, écart type, corrélation etc.

Comme on pouvait s’y attendre, il y a une corrélation négative significative à alpha < 0.00001 entre le proportion de francophones et de germanophones en Suisse.

Test du Chi2

Ce petit exemple se base sur des  donnés catégorielles fictives que l’on crée dans un premier temps. Ensuite on obtient la p-value du Chi2.

De n dimensions à 2 dimensions

Lignes et surfaces de régression

orthogonal_regression
Il existe des régressions ordinaires et des régressions orthogonales. Voici quelques régressions ordinaires en 3 dimensions:

Analyse en composantes principales

 

Clustering ascendant hiérarchique

Combiner le clustering et l’analyse en composantes principales

Utiliser les clusters obtens comme couleurs pour la visualisation finale de l’analyse en composantes principales

Analyse en compostantes principales pour les langues parlées en Suisse.

Analyse en composantes principales pour les langues parlées en Suisse.

  •  
  •  
  •  
  •  
  •  
  •  
Cite as: André Ourednik (2018) « Visualiser des données avec R (2): réductions dimensionnelles, clustering, composantes principales » in Maps and Spaces from https://ourednik.info/maps/2018/05/23/visualiser-des-donnees-avec-r-2/ [Last-seen October 18th 2018].
Category: Courses, Tools