Visualiser des données avec Orange Data Mining

André Ourednik, Monday, October 30, 2017

OrangeDataMining

Cet exercice sert à vous introduire à la visualisation de données avec le logiciel Orange Data Mining développé par l’Université de Ljubljana.

Une fois cet exercice terminé, passez à l’exercice “Visualiser des données avec R”.

Installer Orange 3

Installez Orange 3 à partir du site de l’application. Si cela s’avère problématique, suivez les instructions d’installation alternatives disponibles ici.

Lancez Orange 3 et créez un nouveau fichier.

Cliquez sur File > Save pour sauvegarder directement votre fichier le_nom_de_votre_choix.ows

L’interface d’Orange

L’interface d’Orange est composée d’un ensemble de nœuds fonctionnels (au sens de nœud d’un réseau) regroupés par module et d’un canevas.

Charger et préparer les données

Il existe deux possibilités pour obtenir les données :

  1. Les charger sur votre disque dur local et les ouvrir depuis là. Pour suivre cette piste, rendez vous sur le site du cours et télécharget le fichier unine_exercice1.zip. Décompressez-le dans un emplacement de votre disque dur, en prenant bien note où vous le stockez.
  2. Ne faites rien à ce stade.

Charger les donées dans Orange 3

Ouvrez l’onglet Data et cliquez sur l’icône File. Un “nœud” apparaître sur le canevas.

Orange_file

Cliquez sur le nœud File sur le canevas. Si vous avez téléchargé les fichier, choisissez le fichier donnees_communes.xls

orange_donnes

Sinon, entrez directement l’URL des données: http://ourednik.info/unine/donnees_communes.xls

Une liste de colonnes devrait apparaître.

Calculez les données proportionnelles

Ajoutez un nœud “Feature Constructor” …

Orange_featureconstructor… et connectez file à feature constructor avec la souris.

Orange_featureconstructor2

Double-cliquez sur Feature Constructor pour définir une nouvelle variable numérique.

Orange Data Mining

La proportion des germanophones dans la population totale = P00B21 / P00BTOT. Remarquez, ce faisant, que le menu déroulant “Select Feature” peut vous être utile…

Ajoutez la proportion de francophones, d’italophones, de romanchophones et d’anglophones dans la population totale en vous basant sur les métadonnées “donnes_communes.pdf” à l’intérieur du fichier unine_exercice1.zip.

Sélectionnez les variables

Pour faciliter la suite, ne conservez que les variables (features) qui vous intéressent parmi les variables disponibles. Conservez aussi la variable GMDENAME comme méta-attribut (les métatributs ne sont pas pris en compte dans l’analyse mais permettent d’identifier les individus statistiques représentés par les lignes de données).

Produire des graphiques

Réduisez le nombre de variables sélectionnées ainsi:

Connectez quelques nœuds de visualisations pour reproduire quelques-uns des graphiques vus dans le cours. Double-cliquez toujours sur un nœud pour ouvrir l’interface de visualisation correspondante.

Orange Data Mining

 

 

Option: installez des modules supplémentaires

Essayez d’installer des modules supplémentaires à partir du menu Options > Add-ons, notamment Educational, Text, Textable et Networks, qui donnent accès notamment à l’analyse de réseaux et à des analyses textuelles.

  •  
  •  
  •  
  •  
  •  
  •  
Cite as: André Ourednik (2017) « Visualiser des données avec Orange Data Mining » in Maps and Spaces from https://ourednik.info/maps/2017/10/30/visualiser-des-donnees-avec-orange-data-mining/ [Last-seen August 18th 2018].
Category: Courses, Tools

Leave a Reply


*

This site uses Akismet to reduce spam. Learn how your comment data is processed.

No Responses