Text Mining: Very Fast Word Lookup in a Large Dictionary in R with data.table and matrixStats

Looking up words in dictionaries is the alpha and omega of text mining. I am, for instance interested to know whether a given word from a large dictionary (>100k words) occurs in a phrase or not, for a list of over 1M phrases. R can be very slow or much much faster at this task, […]

Visualisation et analyse des relations entre images dans un espace réseau, dans un espace signifiant et dans un espace topographique

Ceci est un workshop créé par l’auteur pour le laboratoire d’architecture ALICE (EPFL-ENAC) dans le cadre du projet de recherche et d’enseignement POLIPHILO. Nous allons apprendre à interroger une base de données et à projeter des images prises sur le terrain dans divers espaces paramétriques pour une analyse en termes de phénoménologie spatiale. Le workshop vise à […]

Premiers pas avec R et RStudio

Cet exercice a pour préalable d’avoir installé R et RStudio, soit avec le gestionnaire Miniconda, soit comme logiciels indépendants. Se familiariser avec l’interface Ouvrez RStudio. Vous devriez voir l’interface comme à l’image ci-dessous, pour l’heure sans la partie A. La partie C est en principe vide: Les fonctions de ces différentes parties sont les suivantes: […]

Visualiser des réseaux géographiques

Les réseaux sont “l’autre” espace géographique, souvent négligés dans les approches classiques trop focalisées sur l’espace topographique des étendues euclidiennes des surfaces projetées du globe. Dans cet exercice, nous allons examiner comment les réseaux peuvent être formalisés sous formes de données informatiques et comment ces dernières peuvent être analysés visuellement. La notion mathématique de graphe, […]

Installer R et RStudio comme logiciels indépendants

R est un langage de programmation. Pour que les programmes écrits en R fonctionnent, il est nécessaire d’installer au préalable un environnement d’exécution pour ce langage. RStudio est une interface graphique (GUI) pour R. Une façon aisée d’installer en même temps R et RStudio, en parallèle d’un bon nombre d’autres logiciels de programmation, d’analyse et de […]

Installer R, RStudio et Orange Data Mining avec Miniconda

Conda est un gestionnaire de logiciels d’analyse de données et de visualisation extrêmement répandu dans les milieux scientifiques. Sa version minimale, Miniconda, permet d’installer et de tenir à jour plusieurs logiciels dont R, RStudio et Orange Data Mining. Installez-le en suivant les instructions ci-dessous. Dans tous les cas, si un choix est proposé choisissez la […]

Create a subgraph from the neighborhood of specific vertices in igraph

Many user of igraph for R expect the functions ego() and make_ego_graph() , that take a list of vertices as input, to generate a new graph composed of the neighbors of these vertices. Unfortunately, these functions do no such thing. They generate a list of igraph.vs objects, which cannot be further treated as an igraph […]

Visualiser des données avec R (2): réductions dimensionnelles, clustering, composantes principales

Cet exercice fait suite à l’exercice Visualiser des données avec R (1). Il présuppose que vous avez chargé les données et créé les variables de cet exercice précédent, faute de quoi les scripts R ci-dessous ne fonctionneront pas. De 1 dimension à 0 dimensions: le nombre unique qui résume les données Réduisons d’abord nos données […]

GéoRécits – an application for mapping journeys and lived spaces

Spatial mobility always involves at least two types of distances: the topographical distance traveled on the surface of the Earth and the time distance taken to do so. GéoRécits allows you to map both simultaneously in your web browser. Use GéoRécits online HERE. Or download GéoRécits from its GitHub repository for offline use.  See Offline […]

Cartographier des résultats de votations

Récupérer les fonds de carte Récupérez les limites communales généralisées sur le site de l’Office fédéral des statistiques en choisissant l’année correspondant à vos données. Pour cet exemple: 2016, respectivement du 30.01.2017 ou du 30.06.2015. Récupérez également les métainformations sur les géodonnées qui vous permettront de comprendre la signification des noms de fichiers et des […]