Text Mining: Very Fast Word Lookup in a Large Dictionary in R with data.table and matrixStats

Looking up words in dictionaries is the alpha and omega of text mining. I am, for instance interested to know whether a given word from a large dictionary (>100k words) occurs in a sentence or not, for a list of over 1M sentences.

R can be horribly slow or quite fast at this task, depending on the way you code. […] Continue Reading…

Visualisation et analyse des relations entre images dans un espace réseau, dans un espace signifiant et dans un espace topographique

Ceci est un workshop créé par l’auteur pour le laboratoire d’architecture ALICE (EPFL-ENAC) dans le cadre du projet de recherche et d’enseignement POLIPHILO.

Nous allons apprendre à interroger une base de données et à projeter des images prises sur le terrain dans divers espaces paramétriques pour une analyse en termes de phénoménologie spatiale. Le workshop vise à améliorer vos compétences technique et […] Continue Reading…

Premiers pas avec R et RStudio

Cet exercice a pour préalable d’avoir installé R et RStudio.

Se familiariser avec l’interface

Ouvrez RStudio. Vous devriez voir l’interface comme à l’image ci-dessous, pour l’heure sans la partie A. La partie C est en principe vide:

Les fonctions de ces différentes parties sont les suivantes:

A : Fenêtre d’édition des fichiers sources. Ici vous pouvez notamment éditer votre fichier de script, sélectionner […] Continue Reading…

Visualiser des réseaux géographiques

Les réseaux sont “l’autre” espace géographique, souvent négligés dans les approches classiques trop focalisées sur l’espace topographique des étendues euclidiennes des surfaces projetées du globe. Dans cet exercice, nous allons examiner comment les réseaux peuvent être formalisés sous formes de données informatiques et comment ces dernières peuvent être analysés visuellement.

La notion mathématique de graphe, vue en cours, est […] Continue Reading…

Between Art and Truth with Machine Learning

Robbie Barrat, image produced by a generative convolutional neural network trained on hundreds of realistical paintings.

What we call Artificial Intelligence reflects a thousand-year-old aspiration to provide thought with rules. It was born with the first cities, whose walls, selective doors, stairs, and secret passages gave new directions and meaning to human mobility. Four thousand years ago, a Sumerian scribe […] Continue Reading…

Installer R et RStudio comme logiciels indépendants

R est un langage de programmation. Pour que les programmes écrits en R fonctionnent, il est nécessaire d’installer au préalable un environnement d’exécution pour ce langage. RStudio est un environnement de développement (en anglais: IDE: Integrated development environment) pour R.

Installer l’environnement d’exécution du langage de programmation R

Vous pouvez installer R et RStudio comme logiciels indépendants.

Téléchargez et installez la version […] Continue Reading…

Installer R, RStudio et Orange Data Mining avec Miniconda

Conda est un gestionnaire de logiciels d’analyse de données et de visualisation extrêmement répandu dans les milieux scientifiques. Sa version minimale, Miniconda, permet d’installer et de tenir à jour plusieurs logiciels dont R, RStudio et Orange Data Mining. Installez-le en suivant les instructions ci-dessous. Dans tous les cas, si un choix est proposé choisissez la version Python 3.7. NB: […] Continue Reading…

Create a subgraph from the neighborhood of specific vertices in igraph

Many user of igraph for R expect the functions ego() and make_ego_graph() , that take a list of vertices as input, to generate a new graph composed of the neighbors of these vertices. Unfortunately, these functions do no such thing. They generate a list of igraph.vs objects, which cannot be further treated as an igraph object. This must have […] Continue Reading…

La poésie face à la Normalisation: dans le miroir de l’invasion de la Tchécoslovaquie par les troupes du Pacte de Varsovie

Il y a 50 ans, à quelques 300km de la France ou de la Suisse, un évènement a durablement marqué, c’est-à-dire souvent brisé, la vie d’une génération entière. Le 20 août 1968 à 23h, les troupes du Pacte de Varsovie ont franchi les frontières de la Tchécoslovaquie afin de restituer ses habitants, pieds et mains liés, à la féroce […] Continue Reading…

La lagune du glacier (Jökulsárlón, Vatnajökull)

Ce que nous appelons la vie, au sens large, non pas celle d’un être humain, mais la vie en tant que telle, la vie que nous partageons avec les autres espèces d’eucaryotes, bactéries et archées ; cette vie là aurait émergé sur terre il y a quatre millards d’années, dans un mélange de lipides et de phosphates, d’hydrates de carbones […] Continue Reading…