Text Mining: Detect Strings: Word Lookup in a Large Corpus of Phrases Using a Large Dictionary with Julia

After achieving an optimized string detection algorithm in R for 1 milion phrases using a 200k large dictionary, I wondered if I can get better results in Julia. So far, this doesn’t look near as fast as my R implementation. Any help appretiated in the comments; I will alter this post accordingly. (Running Julia with […]

Dessinez votre pays imaginaire avec Affinity Designer: une introduction au dessin vectoriel

But de l’exercice: découvrir des outils de base pour la création d’une carte dans le logiciel de dessin vectoriel Affinity Designer (téléchargement sur le site). Il s’agit d’un logiciel propriétaire, mais nettement moins onéreux que la suite “Creative” d’Adobe. L’exercice parvient au même résultat que celui, sur ce site, intitulé “Dessinez votre pays imaginaire avec […]

Ressources web pour les géodonnées

Ressources Monde OpenStreetMap: https://www.openstreetmap.org Suisse Confédération Swisstopo: https://maps.ageo.dmin.ch – cette carte en ligne fonctionne aussi en tant que catalogue permettant de commander les données auprès des offices fédéraux qui les ont produites. Office fédéral des statistiques: Divers fonds de carte utiles à la représentation de données statistiques à l’échelle des communes ou des quartiers: https://www.bfs.admin.ch/bfs/fr/home/statistiques/statistique-regions/fonds-cartes.html […]

Création et analyse de cartes mentales

Les cartes mentales représentent un espace tel qu’il est perçu par les habitants plutôt que tel qu’il est présenté sur les “cartes officielles” (p. ex. les cartes que vous pouvez charger à partir de ressources cantonales ou d’OpenStreetMap). Une carte mentale ne s’inscrira souvent pas dans une vision topographique de l’espace, avec ses coordonnées, sa […]

Ideograph – explore ideologies of political parties with SPAQRL requests to WikiData, D3 and PixiJS.

Ideograph is a visual tool for exploring ideologies of political parties. It queries its data directly from the frequently updated WikiData graph database. You can filter the graph by country, and find further information by clicking on the node labels. Ideograph is licensed under GNU GPL 3.0. Where does the data come from? WikiData is […]

Unify the extent of rasters in QGIS 3 to avoid clipping by raster calculator

This one drove me crazy today! If you try to sum values from rasters with different extent, the raster calcultor clips the result to their overlapping zone. This might make sense in most cases, but in many other cases it absolutely does not. Users should have a choice. An old workaround (2013) is proposed on […]

Premiers pas avec le module R “Quanteda” pour l’analyse linguistique

Cet exercice a pour but de vous familiariser avec le module Quanteda pour l’analyse linguistique. Il présuppose que vous avez fait les premiers pas avec R et Rstudio. Installez et activez les modules Installez les modules quanteda, quanteda.textstats, quanteda.textplots, readtext, ggplot2 et udpipe: Créez un nouveau script R pour sauvegarder la progression de votre travail. […]

Reorder geom_bar or anything else in ggplot by the value of your choosing

You still find recent answers on StackOverflow counseling to redefine the factors of a data.frame to reorder elements of a ggplot graphic. In the 2020’s, this can be avoided. Factors are a heritage of a numerical focus of R, when text values were seen as an anomaly or, at best, as ordinal values. I highly […]

Scrape an image from DeepZoom with R and magick, recomposing a single image from multiple tiles

DeepZoom allows webmasters to display high resolution images in an online viewer. Among its users: The British Library The World Digital Library (WDL) Polona, the Polish Digital National Library BALaT, Belgian Art Links and Tools and many others DeepZoom mostly discourages downlading the original high resolution images to your local drive. This is how to […]

Les encarts dans QGIS

Pour qu’un personne ne connaissant pas la région que vous cartographiez puisse mieux s’orienter, il vaut la peine d’utiliser un encart,  ce qui est possible dans le “print composer“. Il suffit, pour cela, d’ajouter deux cartes différentes. Lors de la création d’encarts, il est souvent pertinent de changer d’implantation. Pour identifier les bâtiments à l’échelle […]