Todos los datasets que he generado son a partir del que ha compartido el equipo de datos de El Pais en GitLab
He dividido el dataset principal por provincias y autonomías, así puedo cacharrear más comodamente.
Script para provincias Script para autonomias
También he modificado los nombres eliminando comillas y comas con replace-ccaa.sh