Business intelligence – Un cas pràctic – Anàlisi geogràfic de les cooperatives de Catalunya

 

Context

A Coopdevs ens hem plantejat desenvolupar un projecte d’anàlisi geogràfica del Registre General de Cooperatives de la Generalitat de Catalunya, disponible a la pàgina de Transparència de la Generalitat de Catalunya.

 

Estat inicial

A Coopdevs ja havíem començat a treballar en l’anàlisi de dades geogràfiques amb diferents eines de visualització. Un dels problemes que teníem era que no podíem processar les dades i/o la informació geogràfica amb l’objectiu de:

  • canviar la granularitat espaial per representar la informació (punt, polígons i línies)

  • disposar de diferents interfícies de visualització amb les que personalitzar el contingut i el grau d’interactivitat del resultat en funció de les necessitats del projecte.


Execució del projecte


FASE I: Definició de l’arquitectura

El procés de càrrega i representació de dades geogràfica s’ha definit en tres fases amb l’objectiu de poder carregar, processar i representar les dades de manera interactiva.



FASE II: Càrrega i procés de dades amb KNIME

Hem carregat les dades del Registre General de Cooperatives de la Generalitat de Catalunyai les hem vinculat a nivell de secció censal amb estadístiques relacionades amb el gènere i el nivell d’estudis (procedents de l’Institut Nacional d’Estadística).

Hem carregat la cartografia de municipis de Catalunya, procedent de l’Institut Cartogràfic de Catalunya i hem relacionat el mapa amb les dades disponibles a nivell de municipi.

Hem carregat la cartografia de seccions censals d’Espanya procedent de l’Institut Nacional d’Estadística i hem relacionat el mapa amb les dades disponibles a nivell de secció censal un cop georeferenciades les adreces postals de les cooperatives i assignada cada cooperativa a la seva secció censal corresponent.



FASE III: Emmagatzematge de les dades

Un cop processades les dades, les hem emmagatzemat en diferents formats i suports d’acord amb les necessitats de les eines de visualització:

  • hem generat un fitxer .csv amb la informació de les cooperatives preparades per ser representada amb Go Go Carto.

  • hem volcat la informació en una base de dades PostgreSQL que nodreixque serà posteriorment explotada amb Superset.


FASE IV: Visualització de dades

Hem generat diferents visualitzacions atenent a les necessitats que hem tingut en el desenvolupament del projecte. 

Representacions de dades amb mapes estàtics 

Hem generat mapes estàtics amb KNIME per validar que el procés de dades desenvolupat s’ajustava als requeriments establerts en el projecte.


Els mapes desenvolupats ens permeten aprofundir en el coneixement de la distribució del número de cooperatives al llarg del terriori així com de les categories predominants en cada regió.

A grans trets, podem veure que existeixen cooperatives distribuïdes per tota Catalunya, malgrat que la major concentració es manté en zones urbanes. Malgrat això, observem que la predominància de categories varia en funció del territori (per exemple: major concentració de cooperatives relacionades amb el sector agrícola a zones rurals i major concentració de cooperatives relaciones amb serveis a zones urbanes)

Representació de dades amb mapes interactius

Hem generat mapes interactius per facilitar l’aprofundiment en l’anàlisi de dades d’acord amb les necessitats de l’equip de recerca:

Mapa de cooperatives de Catalunya georeferenciades amb Go Go Carto



Quadre de comandament de cooperatives de Catalunya amb Superset



Properes passes

A part de creació de nous gràfics amb mapes i enriquiment d’altres fonts d’informació, el proper pas principal és buscar eines alternatives a Superset, per tal d’ampliar les possibilitats de visualtizació que en facilita l’eina així com poder fer servir les interfícies gràfiques incloses en altres eines.

La part positiva de l’arquitectura muntada és modular i que es pot connectar qualsevol tipus de visualitzador a la base de dades, sense necessitat d’haver de tocar el disseny.