En raison des limitations de la version gratuite de Tableau Public (1 million de lignes par visualisation, le jeu de données original en compte 3,6 millions), je n'ai pas pu combiner les quatre facettes de ce jeu de données dans la même visualisation (région, département, pays, type de bien). J'ai par conséquent conçu deux visualisations, chacune reprenant trois des quatre facettes.
Par défaut, la balance commerciale est affichée (exportations - importations). Vous pouvez n'indiquer que les exportations ou les importations en modifiant la valeur du champ Flux.
Les visualisations utilisent les fichiers suivants, téléchargeables ici:
REGIONAL_CPF4PAYSE.txt
REGIONAL_CPF4PAYSI.txt
CPF4.txt
PAYS.txt
DEPT_REG.txt
La direction générale des douanes a également eu la bonne idée d'ajouter un document décrivant en détails la nature des données. Il est inclus dans chaque ZIP des données sur data.gouv.fr, j'en ai également mis une copie ici.
Le logiciel Open Refine a été utilisé pour manipuler les données et les préparer pour les visualisations. Open Refine a été configuré pour utiliser Java JDK 1.8 64 bits et 4 GB de mémoire vive.
J'ai ajouté des en-têtes de colonne dans REGIONAL_CPF4PAYSE.txt et REGIONAL_CPF4PAYSI.txt.
Les fichiers REGIONAL_CPF4PAYSE.txt, REGIONAL_CPF4PAYSI.txt, CPF4.txt et DEPT_REG.txt ont été chargés comme nouveaux projets dans Open Refine. Les chiffres sont traités commes des chaînes de caractère afin de servir de clé étrangère.
Les opérations suivantes on été effectuées sur REGIONAL_CPF4PAYSE.txt et REGIONAL_CPF4PAYSI.txt (Script JSON Open Refine):
Récupérer le nom des régions en fonction de leur code
Récupérer le nom des départements en fonction de leur code
Récupérer le nom des pays en fonction de leur code
Récupérer le nom des types de biens en fonction de leur code CPF4
Montant des importations et des exportations par région en fonction du pays d'origine/de destination et du type de bien (région + pays + type de bien) (visualisation)
Créer deux nouveaux projets dans Open Refine à partir des deux jeux de données enrichis pour les exportations, Exports-douanes-2013.csv, et les importations, Imports-douanes-2013.csv. Cette fois-ci, les chiffres sont considérés comme des chiffres lors de la création des projets.
Pour chacun de ces deux projets, les opérations suivantes ont été effectuées (Script JSON Open Refine exportations et importations):
Retirer les colonnes Département, Code département et trimestre
Somme des valeurs par CPF4 par jointure
Remplacement de "E" par "Exportation" et de "I" par "Importation" dans la colonne Flux
Montant des importations et des exportations par région en fonction du pays d'origine/destinataire (région + pays) (visualisation)
Créer deux nouveaux projets dans Open Refine à partir des deux jeux de données enrichis pour les exportations, Exports-douanes-2013.csv, et les importations, Imports-douanes-2013.csv. Cette fois-ci, les chiffres sont considérés comme des chiffres lors de la création des projets.
Pour chacun de ces deux projets, les opérations suivantes ont été effectuées (Script JSON Open Refine exportations et importations):
Retirer les colonnes Trimestre, CPF4 et code CPF4
Somme des valeurs par pays par jointure
Remplacement de "E" par "Exportation" et de "I" par "Importation" dans la colonne Flux