Montant des importations et des exportations en France pour l'année 2013, par Colin Maudry

Visualisations réalisées à partir du jeu de données "Statistiques régionales et départementales du commerce extérieur" publié sur data.gouv.fr par le Ministère des finances et des comptes publics, en utilisant l'outil Tableau Public.

En raison des limitations de la version gratuite de Tableau Public (1 million de lignes par visualisation, le jeu de données original en compte 3,6 millions), je n'ai pas pu combiner les quatre facettes de ce jeu de données dans la même visualisation (région, département, pays, type de bien). J'ai par conséquent conçu deux visualisations, chacune reprenant trois des quatre facettes.

Par défaut, la balance commerciale est affichée (exportations - importations). Vous pouvez n'indiquer que les exportations ou les importations en modifiant la valeur du champ Flux.

Visualisations publiées selon les termes de la Unlicense (renoncement au droit d'auteur au profit du domaine public).

Montant des importations et des exportations par région en fonction du pays d'origine/de destination et du type de bien (région + pays + type de bien)

Procédure de préparation des données

Télécharger le jeu de données final (797 649 lignes, 68,37 Mo)

Learn About Tableau

Montant des importations et des exportations par région et département en fonction du pays d'origine/destinataire (région + département + pays)

Procédure de préparation des données

Télécharger le jeu de données final (50 160 lignes, 3,02 Mo)

Learn About Tableau
comments powered by Disqus

Procédure de préparation des données

Enrichissement des données

Les visualisations utilisent les fichiers suivants, téléchargeables ici:

La direction générale des douanes a également eu la bonne idée d'ajouter un document décrivant en détails la nature des données. Il est inclus dans chaque ZIP des données sur data.gouv.fr, j'en ai également mis une copie ici.

Le logiciel Open Refine a été utilisé pour manipuler les données et les préparer pour les visualisations. Open Refine a été configuré pour utiliser Java JDK 1.8 64 bits et 4 GB de mémoire vive.

  1. J'ai ajouté des en-têtes de colonne dans REGIONAL_CPF4PAYSE.txt et REGIONAL_CPF4PAYSI.txt.
  2. Les fichiers REGIONAL_CPF4PAYSE.txt, REGIONAL_CPF4PAYSI.txt, CPF4.txt et DEPT_REG.txt ont été chargés comme nouveaux projets dans Open Refine. Les chiffres sont traités commes des chaînes de caractère afin de servir de clé étrangère.
  3. Les opérations suivantes on été effectuées sur REGIONAL_CPF4PAYSE.txt et REGIONAL_CPF4PAYSI.txt (Script JSON Open Refine):

    1. Récupérer le nom des régions en fonction de leur code
    2. Récupérer le nom des départements en fonction de leur code
    3. Récupérer le nom des pays en fonction de leur code
    4. Récupérer le nom des types de biens en fonction de leur code CPF4
    5. Retirer les entrées pour 2012
    6. Retirer les colonnes année et code région

Résultat : Exports-douanes-2013.csv et Imports-douanes-2013.csv.

Montant des importations et des exportations par région en fonction du pays d'origine/de destination et du type de bien (région + pays + type de bien) (visualisation)

  1. Créer deux nouveaux projets dans Open Refine à partir des deux jeux de données enrichis pour les exportations, Exports-douanes-2013.csv, et les importations, Imports-douanes-2013.csv. Cette fois-ci, les chiffres sont considérés comme des chiffres lors de la création des projets.
  2. Pour chacun de ces deux projets, les opérations suivantes ont été effectuées (Script JSON Open Refine exportations et importations):

    1. Retirer les colonnes Département, Code département et trimestre
    2. Somme des valeurs par CPF4 par jointure
    3. Remplacement de "E" par "Exportation" et de "I" par "Importation" dans la colonne Flux
  3. Export des deux projets et fusion dans un seul fichier ImportsExports-douanes-2013-no-d-partment.csv.
  4. Création d'un nouveau projet Open Refine à partir de ImportsExports-douanes-2013-no-d-partment.csv.
  5. Dans ce nouveau projet, les opérations suivantes ont été effectuées (Script JSON Open Refine):

    1. Tranformer les valeurs d'importations en valeurs négatives
    2. Faire la somme des valeurs d'exportations et d'importations
    3. Le flux devient "Balance" en lieu et place de "Exportation" et "Importation".
  6. Export du projet dans le fichier Balance-douanes-2013-no-d-partement.csv et fusion avec ImportsExports-douanes-2013-no-d-partement.csv pour obtenir le fichier final, ImportsExportsBalance-douanes-2013-no-d-partement.csv.

Montant des importations et des exportations par région en fonction du pays d'origine/destinataire (région + pays) (visualisation)

  1. Créer deux nouveaux projets dans Open Refine à partir des deux jeux de données enrichis pour les exportations, Exports-douanes-2013.csv, et les importations, Imports-douanes-2013.csv. Cette fois-ci, les chiffres sont considérés comme des chiffres lors de la création des projets.
  2. Pour chacun de ces deux projets, les opérations suivantes ont été effectuées (Script JSON Open Refine exportations et importations):

    1. Retirer les colonnes Trimestre, CPF4 et code CPF4
    2. Somme des valeurs par pays par jointure
    3. Remplacement de "E" par "Exportation" et de "I" par "Importation" dans la colonne Flux
  3. Export des deux projets et fusion dans un seul fichier ImportsExports-douanes-2013-no-CPF4.csv.
  4. Création d'un nouveau projet Open Refine à partir de ImportsExports-douanes-2013-no-CPF4.csv.
  5. Dans ce nouveau projet, les opérations suivantes ont été effectuées (Script JSON Open Refine):

    1. Tranformer les valeurs d'importations en valeurs négatives
    2. Faire la somme des valeurs d'exportations et d'importations
    3. Le flux devient "Balance" en lieu et place de "Exportation" et "Importation".
  6. Export du projet dans le fichier Balance-douanes-2013-no-CPF4.csv et fusion avec ImportsExports-douanes-2013-no-CPF4.csv pour obtenir le fichier final, ImportsExportsBalance-douanes-2013-no-CPF4.csv.