Cadastre
Scripts permettant de préparer les données cadastrales diffusées par Etalab.
Prérequis
-
Node.js 16
-
yarn
-
Pour France entière : un CPU avec au moins 16 coeurs, ou beaucoup de patience
-
Pour France entière : au moins 190 Go d'espace disponible (50 pour les fichiers sources, 50 pour l'espace de travail, 30 pour les fichiers départementaux, 30 pour les fichiers communaux, 30 pour les Shapefile départementaux)
Installation
yarn global add @etalab/cadastre
Données sources
Pour produire la totalité des fichiers, il est nécessaire de se procurer :
Pour ne générer que les données GeoJSON et Shapefile, les données PCI/EDIGÉO par feuille telles que diffusées par Etalab remplacent les archives brutes ne pouvant être obtenues que par convention.
Production des fichiers
Actuellement la production des fichiers se déroule en 5 étapes, via 5 commandes.
Préparation des fichiers PCI
Tout d'abord la commande import-pci
explore le dossier contenant les archives départementales PCI, les décompresse et organise leur contenu pour la diffusion. Cette commande supporte à la fois les données PCI Vecteur et PCI Image.
L'import du PCI Vecteur au format DXF doit être fait séparément (facultatif mais nécessaire à la diffusion officielle).
Pour France entière l'opération ne prend que quelques minutes sur une machine moyenne.
cadastre-builder import-pci --bundle edigeo sources-edigeo/ dist/
cadastre-builder import-pci --bundle dxf-cc sources-dxf-cc/ dist/
sources-edigeo/
: dossier contenant les archives sources sous la forme ******depXX.zip
sources-dxf/
: dossier contenant les archives sources DXF sous la forme ******depXX.zip
dist/
: dossier de travail qui contiendra les données de sortie
Les types de bundle supportés sont : edigeo
, edigeo-cc
, dxf
et dxf-cc
.
La commande extract-pci
déclenche l'analyse et l'extraction de tous les départements et toutes les communes présentes dans le dossier de travail.
Les archives correspondant aux feuilles cadastrales, sous la forme XXXX-XXX-XX-XX.tar.bz2
, sont successivement extraites dans le répertoire temporaire de votre système puis analysées par le parser développé par Etalab.
Un fichier GeoJSON est produit pour chaque couche et pour chaque commune.
Pour France entière, l'opération prend environ 240 heures par coeur de CPU moderne disponible. Néanmoins le script gère efficacement la présence de multiples coeurs.
Sur une machine dédiée avec 48 coeurs le traitement prend environ 5 heures et 30 minutes.
cadastre-builder extract-pci dist/
NB : Les objets bruts sont systématiquement produits et placés dans un dossier raw
.
La commande extract-ems
déclenche l'analyse et l'extraction des données cadastrales mises à disposition par l'Eurométropole de Strasbourg..
Un fichier GeoJSON est produit pour chaque couche résultante et pour chaque commune.
L'opération dure moins de 5 minutes.
cadastre-builder extract-ems --rts chemin/vers/referentiel_topo_simplifie.zip --parcellaire chemin/vers/referentiel_parcellaire.zip dist/
À date, les liens de téléchargement sont les suivants :
Production des fichiers GeoJSON départementaux et nationaux
La commande merge
permet d'obtenir des fichiers GeoJSON départementaux à partir des fichiers communaux, et les fichiers nationaux.
L'opération France entière dure environ 30 minutes.
cadastre-builder merge dist/
Production des fichiers Shapefile départementaux et nationaux
La commande generate-shp
permet d'obtenir des fichiers Shapefile départementaux et nationaux à partir des fichiers GeoJSON.
L'opération France entière dure environ 30 minutes.
cadastre-builder generate-shp dist/
Licence
MIT