Blog de développement

Référentiel FRANCE-VOIES

Dernière Modification le :
2024-01-16

Dans la page sur les codes postaux je decris comment construire un referentiel de libellé de voie et de code postal à partir du fichier SIRENE Lire →.

Il existe un fichier plus complet, FANTOIR. Il est un peu compliqué à exploiter... Un autre réferentiel : BANO – La Base Adresses Nationale Ouverte. Lire →. Elle présente quelques avantages, dont celui d'être découpée par département, ce qui permet de manipuler des fichiers plus petits. On automatise la collecte des fichiers .csv pour une mise à jour mensuelle avec un script qui télécharge la liste, met à jour les CSV, concatene les fichiers 2A et 2B en un fichier 20, unique (Corse). Les CSV sont encodés en UTF-8, sans BOM. Le script VBS de telechargement et mise à jour est dans le ZIP de ressources

XXX

Chaque ligne ne doit pas excéder 38 caractères et ne pas comporter de signes de ponctuation ou d’accents.

xx

https://bano.openstreetmap.fr/data/full.csv.gz

XXX

http://www.open-soft.fr/Livres_Blanc_format%20PDF/2-Le%20format%20d%27une%20adresse%20Postale%20V1.pdf Lignes 4 à 6 : Seuls les caractères alphanumériques sont acceptés: a b c d e f g h i j k l m n o p q r s t u v w x y z A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 0 1 2 3 4 5 6 7 8 9 À noter : les codes postaux et les noms de communes s’écrivent sans tiret.

11.csv: HAM,"""""LES ALAUZES""""",11290 24.csv: ,"""LES GALERES BELLAIR",24410

lesseparaters csv peuvent être TAB, Virgule, point_virgule. ls separateurs de chaines peuvent être le guillement double ou le guillemet simple. On veut transformer tous les fichiers en csv séparé par virgule, simple, sans blanc superflu, sans tab, sans poin virgule, ni virgule, guillemets (simple ou double)

XXX

https://www.postcode.eu/fr/search/Rue%20S%C3%A9gffin%2C%2092400

XXX

https://docplayer.fr/982120-Regles-de-redaction-et-d-enregistrement-des-adresses-postales.html

L'usage d'UTF-8

Contrairement à ce que l'on peut lire sur Internet, l'objet FSO de Windows est parfaitement capable de lire et écrire en UTF-8, qui s'est imposé comme standard de facto. Certes Windows mets en avant ses 2 standards usuels (ANSI et UTF-16).;

  1. TristateTrue (1) : Cette valeur indique le mode Unicode (UTF-16 Little Endian). Cela est couramment utilisé pour les fichiers texte Unicode.
  2. TristateFalse (0) : Cette valeur indique le mode ANSI (encodage système par défaut)
  3. XXX

    S’ensuit une phase de traitement RNVP (Restructuration, Normalisation, Validation Postale)

    XXX

    Trouvez un éditeur hexadécimal en ligne : Il existe plusieurs éditeurs hexadécimaux en ligne. Vous pouvez simplement rechercher "éditeur hexadécimal en ligne" dans votre moteur de recherche préféré pour en trouver un. Un exemple est "hexed.it". Créez un nouveau fichier ou chargez un fichier existant : La plupart des éditeurs hexadécimaux en ligne vous permettent de créer un nouveau fichier ou de charger un fichier existant. Si vous créez un nouveau fichier, commencez par entrer du texte normal. Insérez des octets non conformes à UTF-8 : Pour insérer un octet non conforme à UTF-8, vous pouvez, par exemple, insérer l'octet C3 suivi de l'octet 28. C3 est le début d'un caractère UTF-8 à deux octets, mais 28 (qui représente la parenthèse ouvrante "(") n'est pas une continuation valide. Dans l'éditeur hexadécimal, cela pourrait ressembler à ceci (en fonction de l'éditeur) : Texte valide C3 28 Texte suivant... Sauvegardez le fichier : Une fois que vous avez inséré les octets non conformes, sauvegardez le fichier sur votre ordinateur. Testez avec iconv :
    					    
    XXX
    				
    				

    Le but est d'obtenir un jeu de fichiers.csv, par CP, contenant SIRET, nom de l'entreprise, la voie (type et libellé), la designation, la frequence dans Bano, la fraquence par nombre d'entreprises. Nom del'Entreprise n'est pas accessible directement par le fichier stocl SIRET

    HEXAVIA HEXAVIA est le référentiel des voies de France extraites des données de production de La Poste. Il permet le contrôle adresse de la ligne 4 (libellé de voie) et de la ligne 6 (code postal et libellé ligne 6). Il permet également le contrôle de la ligne 4 et de la ligne 5 + ligne 6 (cas d’ancienne commune ou de lieu dit). Les codes postaux sont uniquement les codes postaux de type « ménage ». Ce référentiel fait l'objet d'une mise à jour continue par les conseillers en fiabilisation des Centres de l’Adresse (CDA) à partir des délibérations prises en mairies et des remontées d’informations du réseau postal signalant les changements d'appellation ou les créations de voie. HEXAVIA contient plus de 2 millions de voies et 7 000 autres appellations des 36 600 communes de France. Les voies présentes dans le fichier sont les appellations officielles des voiries dénommées par les mairies, les appellations d'usage pour les éléments de voirie non dénommés (cas des hameaux, lieux-dits, routes nationales, résidences, lotissements…), et les voies synonymes.

    https://www.fichiers-postaux.com/