L'étude des liens entre environnement et santé mobilise le plus souvent des approches ciblées sur un polluant, une source d'exposition ou un milieu donné. À l'échelle écologique, ces analyses permettent d'identifier des associations spécifiques, mais peinent à restituer la complexité des contextes territoriaux et la contribution des environnements aux inégalités spatiales de santé. Dans cette perspective, les approches multidimensionnelles constituent une voie prometteuse pour appréhender la diversité environnementale des territoires. Les méthodes de clustering, en simplifiant des jeux de données massifs et hétérogènes, offrent en particulier un cadre pertinent pour révéler des configurations territoriales singulières et des gradients géographiques difficilement perceptibles autrement.
Inscrit dans le projet MRC-PE, lauréat des appels à projets du Health Data Hub et du Green Data for Health, ce travail vise à analyser, à l'échelle nationale, l'association entre le profil environnemental des communes et l'incidence de l'insuffisance rénale chronique terminale. La communication proposée se concentre sur la construction de la typologie environnementale des communes.
Un jeu de données environnemental a été constitué pour l'ensemble des communes de France métropolitaine (hors Corse). À partir de 18 sources de données publiques, 150 indicateurs spatialisés ont été produits, couvrant de multiples dimensions de l'environnement extérieur : niveaux de contamination des milieux, proximité aux sources de nuisances (industries, sites et sols pollués, réseau routier, etc...), occupation et usages des sols, pratiques agricoles, présence d'aménités environnementales, caractéristiques climatiques. Les données ont été harmonisées malgré la diversité des formats, échelles et structures afin de produire des indicateurs comparables au niveau communal. L'ensemble du jeu de données est librement accessible sur Recherche Data Gouv, accompagné des protocoles de traitement et scripts R déposés sur GitHub, dans une démarche de science ouverte et de reproductibilité.
La construction des profils environnementaux repose sur une démarche en quatre étapes : (i) sélection des indicateurs pertinents, (ii) préparation et normalisation des données, (iii) classification (analyse en composantes principales suivie d'une classification ascendante hiérarchique consolidée par un algorithme des k-means), (iv) interprétation des profils. Sept profils environnementaux ont été identifiés et décrits : (1) centres urbains, (2) périphéries urbaines et industrielles, (3) territoires agricoles intensifs soumis à des pressions multiples, (4) espaces viticoles, (5) territoires dominés par les grandes cultures, (6) systèmes agricoles diversifiés, (7) grands espaces naturels. Chaque profil fera l'objet d'une présentation détaillée, mettant en évidence les combinaisons de pressions et d'aménités environnementales qui le caractérisent.
Ce travail met également en lumière plusieurs limites et défis méthodologiques. À l'échelle nationale, la classification reste en partie structurée par les grands ensembles géomorphologiques (géologie, climats, paysages), même si le travail de sélection et d'harmonisation des indicateurs a permis d'en atténuer sensiblement l'influence. Parmi les pistes de développement figurent l'exploration de méthodes de clustering plus avancées et la construction de typologies thématiques plus ciblées, par exemple centrées sur la contamination des milieux. Ces perspectives visent à améliorer la finesse descriptive des profils et à renforcer leur capacité à éclairer les inégalités territoriales de santé.
PDF version