donnees

Home / donnees

DONNEES OUVERTES

Exemples de croisements de jeux de données

Le croisement de données peut permettre de trouver de nouveaux axes de réponses innovantes. Vous trouverez ci-dessous quelques exemples de croisement (corrélations).

Corrélations possibles, principaux datasets à croiser dans le cadre du C3 Challenge

* Donnée écologiques inventaire forestier https://www.data.gouv.fr/fr/datasets/donnee-ecologiques-inventaire-forestier/

Ce CSV vient compléter les données brutes de l’inventaire forestier disponibles sur le site de l’IGN.

http://inventaire-forestier.ign.fr/spip/spip.php?rubrique159

En reliant les 2 jeux de données par la variable « Point d’inventaire », on peut obtenir des informations sur la nature des sols et de l’environnement sur 65000 points géolocalisées.

Ces indicateurs peuvent être visualisés ou peuvent venir enrichir d’autres données comme celles de la base Eider.

https://www.data.gouv.fr/fr/datasets/entrepot-d-indicateurs-et-de-donnees-sur-l-environnement-eider/

over

* Contours IRIS : https://www.data.gouv.fr/fr/datasets/contours-iris/

Les contours IRIS ou  » Ilots Regroupés pour l’Information Statistique »

permettent de découper le territoire Français en 16100 zones de 1800 à

5000 habitants. De nombreux indicateurs INSEE sont disponibles à cette échelle http://www.insee.fr/fr/bases-de-donnees/default.asp?page=infracommunal.htm

et peuvent être utilisés pour enrichir n’importe quelles données géolocalisées.

* Entrepôt d’indicateurs et de données sur l’environnement (« Eider ») :

https://www.data.gouv.fr/fr/datasets/entrepot-d-indicateurs-et-de-donnees-sur-l-environnement-eider/

La base EIDER regroupe des indicateurs et données environmentales aggrégées au niveau régional et national depuis 1985. Une multitude de sujets sont couverts: agriculture, air et émissions atmosphériques, déchets, eau, état de la flore de la faune et des écosystèmes terrestres et marins, forêt, littoral, nuisances sonores, occupation du territoire et paysages, sols, énergie, logement, transport, emplois environnementaux, territoire et population, économie et société, radioactivité, risques naturels et technologiques, tourisme. La couverture globale de ces données permet le croisement avec d’autres sources aggrégées telles que les données de consommation énergétiques produites par RTE https://www.data.gouv.fr/fr/datasets/electricite-consommation-production-co2-et-echanges/

ou encore les données de modèles météo global de Météo France.

https://www.data.gouv.fr/fr/datasets/donnees-du-modele-atmospherique-global-arpege/

* Tronçons de cours d’eau Vigicrues, simplifiés avec niveau de vigilance crues :

https://www.data.gouv.fr/fr/datasets/troncons-de-cours-deau-vigicrues-simplifies-avec-niveau-de-vigilance-crues-2/

Le fichier geojson de vigicrue permet un aperçu en temps réel du niveau de vigilance crues sur tous les cours d’eau surveillés par le Service de Prévision des Crues (SPC). Des services géolocalisés peuvent être développés au dessus de ce flux de données en temps réel, tel que décrit sur le site Vigicrue: http://www.vigicrues.gouv.fr/faq.php?rub=5#q_51

* Permis de construire (PC), permis d’aménager (PA) et déclaration préalable (DP) (« Sit@del2 ») :

https://www.data.gouv.fr/fr/datasets/permis-de-construire-pc-permis-d-amenager-pa-et-declaration-prealable-dp-sit-del2

Les données des permis de contruire peuvent être aggrégées au niveau régional et reliées à divers indicateurs de la base EIDER comme ceux portant sur les risques naturels et technologiques ou sur le tourisme.

Elles peuevnt être également enrichies par les données disponibles autour du découpage IRIS effectué par l’INSEE

* Données de mesure de  pluviométrie, d’hydrologie, de sédiments, de chutes de neige produites par l’Institut de recherche en sciences et technologies pour l’environnement et l’agriculture (Irstea) :

https://www.data.gouv.fr/fr/datasets/?sort=-created&organization=55acbc5f88ee3854e7d98334

Les données de l’Irstea peuvent être reliées au données Vigicrue une fois ces dernières historisées ainsi qu’aux données Meteo France.

* Pétrole, électricité, gaz et autres statistiques de l’énergie (« pégase ») :

https://www.data.gouv.fr/fr/datasets/petrole-electricite-gaz-et-autres-statistiques-de-l-energie-pegase/

Les statistiques de l’énergie Pégase couvrent l’ensemble de la production, distribution et consommation d’énergie en France. Elles peuvent venir compléter les données publiées par RTE et ERDF.

* Electricité: consommation, production, CO2 et échanges produites le réseau de transport d’électricité (RTE) :

https://www.data.gouv.fr/fr/datasets/electricite-consommation-production-co2-et-echanges/

Les données publiées apr RTE fournissent une vision très précise de la consommation d’électricité aggrégée chaque quart d’heure au niveau nationale. L’origine de l’électricité consommée est également détaillée ainsi que les pays de destination des exportations.

Données ERDF :

https://www.data.gouv.fr/fr/organizations/electricite-reseau-distribution-france/

Les données ERDF peuvent venir compléter les données RTE pour donner une vision plus précise de la consommation d’électricité en France. La consommation par catégorie de clientèle est précisée, ainsi que les qualité de fourniture. Ces données peuvent servir à développer des indicateurs autour du réseau de distribution d’électricité en France.

Emissions de CO2 et de polluants des véhicules commercialisés en France :

https://www.data.gouv.fr/fr/datasets/emissions-de-co2-et-de-polluants-des-vehicules-commercialises-en-france/

Ces données publiées par l’ADEME comprennent pour chaque modèle de véhicule commercialisé en France les données de puissance, consommation et émissions de co2 et polluants. À la manière du dataset « Auto MPG »

https://archive.ics.uci.edu/ml/datasets/Auto+MPG publié par l’UCI qu’il peut venir compléter, ce jeu de données peut être utilisé pour de multiples travaux de datasciences.

* Données DRIAS produites par Météo France sur les projections climatiques à long terme (2021 à 2100) :

https://www.data.gouv.fr/fr/datasets/?sort=-created&organization=534fff8ba3a7292c64a77ed4

* Données de modèle météo à court terme sur la France (modèle AROM) :

https://www.data.gouv.fr/fr/datasets/donnees-du-modele-atmospherique-arome-a-aire-limitee-a-haute-resolution/

* Données de modèle météo à court terme sur le monde (modèle ARPEGE) :

https://www.data.gouv.fr/fr/datasets/donnees-du-modele-atmospherique-global-arpege/

INPN – Rérérentiel taxonomique TAXREF :

https://www.data.gouv.fr/fr/datasets/inpn-rererentiel-taxonomique-taxref/

INPN – Données du programme ‘Espaces Protégés’ :

https://www.data.gouv.fr/fr/datasets/inpn-donnees-du-programme-espaces-proteges/

INPN – Données du programme inventaire des Zones Naturelles d’Intérêt Ecologique Faunistique et Floristique (ZNIEFF) :

https://www.data.gouv.fr/fr/datasets/inpn-donnees-du-programme-znieff/

INPN – Données du programme Natura 2000 :

https://www.data.gouv.fr/fr/datasets/inpn-donnees-du-programme-natura-2000/

DONNEES SPECIFIQUES, RE-UTILISATION SOUS CONDITIONS

Conditions d’accès et d’usage des données spécifiques C3

Conditions d’accès et d’usage des données C3

TELECHARGEZ OU DEMANDEZ LES CLES DES DONNEES DEFIS UTILES EN AMONT DU CHALLENGE

Vous avez ou allez choisir au moins l’un des 26 défis du C3 Challenge et vous pouvez utiliser les données associées comme ressources. Elles ont été mises à votre disposition (soit, pour la majorité, en Open Data (via Etalab), soit sous condition ci-dessous pour les données spécifiques) via les liens existants sur la description de chaque DEFI à www.c3challenge.com/challenges . (Vous trouverez également l’ensemble des données ouvertes (Open Data) C3 dans les tableaux www.c3challenge.com/donnees  ou sur la plateforme Etalab  https://www.data.gouv.fr/fr/climate-change-challenge ). Les données spécifiques (CNES, IGN, EDF) et leurs conditions d’utilisation sont décrites ci-dessous pour le CNES, l’IGN et EDF.

CONDITIONS DE MISE  A DISPOSITION ET D’USAGE DES DONNEES, DANS LE CADRE DE L’INNOVATION JAM C3 CHALLENGE COP21 DU 6-8 NOVEMBRE 2015, A NANTES – PARIS – LYON – TOULOUSE.

La participation au C3 Challenge (Innovation Jam) du 6 – 8 Novembre 2015, ou le simple accès aux données mises à disposition, nécessitent d’avoir pris connaissance et d’accepter le règlement de participation au C3 Challenge (voir www.c3challenge.com/reglements ) et les conditions de mise à disposition et d’usage des données, outre les données ouvertes chez Etalab (voir https://www.data.gouv.fr/fr/climate-change-challenge ), ouvertes spécifiquement par le CNES, l’IGN et EDF (ci-dessous) pour le C3.

CONDITIONS IGN : Dans le cadre de votre inscription à l’Innovation Jam C3 Challenge (du 6 au 8 novembre), l’IGN souhaite vous faire bénéficier de l’accès aux clés API géoportail, en complément de ces données open data (data.gouv.fr).

Cette clef vous donnera un accès privilégié à l’ensemble des données IGN durant 7 mois. Si votre projet est retenu par le jury national C3,  cet accès aux données sera prolongé sur 12 mois ou le cas échant pendant la durée d’incubation IGNfab.

Pour sa mise à disposition, il vous suffit de prendre connaissance des conditions générales d’utilisation de la licence de développement de l’API géoportail disponibles au lien suivant :

http://api.ign.fr/conditions-generales  et de les accepter en signant le présent document C3.

CONDITIONS CNES : données Copernicus et des produits Théia.

Copernicus : Les données sont disponibles. Elles sont soumises à des conditions d’utilisations et à une identification. L’identification est gérée via le portail PEPS https://peps.cnes.fr/rocket/#/home. Chaque utilisateur, ayant besoin de ces données, peut d’ores et déjà se connecter au portail et effectuer un processus (très rapide) d’inscription. Dès lors il sera capable d’accéder aux données.

Théia : La majeure partie des produits disponibles sur Théia sont accessibles. Les produits sont soumis à licence et à une identification. L’identification est gérée via le portail THEIA https://sso.theia-land.fr/theia/app/register/register.xhtml. Chaque utilisateur, ayant besoin de ces données, peut également se connecter au portail dès aujourd’hui et effectuer un processus (très rapide) d’inscription. Dès lors il sera capable d’accéder aux données.

CONDITIONS et licence d’utilisation des données EDF : la mise à disposition et l’usage des données EDF accessibles depuis le site C3 sont totalement conditionnés et limités au strict challenge C3 cité (6 au 8 Novembre 2015). Ces données EDF décrites seront donc ouvertes auprès des équipes constituées autour de ces challenges d’innovation pour et pendant cette période du 6 au 10 Novembre 2015 (2 jours après la fin du challenge). Interdisant donc un quelconque usage des données EDF après le 10 Novembre, ni EDF ni l’organisation du C3 ne porterait la responsabilité d’un éventuel non respect de cet accord et cadre de mise à disposition et d’usage des données EDF. Si une équipe du challenge C3 voulait prolonger l’exploitation et l’usage encadré des données EDF, il lui faudra impérativement se rapprocher d’EDF, en discuter et signer directement avec EDF une licence spécifique d’usage qu’ils définiraient alors.

Les utilisateurs des données mises à disposition dans le cadre du C3 Challenge, ainsi que les participants au challenge C3, s’engagent à respecter ces conditions d’accès et d’usage spécifiées ci-dessus, au même titre que le règlement du concours.

 

Télécharger les conditions d’accès et d’usage des données spécifiques C3

Données spécifiques IGN

Dans le cadre de votre inscription à l’Innovation Jam C3 Challenge (du 6 au 8 novembre), l’IGN souhaite vous faire bénéficier de l’accès aux clés API géoportail, en complément de ces données open data (data.gouv.fr).

Cette clef vous donnera un accès privilégié à l’ensemble des données IGN durant 7 mois. Si votre projet est retenu par le jury national C3,  cet accès aux données sera prolongé sur 12 mois ou le cas échant pendant la durée d’incubation IGNfab.

Pour sa mise à disposition, il vous suffit de prendre connaissance des conditions générales d’utilisation de la licence de développement de l’API géoportail disponibles au lien suivant :

http://api.ign.fr/conditions-generales  et de les accepter en signant le présent document C3 lors de l’Innovation Jam.

Données spécifiques CNES

Données Copernicus et des produits Théia.

Copernicus : Les données sont disponibles. Elles sont soumises à des conditions d’utilisations et à une identification. L’identification est gérée via le portail PEPS https://peps.cnes.fr/rocket/#/home. Chaque utilisateur, ayant besoin de ces données, peut d’ores et déjà se connecter au portail et effectuer un processus (très rapide) d’inscription. Dès lors il sera capable d’accéder aux données.

Théia : La majeure partie des produits disponibles sur Théia sont accessibles. Les produits sont soumis à licence et à une identification. L’identification est gérée via le portail THEIA https://sso.theia-land.fr/theia/app/register/register.xhtml. Chaque utilisateur, ayant besoin de ces données, peut également se connecter au portail dès aujourd’hui et effectuer un processus (très rapide) d’inscription. Dès lors il sera capable d’accéder aux données.

Notice explicative de ré-utilisation des données EDF

NOTICE EXPLICATIVE sur les INFORMATIONS STATISTIQUES FOURNIES PAR EDF 

Cette table contient des informations portant sur les Points de Livraison (PDL) des clients Particuliers ayant un contrat de fourniture d’électricité chez EDF, situés sur les agglomérations urbaines de Paris, Lyon, Toulouse et Nantes, sur les trois années 2012 – 2014.

Les agglomérations urbaines sont définies selon les critères INSEE :

– Paris 00851 : http://www.insee.fr/fr/methodes/nomenclatures/zonages/zone.asp?zonage=UU2010&zone=00851

– Lyon 00758 : http://www.insee.fr/fr/ppp/bases-de-donnees/donnees-detaillees/duicq/uu_listecom.asp?reg=82&uu=00758

– Nantes 44701 : http://www.insee.fr/fr/ppp/bases-de-donnees/donnees-detaillees/duicq/uu_listecom.asp?reg=52&uu=44701

– Toulouse 31701 : http://www.insee.fr/fr/ppp/bases-de-donnees/donnees-detaillees/duicq/uu_listecom.asp?reg=73&uu=31701

La maille géographique retenue pour l’agrégation des données est l’IRIS :

1. Pour se conformer à la Réglementation Informatique et Libertés, les informations sont renseignées uniquement pour les IRIS contenant au moins 21 PDL ;

2. Un client peut avoir un ou plusieurs PDL (exemple : un client disposant d’une résidence principale et d’une résidence secondaire) ;

3. Seuls les PDL de clients EDF sont comptabilisés ici, à l’exclusion des PDL de clients d’autres fournisseurs ;

4. Les PDL dont la localisation géographique n’est pas suffisamment précise pour permettre l’attribution à un IRIS ne sont pas comptabilisés.

 nom de colonne 
 contenu 
Code IRIS
 identifiant de l’IRIS INSEE. L’INSEE fournit des variables (issues du recensement) à la maille IRIS. Les données INSEE sont disponibles à l’adresse : http://www.insee.fr/fr/bases-de-donnees/default.asp?page=infracommunal.htm
 Consommation moyenne consommation moyenne annuelle brute (sans correction météorologique) des PDL appartenant à l’IRIS, calculée comme le rapport entre la consommation annuelle totale brute et le nombre de PDL dans le même IRIS
 Année
 année

Télécharger ce document (notice explicative des données EDF)

Contactez nous

Not readable? Change text. captcha txt