22. Comment caractériser et qualifier la fiabilité des données disponibles ?

Home / / 22. Comment caractériser et qualifier la fiabilité des données disponibles ?
Description

PROBLÉMATIQUE

Disposer de données fiables est essentiel pour tirer une valeur ajoutée de l’analyse de données. En amont, il s’agit que les producteurs de données soient des sources certifiées. En aval, il s’agit de fournir aux réutilisateurs tous les éléments utiles afin qu’ils puissent faire un usage pertinent des données. Contrôle des données, collecte certifiée, documentation des usages, tri des données, mise en place d’indicateurs, mutualisation des données, accompagnement à l’utilisation et valorisation sont autant d’enjeux qui permettent de mieux caractériser la fiabilité des données disponibles. Ces questions se posent avec une acuité particulière dans le cas des données « crowdsourcées ».

Votre défi

Imaginer des solutions (organisations, applis, méthodes, produits, services, processus) pour garantir une mise à disposition fiable et facile d’utilisation des données.

Données

Défis secondaires

  • Comment caractériser la fiabilité des données disponibles ?
  • Comment utiliser les données pour mieux regarder le monde ?
  • Comment s’affranchir de la consommation énergétique pour faire fonctionner notre système d’information ?
  • Comment ne pas devenir dépendant de la donnée au risque de se priver de la valeur ?
  • Comment collecter des idées et les partager ?
Idées de l'Intelligence collective

IDEES

Evaluation / définition / indicateur

  • Mettre en place un service d’évaluation des données
  • Organiser une dotation des données  / sources par les utilisateurs
  • Mettre en place au niveau sociétal un dictionnaire commun de compréhension de l’évaluation de la fiabilité des données
  • Définir un guide d’évaluation de la fiabilité des données
  • Normalisation acceptée par la majorité des acteurs
  • Créer un code universel et obligatoire permettant de connaître le niveau de fiabilité d’une donnée
  • Donner la définition d’une donnée fiable
  • Normaliser la fiabilité des données par un groupe d’expert
  • Notions qualitatives des plateformes d’accès aux données
  • Contrôle de qualité :
  • Auto-contrôle
  • Contrôle par les utilisateurs
  • Notation
  • Donner un cadre (faire signer) ou une charte expliquant aux utilisateurs quelle est l’origine des données (opens) qu’il utilise
  • Définir des catégories de données en fonction de leur nature / type
  • Exiger une définition des modes de récupérations mesurés, traitements réalisés

Cadre / processus expert(ise)

  • Créer un détecteur (algorithmes) de déformation de la donnée (copier/coller/déformer)
  • Rediger une charte du diffuseur de données. (sur le modèle de la charte des journalistes)
  • Définir une charte qualité sur la mise à disposition des données
  • Engagement de respect d’un niveau de qualité : cotation
  • Fiabiliser les normes par l’expérience
  • Repenser les systèmes d’informations
  • Créer un système de notation d’une donnée en fonction de sa fiabilité
  • Expertisant la donnée par un comité d’expert
  • Expertisant la donnée par la masse d’utilisateur (dans le mode des Wikipédia)
  • Proposer un cadre d’évaluation des données pour la personne qui va réutiliser les données
  • Croiser les données pour valider leur fiabilité
  • Créer un procès de validation collectif de la donnée
  • Noter les données disponibles par rapport à leur réutilisation
  • Créer une hache autorité de contrôle pour les données trompeuses malhonnêtes etc (« gendarme de la donnée »)

Source de la donnée

  • Créer un réseau des ressources fiables
  • Black listes des sources de données douteuses
  • Identifier la fiabilité des sources d’information
  • Chacun doit publier ses scores de qualité
  • Elles doivent être vérifiables par des tiers indépendants
  • Eduquer enfants et citoyens à l’identification des sources d’une donnée et fiabilité
  • Identifier la source à l’origine de la donnée
  • Associer la donnée et les métadonnées par le producteur de la donnée
  • Identifier les causes / sources des données non fiables
  • Donner de la valeur aux données en fonction de leur fiabilité ➔ coût de la publicité / coût de la donnée

Utilisation / diffusion / communication

  • Proposer une quantité de donnée importantes réutilisable, ouvert, et répondants à un besoin
  • Supprimer les données non fiables pour avoir une « bonne base de données »
  • Créer un code visuel permettant d’identifier très rapidement la fiabilité d’une donnée
  • Valoriser les données fiables
  • Réutiliser la donnée autant que possible dans plusieurs domaines pour la consolider / confronter
  • Experts :
    • En métrologie
    • En législations
  • Cadre (privé / public ?) :
    • Normes
    • Chartes
    • Législation
  • Accès aux métadonnées catalogue de métadonnées
  • Métrologie (erreur des capteurs des données)
Related Projects
Contactez nous

Not readable? Change text. captcha txt
Sensibilisation icon-01Sensibilisation icon-01