L’Entrepôt de Données SIDA pour L’ONUSIDA Genève

Dans un processus complexe de collecte de données impliquant de nombreuses sources de données et parties prenantes en santé publique, comment garantir que les données sont propres, complètes, reproductibles, formatées de manière cohérente, accessibles et sécurisées ?

Harmonisation de données de santé publique
Ingénierie logicielle
Relation avec les parties prenantes
Spécification des exigences logicielles
Python, Javascript, CKAN, Infrastructure Cloud
Développement Web

L’Entrepôt de Données SIDA pour ONUSIDA

Client: ONUSIDA Genève
Taille du projet: $400 000+
Chronologie: 2018 – Present

L’ONUSIDA est un programme qui fait partie du système des Nations Unies qui lutte contre le VIH et le SIDA. Nous travaillons directement avec le quartier général de l’ONUSIDA à Genève et l’équipe d’épidémiologiste dirigé par Dr Mary Mahy.

Leur but: mener et inspirer le monde pour atteindre l’accès universel à la prévention du VIH, le traitement, le soin et l’appui.

Leur vision: Aucune nouvelle infection VIH, aucune stigmatisation, aucun décès associé au SIDA.

A travers ce projet nous nous sommes engagés avec les parties prenantes venant de gouvernements à travers toute l’Afrique, le CDC, PEPFAR, et les institutions académiques à travers le monde.

En savoir plus

Contexte

ONUSIDA fournit régulièrement des estimations sur la façon dont l’épidémie de VIH évolue dans le monde. Voici quelques exemples :

  • Le taux de nouvelles infections.
  • Le nombre de personnes vivant avec le VIH.
  • Le nombre de personnes actuellement sous traitement.

Ces estimations sont basées sur des modèles mathématiques complexes qui sont construits avec des données provenant d’un grand nombre de sources à travers le monde.

  • Les sources de données utilisées dans les estimations de l’ONUSIDA comprennent :
  • Les données des programmes de santé provenant des systèmes d’information sanitaire des pays (par exemple, DHIS2).
  • Les données d’enquête provenant de sources telles que DHS et PHIA.
  • Les données géographiques infranationales convenues avec les ministères de la santé.
  • Les données de population provenant de sources telles que WorldPop ou des données de recensement national.

Problème

Les différentes sources ont utilisé différents formats de données et ces formats ont changé avec le temps.

Une grande partie des données nécessitaient un nettoyage et une validation, mais il n’existait pas de piste d’audit pour enregistrer ces changements.

Les ensembles de données nettoyés et validés étaient ensuite conservés sur les ordinateurs portables du personnel local dans des feuilles Excel et des documents Word.

Ils étaient partagés dans des e-mails non chiffrés sans licence claire, ce qui signifie que les données étaient oubliées ou perdues en cas de rotation du personnel ou de défaillance de l’équipement.

Solutions

ONUSIDA était conscient que la qualité des données entrantes était un facteur important pour déterminer la qualité de leurs estimations. Ils nous ont sollicités pour les aider à prendre le contrôle de l’effort de collecte de données, harmoniser leurs entrées de données et améliorer la qualité de leurs estimations.

Nous avons commencé par mener une série de groupes de discussion avec des parties prenantes du monde entier, y compris le personnel des Nations Unies, des universitaires et des ministères de la santé. Nous avons examiné et analysé des travaux similaires entrepris par d’autres organisations.

À partir de cela, nous avons compilé les spécifications des exigences logicielles pour un portail de données hébergé dans le cloud et construit avec le projet open-source CKAN. Après une nouvelle revue des parties prenantes, nous avons commencé à construire le portail de données en interne pour l’ONUSIDA.

Resultats

  • Le portail de données est un environnement de mise en scène pour valider, nettoyer et archiver les données à utiliser dans leur processus d’estimation.
  • Il garde une piste d’audit pour les données alors qu’elles subissent plusieurs tours de nettoyage et de validation.
  • Les données sont organisées avec les métadonnées nécessaires et archivées de manière sécurisée sur du matériel crypté et sauvegardé.
  • Une recherche puissante permet de découvrir les données, et les propriétaires de données ont le pouvoir de configurer qui peut accéder à leurs données et quand.
  • Des outils ont été développés pour faciliter les extraits de données automatisés à partir de systèmes tiers (DHIS2).
  • Une API permettant aux outils tiers d’écrire et de lire des données depuis le référentiel est également maintenue.

Le projet s’appelle le Réferentiel de données sur le SIDA (ADR) et peut être consulté ici (https://adr.unaids.org).

Ce que notre client dit sur nous

“Travailler avec Fjelltopp a été un plaisir. L’équipe est réactive à nos besoins techniques, a rapidement compris les complexités de notre travail de fond et a fait preuve de vision en identifiant des solutions que nos clients apprécieront.”

Dr Mary Mahy, Lead d’équipe d’epidémiologie, ONUSIDA Genève

Contactez-nous dès maintenant si vous avez besoin d’un espace consolidé pour valider, archiver et partager vos données.

Commencer