Revenir aux articles

L'entrepôt de données de santé de l'APHP

Accélérer le développement de Cohort360 avec des données synthétiques.

Photo de Anthony Dubois

Anthony Dubois

2 min de lecture — 30 mai 2022

Accélérer le développement de Cohort360 avec des données synthétiques

Contexte

L'Entrepôt de Données de Santé (EDS) de l'Assistance Publique – Hôpitaux de Paris (AP-HP) intègre des données administratives et médicales de plus de 8 millions de patients hospitalisés ou venus en consultation au sein des 39 établissements de l'AP-HP (figure 1).

➡️ Il s'agit du plus large entrepôt de données de santé en Europe et d'une précieuse aide à la recherche clinique.

Pour faciliter le travail de l'investigateur, l'AP-HP développe une interface Web, Cohort360. Cet outil simplifie la constitution de cohortes de patient à partir de critères d'inclusion et d'exclusion et offre, plus généralement, un accès intuitif aux données de l'EDS (figure 2).

Le développement de Cohort360 est collaboratif et open source, bénéficiant des contributions d'un réseau important de bénévoles constitué durant la crise du COVID-19.

👉 Ces collaborateurs extérieurs doivent pouvoir contribuer sans avoir accès aux données réelles de l'EDS.

Mission

L'AP-HP a confié à Akimed la réalisation d'un générateur de données médicales synthétiques. Ces données devaient imiter le plus possible les données réelles en respectant non seulement le schéma de la base de l'EDS (basé sur OMOP) mais également la sémantique clinique. Elles sont aujourd'hui utilisées pour les tests, les développements et les démonstrations de Cohort360.

Akimed a également contribué au développement de l'application Cohort360 proprement dite.

OMOP

Le Common Data Model (CDM) OMOP permet de systématiser la réalisation d'études observationnelles. Les bases de données patient, souvent hétérogènes, sont transformées dans un format standard (un CDM) qui prescrit des champs et une codification des terminologies. Ce faisant, des outils d'analyse, comme des algorithmes de machine learning, peuvent être réutilisés d'une étude observationnelle à l'autre s'ils respectent le CDM.

Méthodologie

1. Étude de l'existant

Les données synthétiques devaient coller le plus possible au schéma et à la sémantique des données patient de l'EDS. Nous avons donc commencé par étudier les schémas des bases de données de l'APHP ainsi que les API utilisées. La base de données principale était basée sur le Common Data Model OMOP et les API sur FHIR, deux standards que nous maîtrisons. Cette maîtrise a accéléré notre compréhension des systèmes d'information.

2. Développement du générateur de données synthétiques

Sur la base de nos analyses précédentes, nous avons réalisé un générateur de patients synthétiques. Ce générateur, basé sur Synthea , crée des évènements de soin et des antécédents médicaux à partir de protocoles et de prévalences issus de la littérature. Ces données synthétiques, de haute qualité, sont réalistes mais non réelles. Elles reflètent la structure de la base de données utilisée par l'Entrepôt de Données de Santé de l'AP-HP mais leur accès est peu coûteux et n'est contraint ni sur le plan de la confidentialité, ni sur le plan de la sécurité.

3. Développement de l'application Cohort360

L'application Cohort360 a été développée en React, une technologie JavaScript open source. Elle communique avec une API FHIR qui accède, en production, à la base OMOP de l'EDS et, durant le développement et les tests, à la base synthétique développée par Akimed. Ce mécanisme de « court-circuit » a accéléré la mise en production de Cohort360 (figure 3).

Impact

Plus de dix développeurs indépendants et externes à l'AP-HP ont pu collaborer au développement de Cohort360 grâce à l'utilisation de données de patients synthétiques. L'application Cohort360 a été open sourcée et peut être utilisée par d'autres structures hospitalières. Elle est aujourd'hui en production, utilisable par les médecins et les chercheurs de l'AP-HP qui peuvent rapidement trouver les patients répondant à des critères d'inclusion et d'exclusion pour accélérer leur travail.

📌 Le projet est disponible sur GitHub : github.com/aphp/cohort360


Le « plus » Akimed

  • Expertise pointue sur la structuration des données médicales
  • Maîtrise des standards FHIR et OMOP
  • Capacité à avancer rapidement tout en assurant la maîtrise des budgets
  • Méthodologie innovante basée sur la génération de données synthétiques réalistes, adaptées aux structures et à la sémantique
Prêts à avancer

Une cordée d'experts pour vos projets data & IA en santé

Votre stratégie d'innovation mérite toute la simplicité et la fiabilité du digital.

Discutons de vos enjeux, cadrons vos priorités et imaginons une feuille de route adaptée à votre organisation et à vos équipes.

Innovation digitale en santé