L’interopérabilité et la structuration des données de santé : quels modèles privilégier au sein des établissements de santé hospitaliers
SantéLes données de santé sont collectées en France depuis les années 1970 dans le cadre primaire du soin et du codage des actes. Depuis quelques années, elles sont de plus en plus stockées à des fins d’utilisation secondaire[1], en particulier dans le cadre du déploiement des entrepôts de données de santé. Ce développement s’est accéléré depuis le lancement d’un appel à projet du ministère de la Santé doté de 75 M€ pour mettre en place et renforcer le réseau d’EDS d’ici 2025. Dans le rapport de la Haute Autorité de Santé publié en octobre 2022[2], 22 EDS hospitaliers sont recensés dont 17 en CHU et 18 en production.
Cette dynamique soulève, dans les établissements, la question centrale de l’interopérabilité des données de santé. En effet, l’hétérogénéité des données est particulièrement forte en raison de la multiplicité des formats de données, des applications et du fonctionnement en silo des systèmes d’information hospitaliers.
L’objet de cet article est d’éclairer les problématiques liées à l’interopérabilité, et d’aider les EDS dans leur travail de structuration des données (principaux standards existants, critères de choix de(s) standard(s) à utiliser, bonnes pratiques à adopter, …).
Notre conviction est que les principaux standards utilisés aujourd’hui sont complémentaires : ils répondent à des besoins différents. FHIR pourra ainsi être le socle général de l’entrepôt, auquel s’ajouteront des standards spécifiques pour répondre aux différents cas d’usage (OMOP pour la recherche, OSIRIS sur le sujet du cancer, …). Cela implique à la fois de prioriser la montée en compétences sur les standards généraux, afin d’initier la structuration de l’EDS, et de constituer, dans un second temps, des équipes possédant des compétences sur de multiples standards. La sélection des standards qui seront adoptés par l’établissement doit dépendre à la fois de la nature de son activité et du niveau d’adoption des dits standards, au niveau national et international.
Le choix des standards dépend des cas d’usage
Certains standards généraux sont aujourd’hui incontournables…
Le standard d’échange de données FHIR, créé aux États-Unis par Health Level 7 (HL7), est aujourd’hui devenu incontournable pour de très nombreux cas d’usage : le partage de documents, les applications numériques en santé et en particulier le développement de l’IoT en santé, la communication ville-hôpital grâce au dossier patient numérique.
Le standard FHIR permet à la fois d’échanger la donnée, de la modéliser et devient ainsi essentiel pour créer des applications numériques en santé. Il est également utilisé dans les entrepôts de données de santé : aussi bien pour le stockage de données, même si ce n’est pas son usage initial, que pour échanger et standardiser les données de l’entrepôt.
Ce standard est déjà très utilisé aux États-Unis puisqu’il y est devenu obligatoire dans les hôpitaux depuis le 31 décembre 2022. En France, il est moins implanté dans les établissements. Cela est dû en partie à l’absence d’expertise : en juillet 2023, seuls 8 experts étaient certifiés FHIR en France. FHIR occupe cependant déjà une place centrale dans les exigences d’interopérabilité mises en place par l’Agence du Numérique en Santé et de plus en plus d’établissements décident de l’adopter. La spécification est au cœur de la couche « service » du Cadre d’Interopérabilité des Systèmes d’Information de Santé (CI-SIS)[1]. En particulier, les modalités techniques d’échange de données entre Mon Espace Santé et les applications référencées sont basées sur le standard FHIR (voir schéma 1). Une connexion par API FHIR à l’Annuaire Santé est également exigée pour les Dispositifs Médicaux Numériques[2].
Schéma 1 : Illustration du fonctionnement de Mon Espace Santé
Le standard OMOP, créé aux États-Unis et géré par OHDSI, est également de plus en plus utilisé, principalement pour la recherche clinique. Son adoption s’étend en Europe, notamment grâce aux projets lancés par le réseau EHDEN[3]. L’utilisation de ce modèle est cependant contraignante pour les établissements de santé, et répond à un besoin spécifique d’exploitation de données cliniques générales pour la recherche. Cela en fait un standard important pour l’activité de recherche des établissements, mais il ne peut constituer le cœur de l’EDS.
… Mais ne permettent pas de faire l’économie de standards spécifiques lorsque le cas d’usage s’y prête
Si l’usage ou les données traitées sont spécifiques, un modèle de données général ne permettra pas d’extraire toute l’information nécessaire. Prenons l’exemple de l’oncologie : le modèle OMOP est-il suffisant pour l’analyse de cette pathologie ? Quelle est la valeur ajoutée du modèle OSIRIS développé en France par l’INCa ?
L’analyse de la structure de ces deux modèles de données montre que les approches sont significativement différentes (voir schéma 2) :
– OSIRIS contient un modèle de données cliniques, comme OMOP, mais également un modèle de données omiques, particulièrement utile en oncologie
– OSIRIS propose une représentation événementielle de la maladie carcinologique : le modèle clinique contient l’ensemble des événements tumoraux du patient (tumeur primitive, cancer, récidive métastatique, …), ainsi que les analyses biologiques associées dans le modèle omique
– Le modèle clinique contient les antécédents familiaux de cancer du patient, ainsi que ses pathologies liées
OSIRIS intègre donc dans sa structure de nombreux éléments propres au cancer et essentiels dans l’analyse de la pathologie : les antécédents génétiques, la vision événementielle et évolutive, les données biologiques. L’utilisation du modèle OSIRIS, plutôt qu’OMOP, permet donc une analyse plus précise et plus adaptée au phénomène étudié.
Schéma 2 : Illustration des modèles clinique (à gauche) et omique (à droite) dans OSIRIS
Data Sharing and Interoperability in Oncology » JCO Clin Cancer Inform
De nombreux standards doivent donc être connus et maîtrisés dans les EDSH
Selon le cas d’usage (recherche, pilotage, transfert de données, …) et selon le périmètre de celui-ci (plutôt général ou spécifique à une pathologie), le standard choisi sera donc différent. C’est pourquoi il est nécessaire que les équipes des entrepôts de données de santé hospitaliers maîtrisent les principaux standards. On note que cela est déjà le cas en général dans les EDS qui utilisent souvent à la fois OMOP et/ou i2b2 pour la recherche clinique, FHIR pour le partage de données, de nombreuses nomenclatures (LOINC, CIM, SNOMED CT, …) ainsi que des modèles ad-hoc propriétaires dans certains cas[1].
La cartographie ci-dessous montre la multiplicité des standards de données de santé selon le cas d’usage considéré (voir schéma 3).
Schéma 3 : La cartographie des standards de données de santé selon les cas d’usage
La plupart des standards ne sont donc pas concurrents mais complémentaires
Ils interviennent à différentes étapes du processus d’analyse des données
A l’inverse d’une vision dans laquelle les standards seraient « concurrents », il semble bien plutôt qu’ils soient complémentaires : ils répondent à différents besoins, et seront en ce sens utiles à différentes étapes de l’analyse. En particulier, pour un partage des données à une échelle supranationale, voire supra-européenne, il sera nécessaire d’utiliser des standards internationaux, malgré l’éventuelle perte de précision dans la structure des données.
Si l’on poursuit la comparaison d’OMOP / OSIRIS, le schéma OSIRIS intègre de nombreux éléments essentiels dans l’analyse du cancer, comme expliqué précédemment. Cela ne signifie pas qu’OMOP ne soit pas utile, à un niveau cependant plus macro de l’analyse (voir schéma 4). On peut imaginer par exemple une première étape de mise en commun des données à un niveau national (modèle OSIRIS) puis un mapping vers un modèle macro permettant l’analyse à un niveau international (modèle OMOP).
Schéma 4 : Illustration d’un processus de standardisation des données en oncologie
OMOP ne permettra pas de répondre à l’ensemble des besoins d’un ESDH mais FHIR pourra être le socle de l’entrepôt
Cette complémentarité des standards n’est cependant pas contradictoire avec une priorisation de leur mise en place. Pour initier le processus de structuration des données, les établissements doivent identifier des niveaux de priorités d’adoption : depuis les standards généraux, à adopter en priorité, vers les standards plus spécifiques à mesure que les établissements gagneront en maturité sur le sujet.
Le standard FHIR est donc à adopter en priorité pour constituer le socle de l’EDS, car il est suffisamment flexible et complet, bien qu’il ne spécifie pas le stockage des données. Cette absence de contraintes sur le stockage le rend adaptable à de nombreux environnements : des solutions de stockage incluant des connecteurs FHIR existent aujourd’hui. OMOP pourra également être adopté rapidement pour répondre à des besoins délimités liés à la recherche clinique. L’idéal pour un établissement est de disposer dans un premier temps de connecteurs FHIR, puis d’élaborer un mapping de ses données vers le modèle OMOP, en utilisant les nomenclatures adaptées.
À ce stade, l’établissement peut s’interroger sur les standards spécifiques qu’il aurait besoin de mettre en place (OSIRIS pour l’oncologie, Beacon pour la génomique, DICOM pour les images, …), en fonction de son activité.
L’utilisation à grande échelle reste cependant un critère central à prendre en compte avant d’adopter un standard
Pour définir les niveaux de priorité d’adoption, il est également important de prendre en compte les niveaux d’utilisation en France, en Europe et dans le monde.
La standardisation des données est en effet un processus long et complexe, qui engendre un investissement important, en moyens technique et humain. Elle ne peut être utile que si elle permet de partager un langage commun avec un grand nombre d’établissements et d’utilisateurs. Le calcul coût-bénéfice implique donc de prendre en compte le niveau d’utilisation à court terme et sa projection à long terme avant d’initier un processus de standardisation.
-
« Données de santé : libérer leur potentiel » Institut Montaigne, février 2024
-
Rapport du Sénat sur les données de santé, septembre 2023
-
Rapport « Entrepôts de données de santé hospitaliers en France. Quel potentiel pour la Haute Autorité de santé ? » Haute Autorité de Santé, octobre 2022