BLOG

Cinq sujets data à maîtriser d’ici 2026

Veltys Factory Veltys Academy
Directeur de Veltys Factory, Nicolas Forgues expose les cinq sujets qu’il estime fondamentaux à maîtriser dans les trois années qui viennent pour un data management efficace.

Les entreprises collectent de plus en plus de données mais ont toujours des difficultés à gérer ces données et donc à entrer de plein pied dans le data management, un domaine en constante et rapide évolution, reflet de l’accroissement des volumens et de la variété des données que chaque entreprise tente d’exploiter.

Au regard des différents secteurs que nous couvrons au sein de Veltys, nous avons identifié cinq grandes thématiques que nous considérons comme étant majeures pour venir renforcer l’appropriation et l’excellence dans le Data management.

Une pratique efficace du data management permet aux entreprises :

  • de piloter et élargir leur périmètre d’innovation,
  • de fournir des « aides à la décision » plus pertinentes allant jusqu’au temps réel,
  • d’améliorer les résultats.

 

1. Une data “fabrique” pour exploiter tout type de sources

Une data “fabrique” pour exploiter les donnéesBeaucoup d’entreprises, opèrent à la fois des technologies anciennes et nouvelles et dans des environnements hybrides (cloud et on premises) et afin de tirer le maximum de ces sources diverses et diffusent s’appuient sur une data fabrique

Une Data fabrique est un concept d’architecture qui vient collecter la donnée depuis différentes sources (cloud public, cloud privé, on-prem, terminaux IdO…) et la présenter de façon unifiée et accessible au travers d’une plateforme centralisée.

Le Gartner parle de « data fabric » et insiste sur le fait qu’au sein de cette usine, la « data fabric », un certain nombre de couches font appel à des techniques d’IA et plus précisément de machine learning pour adresser les questions de classification de la donnée, de découverte de la donnée et pour aider à assister la mise en place de la gouvernance sur ces données.¹

Ce principe de data fabrique permet aux entreprises de gérer efficacement leurs données et d’éliminer la fragmentation et d’augmenter la capacité à passer à l’échelle. Par ailleurs les prévisions des analystes montrent une croissance attendue de 21% jusqu’à 2030 démontrant à la fois une certaine maturité et un ancrage de la problématique data dans les entreprises.²

Les services financiers, la santé ainsi que la grande distribution sont les secteurs qui sont les plus à même d’accélérer la mise en œuvre d’architecture de data fabric.

L’enquête menée par IDC en lien avec Informatica intitulée “Driving Business Value from Data in the Face of Fragmentation and Complexity” met en lumière le fait qu’il est nécessaire d’aller au-delà de l’intégration de donnée et notamment jusqu’à la gestion intelligente des données : c’est ce qu’au sein de Veltys nous appelons le continuum data.

Cette étude publiée en décembre 2021, montre que selon les Chiefs Data Officers interrogés, la fragmentation des données est le point le plus bloquant dans l’exploitation des données. Ce qui amène plus de 50% des DSI à investir dans des approches de type data fabrique.³

Dans le domaine de la santé, le concept de data fabrique est un élément crucial : en effet, dans les hôpitaux et les instituts de recherche, la donnée est stockée dans différents départements au sein de multiples organisations (données patient, imagerie médicale, publications de recherches, …). En France, il y a un focus grandissant sur la notion d’entrepôt de données de santé avec un élargissement tant au niveau des données purement médicales vers les données administratives (durée de séjour, …). Une data fabrique fournit le potentiel d’optimiser les processus de recherche de données patients et d’obtenir des visions 360 des patients.

2.Le stockage flash (SSD) amené à supplanter le stockage sur Disque dur (HDD)

Clous stockage ssd

Pendant plus de 50 ans, les disques durs ont été la norme. Néanmoins, malgré son coût, de plus en plus d’entreprises sont tentées d’adopter le SSD pour le stockage de leurs données dans les années à venir pour 3 raisons principales.

  • Les baies de stockage 100 % Flash peuvent désormais contenir plus de données par rack que les disques durs 
  • les périphériques de stockage flash offrent une vitesse de lecture/écriture 4x par rapport aux disques durs.
  • Ce type de stockage est plus efficace et moins soumis aux erreurs

Les différents cloud providers fournissent des solutions de stockage par bloc, par fichier et objet sur ces supports SSD.  Sur la partie coût, il est attendu qu’à compter de 2025 il y ait une inversion de tendance sur les coûts entre les SSD et les HDD. IDC prévoit une hausse des dépenses des entreprises sur le SSD dans les années à venir.

Les développements technologiques autour du SSD ou du NVM (non volatile memory express) deviennent une préoccupation des entreprises au regard des bénéfices en termes de capacité et de performance améliorant de façon exponentielle la vitesse et la connectivité entre le stockage et les serveurs.

Sans rentrer dans les détails de chaque technologie, on note les performances attendues du PLC (Penta-level cells) qui, si disponible vers 2025 seulement, promet 25% de capacité en plus par rapport au QLC qui est également en développement. Lorsque l’on compare à la technologie actuelle (TLC), on parle de 66% de capacité additionnelle.⁵

3. La sécurité des données et les dangers liés aux Ransomware

Securité des donnéesLe sujet de la sécurité des données fait partie des points d’attention principaux des DSI.. Une étude menée par RUBRIK montre notamment que plus de la moitié des entreprises ont subi une attaque sur leurs données en 2022.

En outre le livre blanc réalisé par Rackspace Technology intitule “Cybersecurity Annual Research Report 2022”, met en exergue les éléments suivants :

  • 43% des IT leaders interviewés indiquent que la priorité numéro 1 en terme de cybersécurité concerne la protection des données critiques et des entrepôts de données
  • juste derrière les solutions de sécurité basés sur le cloud (DevSecOps, solutions de sécurité pour les containers,le CWP (Cloud workload protection) , le CASB (Cloud access security broker), la sécurité des données représentent le deuxième sujet d’importance en termes d’investissement avec des focus sur les solutions d’encryption, les solutions de DLP (Data loss prevention), les solutions de tokenization, les outils de sécurité des bases de données, etc. 

 

Si l’on regarde de plus près les évolutions en termes d’attaques, l’essor des Ransomware est un sujet de préoccupation grandissant : ZSCALER indique dans un rapport que les attaques de ransomware ont augmenté de près de 80% entre 2021 et 2022. En particulier, la santé est le secteur qui a vu la croissance la plus importante de ses attaques avec un taux de 650%.

D’ici à 2030, les experts en cybercriminalité estiment que les ransomware représenteront un coût d’exploitation de 250 milliards de dollars par an.

La cybercriminalité est devenue une véritable économie avec des approches en modèle d’intermédiation permettant de démultiplier la prolifération de ce type d’attaques : Il existe aujourd’hui des plateformes de Ransomware as a service (RaaS). Plus de 60% des attaques de Ransomware dans les 18 derniers mois l’ont été via des RaaS.

Le principe de ces RaaS est simple : avec ces plateformes, un développeur écrit le code et l’un des affiliés à la plateforme paye pour l’utiliser et lancer une attaque. FortiGuard Labs a identifié 10 666 “variants” sur S1 2022 alors qu’il en avait identifié 5 400 en S2 2021.

4. L’adoption des solutions d’AI et de ML pour gérer les risques et la sécurité liés aux données

Maîtriser l'IA

Se prémunir des attaques de Ransomware et des autres cyberattaques est ainsi devenu une top priorité pour le secteur du DATA management. Néanmoins, la quantité de compétences disponibles n’est pas suffisante pour répondre à la demande.

Dans l’étude “State of Cybersecurity 2022” de l’ISACA, 62% des organisations interviewés affirment être en sous-effectifs sur les professionnels en cybersécurité : en outre, 60% partagent le fait qu’elles ont des difficultés à retenir leurs ressources qualifiées dans ce domaine.

En parallèle, les charges de travail de ces spécialistes sont en constante augmentation. Déjà en 2021 dans une étude réalisée par Trendmicro, la moitié des spécialistes en cybersécurité affirmaient être submergés par le nombre d’alertes générant chez 55% des interviewés un manque de confiance dans la capacité à répondre à ces alertes.

Les moyens permettant de réduire ces manques de compétences passent par l’utilisation de l’IA et du machine learning en particulier pour capitaliser sur les connaissances humaines et démultiplier la capacité à répondre et à s’adapter à la diversité et au volume croissant des attaques de cybersécurité.

Les systèmes de prévention des fraudes de blocage de malwares de détection d’intrusions basés sur le ML représentent une réelle alternative pour pouvoir soulager les équipes sécurité.

À titre d’information, selon le cabinet d’analyse ACUMEN, le marché de la sécurité bases sur l’IA représentait près de 15 milliards de dollars en 2021 et les prévisions sont autour de 134 milliards pour 2030.

Le déploiement de plateforme utilisant l’IA est l’une des réponses les plus efficaces en termes de gestion des coûts liés à la sécurité : en particulier, les analyses utilisant le Machine learning pour la détection de menaces peuvent arrêter pres de 92% des attaques contre 60% pour des solutions basés sur des signatures.

Ce type de solution devient un élément crucial dans la stratégie de sécurisation des données. Ainsi, l’intégration de ces aspects dans les stratégies de stockage des entreprises va croître dans les années à venir.

5. L’expansion de l’accès aux données et à leur compréhension : l’acculturation et la gouvernance au cœur du sujet

Acculturation à la dataDernier élément, si dans le passé, la data était strictement gérée et contrôlée par l’IT, ce n’est plus le cas. Il est même nécessaire d’en accélérer la prise en compte et l’appropriation par les différents propriétaires de données au sein de l’entreprise. De plus en plus d’entités et d’individus dans l’entreprise ont besoin d’accéder à des données.

Cela vient exacerber les problématiques de sécurité et de conformité avec le besoin de les démultiplier au sein de l’entreprise. Cela vient notamment alimenter les besoins de créer des cadres d’utilisation et d’exploitation de la donnée en précisant les responsabilités et la gestion des droits au regard des usages de la donnée en entreprise.

L’analyse réalisée par McKinsey en 2019 met en avance qu’e certaines organisations investissent près de 7,5% de leur budget IT dans la gouvernance de la donnée et près de 10% dans la consommation des données.

En 2023, nous accompagnons notamment nos clients pour définir un plan visant à démocratiser l’accès et l’usage de la donnée : concrètement, mettre à disposition des données et fournir les outils et bonnes pratiques associés dans les mains des utilisateurs au plus près de leurs activités.

Ces approches Self service business analytics ou self service BI, self service data; visent à ne plus nécessiter d’intervention de leurs entités IT. Et le marché des plateformes et outils low code/no code vient accompagner ce besoin.
Mais au-delà de ces outils de business intelligence ou business analytics, la mise en œuvre d’un catalogue de donnée, le sponsoring au plus haut niveau et l’accompagnement continu dans la montée en compétences sont des éléments indispensables au succès de la transformation data.

Sur ce dernier point, l’acculturation et la formation restent un élément pivot à l’accélération de l’adoption de la data dans le quotidien d’une entreprise. Une étude globale menée par Carruthers & Jackson d’octobre 2022, démontre que 64% des organisations affirment que leurs employés manquent d’acculturation à la donnée : l’éducation des utilisateurs est un point d’attention clé sur lequel les entreprises vont devoir se pencher dans les prochaines années pour celles qui n’ont pas encore commencé.

À titre d’exemple sur le marché américain, FORRESTER, annonce que 75% des entreprises vont lancer un programme d’acculturation Data au niveau de l’entreprise dans sa globalité.

Conclusion

La gestion des données ou DATA management est un sujet toujours plus important dans un monde en recherche croissante d’opportunités d’utilisation de la donnée. L’AI et le machine learning sont également des apports pour adresser les challenges autour de la gestion de ces données, même cela vient augmenter les attentes en termes d’acculturation à la donnée sur l’ensemble de ces enjeux au sein de l’entreprise.

Les problématiques de fabrique de données, de capacité d’analyse self-service, de stockage, de performance et d’appropriation de la donnée sont en train de changer la façon dont la donnée était accessible et utilisée. Sa démultiplication passe par des organisations capables de développer et d’accompagner l’acculturation de leurs utilisateurs ainsi que de mettre en place des solutions pour gérer et organiser de la production jusqu’à l’exploitation de ces données.

 
 
Sources
⁵ 5-Bit PLC SSDs Not Coming Until 2025, or Later
Nicolas Forgues
Directeur Veltys Experts & Factory