Big data : cela veut dire quoi ?

big-data-varlet

Alors que nous achetons des dispositifs de stockage à des prix incroyablement bas (je viens d’acheter une clef USB de 2To en porte-clef pour moins de 20€), il est difficile de se rendre compte de la volumétrie que peuvent prendre nos données.

Ainsi il est plus facile de compte en « nombre » de photos ou d’album de musique quand chaque décennie passons du Ko au Mo puis To comme « unité » de référence.

Qu’en est-il pour l’individu face à son stockage des données de santé ?

Si vous n’êtes pas malade, ou si vous n’avez jamais eu le loisir de vous rendre aux urgences pour un traumatisme, vous n’avez pas grand chose en stockage dans les « systèmes » des établissements ou bien de l’assurance maladie. Ainsi, vos données représentent de quelques Ko (quelques milliers d’octets tout de même) à quelques Mo puis au Giga Octet dès que l’imagerie intervient car bien que digitale, elle n’est pas numérique et consomme beaucoup de ressources (de façon exponentielle de la radio conventionnelle, à l’anatomopathologie en passant par l’IRM). L’analyse du génome ou d’autres données « omiques » fait passer le curseur au stade Tera.

Finalement ce n’est rien puisque chaque individu pourrait donc tout stocker sur un porte clef USB ?

 

Un volume qui double chaque année

La progression de la consommation du stockage a progressé 50 fois plus que la croissance de la population les 8 dernières années et nous DOUBLONS ce volume chaque année.

Au delà du stockage (et donc demain de la sauvegarde), il faut donc parler de la capacité de l’analyse et du traitement de la donnée (standardisée) pour un usage bénéfique. C’est donc un autre sujet, surtout si nous évoquons la dimension de la population.

 

une corrélation pour mieux comprendre.

Si un octet représentait une tête d’épingle et 1Ko une boite de 1000 épingles, vous allez comprendre ce que veut dire X1000 (10 puissance 3) chaque fois par cette représentation. Ainsi un petit Giga correspond à 3 containers d’épingles et 1To deux portes containers. Nous sommes à l’échelle de l’individu.

le passage à une population de 1000 personnes (un petit village), ferait qu’une partie de l’Ile de France serait couverte d’épingle…. les données épinglées d’un million de personne couvriraient une partie de l’Europe.

Sur une population française qui dispose d’une répartition gaussienne de quantité de données, la meilleur estimation porte à 25 HexaOctets aujourd’hui mais nus arriverons vite au « Zeta » en 2020, soit la taille du Pacifique en épingles….

 

Un seul acteur ne peut traiter seul ces infos

Ainsi nous comprenons qu’un seul acteur (hors GAFAMS) ne peut TRAITER correctement la santé digitale de demain et que seul l’association de compétences permettra de conserver une souveraineté numérique.

 

vincent@s492153600.onlinehome.fr/