Accueil A la une Big data : l’Europe a une carte à jouer

Big data : l’Europe a une carte à jouer

par Arthur Toce
europe big data

Nous avons vu hier que la qualité des données exploitées par les intelligences artificielles (IA) était une condition sine qua non de la qualité des algorithmes d’IA. Je vous ai parlé de dark data, une maladie bien pire que la junk data puisqu’elle est bidonnée.

Voyons aujourd’hui les choses du bon côté en nous demandant comment on produit des données de qualité et pourquoi l’Europe a, pour une fois, un coup d’avance.

Pourquoi Carrefour ne fait rien ou presque de ses données ?

Alors qui sait normaliser les données pour les rendre exploitables ? Il est clair que ce ne sont pas les vielles boîtes comme Carrefour, pourtant assis sur des milliards de données dans tous les sens sur les habitudes des clients, les paniers moyens, les saisonnalités, etc.

Du fait de l’historique, ce genre d’entreprise est incapable d’avoir un système informatique uniforme et d’en tirer de la valeur.

Je suis méchant, mais l’histoire le montre. Cela fait bien longtemps qu’ils auraient pu s’en servir. Pour moi, ce genre de boîtes, ce sont des réservoirs à junk datas (données pourries en français). Il y a beaucoup de choses, mais rien n’est uniforme, en aucun cas ce n’est normé et structurable.

A côté de cela, vous avez les titans de la tech qui jouent avec ces données depuis leur création, qui les normalisent et qui arrivent même à les exploiter quand elles sont légèrement diverses. Voilà le savoir-faire d’un Google ou d’un Amazon.

Et puis vous avez les sociétés spécialisées voire ultra-spécialisées, comme Pharnext pour la recherche pharmaceutique ou Median Technologies pour l’imagerie médicale. L’avantage puissant de ces boîtes, c’est que leur côté ultra-spécialisé va “simplifier” la collecte et la catégorisation des grandes masses de données.

Prenons Median Technologies (FR0011049824 – FR : ALMDT) qui va lire des IRM et d’autres images médicales. L’entraînement de son algorithme demande avant tout une grande quantité d’images de qualité avec des explications et des catégorisations bien spécifiées. Avec des personnes qualifiées et talentueuses – ici des radiologues – pour catégoriser et valider la data, l’entraînement du modèle prend du temps mais les risques d’erreur sont faibles.

graphe Median Technologies

Median Technologies : 750 % depuis la mi-mars. Y aurait-il un savoir-faire ?

Le XXIe siècle sera celui de la donnée (data is the new oil) et le principal risque pour les entreprises va devenir la maîtrise des données.

Santé : la chance des mégabases de données publiques

Pour une fois, l’Europe a un grand avantage. Oui, pour une fois, nous sommes en avance. Chez nous, les données sont réglementées et de plus en plus accessibles. Cela pourrait devenir un réel avantage. Certains secteurs pourraient grandement pâtir de l’ouverture de ces données et, au contraire, d’autres grandement y gagner.

Prenons l’exemple de votre dossier médical. Même s’il est certain que votre dossier personnalisé ne sera jamais vendu par l’assurance maladie ou un hôpital, l’assurance maladie propose une mégabase de données entièrement anonymisée.

C’est d’ailleurs cette base de données qui a permis à Pharnext, petite startup biotechnologique française, d’identifier 93 molécules potentiellement efficaces contre le COVID-19. Et certains militent pour aller plus loin.

Contrairement à ce que vous pourriez penser, ce n’est pas l’ogre Google – mais encore une fois Pharnext et son ancien P-DG “Daniel Cohen” – qui milite pour l’ouverture, accompagnée d’une anonymisation complète, de quasiment toutes les données de santé.

Il est d’autant plus vital pour les gouvernements d’ouvrir et de normer leurs datas que s’ils ne le font pas, ce sont les grands groupes comme les GAFA qui le feront d’une manière ou d’une autre. Ce seront alors les seules entités avec suffisamment de données normées et exploitables pour permettre leur exploitation.

S’ils se retrouvent dans cette situation, leur pouvoir sera alors vraiment celui de faire vivre ou mourir une entreprise.

Soyez-en sûr, les entreprises leaders de demain ne seront pas celles avec de la data, mais bien celles avec de la BONNE data. Pour nous, investisseurs dans le monde des technologies, il vaut mieux une petite entreprise de spécialité qui maîtrise la qualité et la quantité de ses données qu’un groupe millénaire avec des milliards de données hétéroclites et non exploitables !

Je pense que la révolution du big data et de l’IA sera le pilori des entreprises du XXe siècle ne s’étant pas correctement modernisées.

Si vous pensiez qu’Amazon allait tuer le retail, attendez de voir les dégâts que vont faire ceux qui ont accès à des données propres et les autres !

Soyez le premier informé des dernières Opportunités Technos directement dans votre boîte mail

Articles similaires

Laissez un commentaire