Apprenez à “déverrouiller” vos données

Cela fait partie de la série de contenus Premium de Solutions Review, une collection de chroniques rédigées par des experts de l’industrie dans des catégories de logiciels en pleine maturité. Dans cette soumission, le fondateur et PDG de Vyasa, Christopher Bouton, propose des bases d’apprentissage en profondeur, comme la façon de « déverrouiller » vos données à l’aide de la technologie.

Les chefs de file de l’industrie estiment que près de 80 % des données organisationnelles sont obscures, cloisonnées dans des emplacements de stockage individuels et enfouies sous un contenu obsolète ou redondant. Par conséquent, les équipes manquent souvent d’informations essentielles nécessaires pour stimuler l’innovation, améliorer les services et garder une longueur d’avance sur la concurrence.

Ce scénario a amené les organisations de tous les secteurs à lutter pour utiliser leurs ensembles de données en croissance rapide. Par exemple, un hôpital crée en moyenne 50 pétaoctets de données par an. De ces données, près de 97 % ne sont pas utilisées. Pourtant, ces organisations investissent encore considérablement dans le stockage et l’analyse qui n’atteignent qu’une fraction de leurs données. Par exemple, les dépenses de stockage dans le cloud devraient à elles seules atteindre 137,3 milliards d’ici 2025.

Dans une tentative d’améliorer leurs pratiques d’utilisation des données, les organisations se sont tournées vers leurs équipes informatiques et de science des données pour la mise en œuvre, une entreprise généralement lourde de blocages d’infrastructure, de problèmes de confidentialité et de frustration, perdant finalement du temps et des ressources précieuses.

Heureusement, nous avons vu émerger une vague de solutions innovantes pour résoudre ce problème, en particulier dans l’avancement des modèles d’apprentissage en profondeur.

Apprentissage en profondeur : plus que de simples analyses prédictives

Lorsque l’on considère l’apprentissage en profondeur et l’intelligence artificielle, la plupart pensent à des capacités tournées vers l’avenir, comme des opérations «sans intervention» entièrement autonomes. Bien que ces fonctionnalités soient prometteuses, elles ne sont souvent implémentables que pour les organisations disposant d’un département d’apprentissage automatique très mature. Cependant, il existe des solutions semi-autonomes disponibles où l’apprentissage en profondeur a un impact sur les entreprises à toutes les étapes – en particulier en permettant aux individus et aux organisations de déverrouiller et d’opérationnaliser des ensembles de données complexes.

Les transformateurs, un type de modèle avancé d’apprentissage en profondeur, ont connu une grande popularité pour leur capacité à «comprendre» le texte dans le traitement du langage naturel (TAL) et, plus récemment, les tâches de vision par ordinateur. Ce qui différencie les transformateurs des autres modèles d’apprentissage en profondeur est leur capacité à comprendre le contexte autour des structures linguistiques dans une grande séquence de données.

Contrairement à un modèle traditionnel qui traite chaque terme séparément et en dehors du contexte de la séquence, les transformateurs utilisent l’auto-attention pour construire des représentations riches de chaque constituant dans la plage de données, permettant à ces modèles de comprendre la pertinence de l’emplacement d’un terme, la relation d’un terme à l’autre (même s’ils sont éloignés l’un de l’autre) et plus encore. Lorsqu’ils sont formés sur des ensembles de données plus volumineux, ces modèles atteignent une précision et un rappel remarquables pour comprendre des données non structurées telles que de grands documents de texte en langage naturel.

Qu’est-ce que cela signifie pour les défis actuels en matière de données ? Pour commencer, cela signifie que les montagnes de données non structurées que votre organisation stockait peuvent désormais être facilement recherchées et accessibles. Au lieu de s’appuyer en grande partie sur des métadonnées et des sources de données structurées telles que des feuilles de calcul ou des bases de données SQL, les organisations peuvent désormais débloquer des quantités massives d’informations précieuses qui seraient autrement impossibles à identifier sans avoir à rechercher manuellement dans le document.

Désormais, vous pouvez simplement poser des questions sur vos données non structurées et découvrir des points de données clés qui sont essentiels aux décisions commerciales. À leur tour, les organisations opérationnalisent désormais une partie importante de leurs données qui étaient coûteuses à stocker et qui n’apportaient auparavant que peu de valeur.

L’émergence de la Data Fabric

En plus d’améliorer la façon dont nous travaillons avec des types de données complexes, les transformateurs et autres modèles d’apprentissage en profondeur présentent un changement de paradigme dans la façon dont nous gérons les données. Connu sous le nom de Data Fabric, les organisations peuvent appliquer l’apprentissage en profondeur à leurs données pour s’éloigner des architectures monolithiques telles que les lacs de données ou les bases de données traditionnelles qui approfondissent souvent les silos et limitent l’accessibilité des données.

Avec une approche de structure de données, les modèles d’apprentissage en profondeur peuvent « ramper » dans ces sources de données disparates pour créer des index qui rendent le contenu facilement consultable et accessible. Cela peut être utilisé pour unifier des sources de données disparates sans avoir à reconfigurer les architectures existantes ou à subir des migrations de données coûteuses et chronophages. Par conséquent, les données sont instantanément accessibles à tous les utilisateurs d’une organisation.

Où l’apprentissage en profondeur a un impact aujourd’hui

La convergence des architectures d’apprentissage en profondeur et de tissu de données accélère notre accès aux connaissances et génère des informations dans toutes les organisations. Parmi les domaines qui connaissent le plus grand impact aujourd’hui, citons :

  • Sciences de la santé: La recherche et l’analyse d’une littérature complexe sont essentielles pour un certain nombre de tâches dans le domaine des soins de santé et des sciences de la vie, en particulier en ce qui concerne la découverte de médicaments à un stade précoce et la compréhension des maladies rares. Grâce à un tissu de données basé sur l’apprentissage en profondeur, les professionnels de la santé et des sciences de la vie peuvent rapidement identifier les informations qui accélèrent le développement de nouvelles thérapies, nous aident à comprendre les variables d’une nouvelle maladie et, en fin de compte, améliorent les parcours de soins.
  • L’enseignement supérieur: Les universités et autres établissements d’enseignement supérieur détiennent d’immenses quantités de connaissances. Cependant, en raison des structures des départements, ils sont également mûrs avec des silos. Tout cela peut être surmonté avec une structure de données qui peut améliorer l’accessibilité des données sur les campus, permettant une plus grande transparence, une collaboration interdépartementale et une innovation accrue.
  • Organismes gouvernementaux: Les agences étatiques et fédérales font l’objet d’efforts massifs de modernisation informatique. Les structures de données sont extrêmement prometteuses pour accélérer ce processus en permettant un aspect clé de l’amélioration de l’efficacité informatique : l’accessibilité des données. Avec une structure de données, les gouvernements des États et locaux peuvent améliorer l’accès aux documents nouvellement numérisés et créer des connexions de données entre les agences, ce qui améliore le service public, la planification future et plus encore.
  • Fabrication: La fabrication est une industrie incroyablement riche en données, mais a été confrontée à des silos et à un manque d’utilisabilité des données. Les structures de données peuvent servir de base à de nombreux efforts déjà en cours pour rendre ces données plus exploitables afin que les fabricants puissent améliorer des tâches telles que la R&D, le contrôle qualité, l’analyse des concurrents, etc.

Une nouvelle voie pour les données

L’évolution de l’apprentissage en profondeur a changé la façon dont nous abordons et interagissons avec les données. Notre accès nouvellement acquis à des informations précieuses a aujourd’hui un impact réel. Qu’il s’agisse de faire progresser la R&D autour de thérapies salvatrices, de permettre la collaboration au sein de l’enseignement supérieur, d’améliorer l’accessibilité des données pour les services publics ou d’améliorer le contrôle de la qualité de la fabrication, il ne s’agit pas de savoir si l’apprentissage en profondeur peut améliorer votre organisation, mais comment. Le tout avec une structure de données fournissant la base en cours de route.

Christophe Bouton
Derniers articles parChristophe Bouton (voir tout)

Leave a Comment

Your email address will not be published.