Coginov met à profit la technologie sémantique et l'intelligence artificielle pour transformer vos données non structurées en intelligence d’affaires

Coordonnées

1000 rue de Sérigny, suite 200 Longueuil, QC, J4K 5B1
Vous avez des questions ? 514.933.7495
Écrivez-nous info@coginov.com
Machine Learning

QoreAudit : Les mécanismes de la contextualisation sémantique.

Par Alkis Papadopoullos, PDG et Directeur Scientifique chez Coginov

À mesure que les lois sur la protection de la vie privée sont promulguées dans divers pays et régions, la capacité de découvrir des balises pertinentes indiquant des données personnelles ou sensibles (souvent appelées IPI – informations personnelles identifiables – et ISI – informations sensibles identifiables) devient de plus en plus importante. Pour y parvenir, il faut des outils et des algorithmes capables de mettre en contexte les mots-clés et les expressions textuelles afin de minimiser les faux positifs ou les faux négatifs lors de la découverte de données IPI ou ISI.  Typiquement ces données peuvent être des noms de personnes ou d’organisations, des numéros de téléphone, des adresses, des informations ou des dossiers financiers, des documents d’identification de citoyens, etc.

Pour répondre à ce besoin, nous présentons quelques idées sur les mécanismes de la contextualisation sémantique. Les plateformes qui tentent de découvrir et d’extraire de telles informations ont un ensemble d’attentes très tangibles, telles que l’obtention d’une liste de candidats possibles à l’examen des IPI ou des ISI et les appels à l’action qui s’ensuivent en ce qui concerne l’élimination, le stockage ou la protection de ces données. Cependant, cela s’avère très difficile à réaliser si l’analyse est basée uniquement sur l’extraction par force brute sans aucun contexte. Par exemple, ce qui semble être le nom d’une personne fait-il en réalité partie du nom d’une rue et donc d’une adresse ? Un nombre à seize chiffres est-il en fait un numéro de carte de crédit ? Etc.

L’analyse sémantique basée sur l’apprentissage automatique peut contribuer à atteindre ces objectifs, principalement parce qu’elle implique d’associer à chaque donnée sensible potentielle la signification de cette donnée ; elle équivaut donc à extraire et à stocker des concepts plutôt que des mots-clés. En identifiant les concepts ainsi que les entités nommées (données IPI et ISI), il est possible d’atteindre trois objectifs importants qui sont les pierres angulaires d’une identification fiable des informations personnelles :

  • Évitez de découper des unités conceptuelles composées de plusieurs mots (« mon numéro de carte de crédit est »).
  • Utiliser différentes catégories sémantiques pour faciliter la découverte de thèmes ou de concepts inattendus ou connexes.
  • Établir des corrélations entre les concepts pour fournir un contexte à l’analyse.

Le produit QoreAudit de Coginov permet d’atteindre précisément ces objectifs. En utilisant une approche de traitement du langage naturel qui combine l’analyse sémantique avec des algorithmes propriétaires d’apprentissage automatique, nous nous efforçons d’aider les utilisateurs à identifier de manière fiable le sens du contenu et à le relier à des données IPI et ISI potentielles. Cela améliore la capacité des clients à exploiter les données de manière fiable pour obtenir des informations exploitables, tout en réduisant le temps nécessaire à l’analyse des données pour tirer des conclusions pertinentes. Cela signifie que nous pouvons déterminer si un concept évoqué dans un commentaire fait clairement référence à un fragment de données personnelles ou sensibles.

Un autre avantage très important de la contextualisation sémantique est la possibilité de calculer le « profil sémantique » d’un document sur la base du type de données IPI et ISI extraites. Ce faisant, il est possible d’évaluer le niveau de « sensibilité » d’un document donné ou d’un ensemble de documents et de déterminer avec beaucoup plus de précision si les risques d’usurpation d’identité, de vol de propriété intellectuelle, d’acquisition de données financières sensibles, etc. sont plus élevés. En associant les concepts les plus pertinents aux données IPI et ISI potentielles, nous pouvons déterminer plusieurs choses très intéressantes :

  • Quel est le véritable facteur de risque associé à un document donné ou à un ensemble de documents ?
  • Le degré de chevauchement des concepts et des IPI ou ISI dans plusieurs documents.
  • Réduire la duplication des documents contenant des données IPI ou ISI, car les doublons multiplient les chances de voler plus efficacement des données privées).
  • Où sont concentrés les documents les plus risqués (c’est-à-dire à partir de quel répertoire de données, système de gestion documentaire voire de quelle source – personne, département, etc.).
  • Prendre des mesures pour lutter contre la perte de données privées en procédant à une évaluation concrète des risques et en lançant un appel à l’action précis !

En résumé, grâce à la contextualisation sémantique, le produit QoreAudit de Coginov permet aux clients d’obtenir plus rapidement des informations exploitables à partir de la plupart ou de l’ensemble de leurs plateformes de stockage de données, de comprendre pourquoi certains documents ou ensembles de documents sont plus risqués que d’autres, et de prendre des mesures tangibles pour protéger toutes les données IPI et ISI qu’ils détiennent. N’hésitez pas à nous contacter à l’adresse sales@coginov.com si vous souhaitez obtenir de plus amples informations ou une démonstration de notre produit.

COGINOV

Nous créons des solutions innovantes

COGINOV est reconnu comme un chef de file mondial dans les domaines des technologies sémantique et de la gestion de l’information. Nous sommes un éditeur de logiciels canadien qui propose à nos clients des solutions innovantes de gestion des informations structurées et non structurées. Notre siège social est établi à Montréal.

La technologie de la plateforme Qore de Coginov améliore la chaîne de valeur de l’information, transformant le contenu non structuré en informations hautement contextualisées, accessibles et de grande valeur. Les solutions de Coginov vous permettent de capturer, d’analyser, d’engager, d’automatiser et gérer vos actifs informationnels, avec une précision et une efficacité inégalée. 

Découvrez nos solutions QoreAudit, QoreUltima et QoreMail