À mesure que les lois sur la protection de la vie privée sont promulguées dans divers pays et régions, la capacité de découvrir des balises pertinentes indiquant des données personnelles ou sensibles (souvent appelées IPI - informations personnelles identifiables - et ISI - informations sensibles identifiables) devient de plus en plus importante.
La mise en place d'un système basé sur l’apprentissage automatique pour l'identification des renseignements personnels dans les documents électroniques peut entraîner plusieurs économies financières.