Comment fonctionne anonymize.today

Détection PII déterministe basée sur des regex qui fournit des résultats reproductibles à 100 %. Même entrée, même sortie—à chaque fois. Pas d'IA, pas de devinette, juste un appariement de motifs transparent.

Pourquoi Regex, pas IA ?

Notre approche

  • Résultats 100 % reproductibles
  • Entièrement auditable pour la conformité
  • Pas de données d'entraînement requises
  • Prise de décision transparente
  • Performance rapide et prévisible
  • Pas de dérive de modèle dans le temps

Approches IA/ML

  • Les résultats varient d'une exécution à l'autre
  • Prise de décision en boîte noire
  • Nécessite des données d'entraînement
  • Difficile à auditer
  • Coûts de calcul plus élevés
  • Dérive de modèle dans le temps

Le processus en 10 étapes

De l'entrée à la sortie, voici exactement ce qui se passe avec votre document

1

Texte d'entrée

Soumettez votre document via l'interface web, l'API ou l'Add-in Word

2

Détection de la langue

Le système identifie la langue du document pour un traitement optimal

3

Tokenisation

Le texte est découpé en tokens pour l'appariement de motifs

4

Appariement de motifs

Les motifs regex scannent 256 types d'entités

5

Analyse de contexte

Le texte environnant améliore la précision de détection

6

Évaluation de confiance

Chaque détection reçoit un score de confiance

7

Classification des entités

Les éléments détectés sont catégorisés par type

8

Examiner les résultats

Voir toutes les détections avec positions et scores

9

Appliquer l'anonymisation

Choisissez votre méthode : Remplacer, Rédiger, Hacher, Chiffrer ou Masquer

10

Document de sortie

Téléchargez votre document anonymisé

Questions Fréquemment Posées

Pourquoi anonymize.today utilise-t-il des regex au lieu de l'IA pour la détection des PII ?
La détection basée sur des regex donne des résultats 100 % reproductibles — la même entrée produit toujours la même sortie. Les modèles d'IA et d'apprentissage automatique peuvent produire des résultats différents entre les exécutions, souffrent de dérive de modèle au fil du temps et fonctionnent comme des boîtes noires difficiles à auditer. Pour la conformité réglementaire sous le GDPR et l'ISO 27001, les organisations ont besoin de processus explicables et répétables, ce que la correspondance de motifs basée sur des regex fournit exactement.
Quelle est la précision de la détection des PII ?
anonymize.today fournit des scores de confiance de 0,0 à 1,0 pour chaque détection. Les utilisateurs peuvent définir des seuils de confiance minimum pour contrôler la sensibilité. Les entités basées sur des motifs comme les numéros de carte de crédit et les numéros de sécurité sociale atteignent une précision de 95 à 99 %, tandis que les entités basées sur le NLP comme les noms et les lieux atteignent une précision de 85 à 95 %. La plateforme prend en charge 256 types d'entités avec des motifs soigneusement élaborés pour chacun.
Puis-je auditer comment anonymize.today traite mes données ?
Oui, chaque détection dans anonymize.today montre le motif exact correspondant, le score de confiance et le type d'entité identifié. L'Analyseur met en évidence les entités détectées avec des couleurs spécifiques à la catégorie et des positions dans le texte. Cette transparence totale facilite l'explication des décisions de détection aux auditeurs, aux responsables de la conformité ou aux autorités de protection des données.
Que se passe-t-il avec mes données pendant le traitement ?
Le texte soumis à anonymize.today est envoyé via des connexions chiffrées TLS 1.3 vers des serveurs certifiés ISO 27001 en Allemagne. Le texte est traité en mémoire à l'aide de Microsoft Presidio, et les résultats sont retournés immédiatement. Aucun contenu utilisateur n'est stocké sur les serveurs après traitement. Les données ne quittent jamais l'Union Européenne.
Comment anonymize.today gère-t-il plusieurs langues dans un même texte ?
anonymize.today prend en charge la détection automatique des langues pour identifier la langue principale d'un document. Pour les textes multilingues, les utilisateurs peuvent créer des préréglages personnalisés qui combinent des types d'entités à travers les frontières linguistiques. La plateforme prend en charge 27 langues de détection des PII utilisant spaCy, Stanza et des modèles Transformer, permettant la détection d'entités spécifiques à un pays comme les numéros fiscaux allemands, les numéros NIR français ou les numéros My Number japonais dans le même document.

Voyez-le en action

Essayez notre détection et anonymisation PII gratuitement avec 300 tokens par mois.