common.skipToContent

PII Analyzer

Detecteer persoonlijk identificeerbare informatie in uw tekst

De PII Analyzer scant uw tekst en identificeert gevoelige informatie zoals namen, e-mails, telefoonnummers, adressen en meer.


Hoe Het Werkt

De Analyzer gebruikt meerdere detectiemethoden om PII te identificeren:

Patroonherkenning

Reguliere expressies detecteren gestructureerde gegevens zoals e-mailadressen, telefoonnummers, creditcards en IBAN's met hoge nauwkeurigheid.

Machine Learning (NER)

Named Entity Recognition-modellen identificeren contextafhankelijke entiteiten zoals persoonsnamen, organisaties en locaties met behulp van spaCy, Stanza en Transformers.

Checksumvalidatie

Creditcards, IBAN's en andere financiële identificatoren worden gevalideerd met behulp van checksum-algoritmen (Luhn, MOD-97) om valse positieven te verminderen.


De Analyzer gebruiken

Stap 1: Voer uw tekst in

  1. Navigeer naar de Anonimiseer-pagina
  2. Plak of typ uw tekst in het invoerveld
  3. De interface toont een teken telling en token schatting

Stap 2: Selecteer Entiteitstypen

Kies welke soorten PII u wilt detecteren:

EntiteitstypenWe ondersteunen 256 entiteitstypen georganiseerd in 10 categorieën:Tekst - De daadwerkelijke tekst die als PII werd geïdentificeerd
Persoonlijk - Namen, e-mails, telefoonnummers, geboortedataPERSON, EMAIL_ADDRESS, PHONE_NUMBERJohn Doe, john@email.com
Financieel - Creditcards, bankrekeningen, IBAN, crypto walletsCREDIT_CARD, IBAN_CODE, SWIFT_CODE4111-1111-1111-1111
Locatie - Adressen, steden, landen, coördinatenLOCATION, ADDRESS, COORDINATES123 Main St, New York
Overheid - SSN, paspoortnummers, rijbewijzen, nationale ID'sSSN, PASSPORT, DRIVER_LICENSE123-45-6789
Technisch - IP-adressen, MAC-adressen, apparaatsleutelsIP_ADDRESS, MAC_ADDRESS192.168.1.1

Gebruik in plaats van handmatig entiteiten te selecteren, Presets om snel veelvoorkomende entiteitsconfiguraties toe te passen zoals "GDPR-naleving" of "Financiële gegevens".

Instead of selecting entities manually, use Presets to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Stap 3: Selecteer Taal

Kies de taal van uw tekst voor optimale detectienauwkeurigheid:

  • Automatisch detecteren - Laat het systeem de taal bepalen - Let the system determine the language
  • Specifieke taal - Kies uit 27 ondersteunde talen - Select from 27 supported languages

Taalselectie is belangrijk

Het selecteren van de juiste taal verbetert de detectienauwkeurigheid aanzienlijk, vooral voor persoonsnamen en locaties.

Stap 4: Voer Analyse uit

  1. Klik op de Analyseer-knop
  2. Wacht tot de analyse is voltooid (typisch 1-3 seconden)
  3. Bekijk de gedetecteerde entiteiten in het resultaatpaneel

Resultaten begrijpen

Na de analyse toont elke gedetecteerde entiteit:

PERSONJohn Doevertrouwen

Positie: tekens

Resultaatvelden

  • Entiteitstype - De categorie van gedetecteerde PII (PERSON, EMAIL, enz.) - The category of PII detected (PERSON, EMAIL, etc.)
  • Tekst - De daadwerkelijke tekst die als PII werd geïdentificeerd - The actual text that was identified as PII
  • Vertrouwensscore - Hoe zeker het systeem is (0-100%) - How certain the system is (0-100%)
  • Positie - Begin- en eindpositie van tekens - Start and end character positions

Vertrouwensdrempel

Pas de vertrouwensdrempel aan om de gevoeligheid te regelen:

DrempelEffectHet beste voor
LaagMeer entiteiten gedetecteerd, meer valse positievenMaximale dekking, handmatige controle
StandaardGebalanceerde detectie en nauwkeurigheidAlgemeen gebruik
HoogMinder entiteiten, hogere zekerheidGeautomatiseerde verwerking
Zeer hoogAlleen zeer zekere overeenkomstenMinimale interventie

Resultaten selecteren

Na de analyse kunt u verfijnen welke entiteiten u wilt anonimiseren:

Selecteer/Deselecteer alles

  • Gebruik het selectievakje in de kop om alle resultaten te selecteren of te deselecteren
  • Alleen geselecteerde entiteiten worden geanonimiseerd

Individuele selectie

  • Klik op individuele selectievakjes om specifieke entiteiten in of uit te sluiten
  • Nuttig wanneer de analyzer valse positieven detecteert
  • Nuttig wanneer u bepaalde informatie zichtbaar wilt houden

Filter op type

  • Klik op een entiteitstype-badge om resultaten op dat type te filteren
  • Selecteer snel alle entiteiten van een specifiek type

Bekijk de resultaten voordat u gaat anonimiseren. De analyzer kan af en toe valse positieven detecteren, vooral voor namen die ook veelvoorkomende woorden zijn.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.


Tokenkosten

Analysebewerkingen verbruiken tokens op basis van:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

  • text_k = Tekstlengte
  • entities_enabled = Entiteiten
  • entities_found = number of entities detected

Typische kosten

TekstlengteEntiteitenTypische kosten
100 characters3 types, 2 found2 tokens
1,000 characters5 types, 5 found3 tokens
5,000 characters10 types, 15 found6 tokens
10,000 characters15 types, 30 found10 tokens

Token-systeemdocumentatie Token System documentation for complete pricing details.


Beste praktijken

Selecteer alleen de entiteitstypen die u nodig heeft - vermindert kosten en valse positieven
Gebruik taalspecifieke presets voor betere nauwkeurigheid in niet-Engelse tekst
Bekijk de resultaten voordat u gaat anonimiseren, vooral voor namen en locaties
Gebruik hogere vertrouwensdrempels voor geautomatiseerde verwerking
Verwerk tekst in redelijke stukken (onder de 10.000 tekens) voor de beste prestaties

Probleemoplossing

Entiteit niet gedetecteerd?

  • Zorg ervoor dat het entiteitstype is ingeschakeld in uw selectie
  • Probeer de vertrouwensdrempel te verlagen
  • Controleer of de juiste taal is geselecteerd
  • Controleer of het tekstformaat overeenkomt met de verwachte patronen

Te veel valse positieven?

  • Verhoog de vertrouwensdrempel
  • Deselecteer brede entiteitstypen zoals LOCATIE
  • Gebruik entiteit-specifieke presets in plaats van alles te selecteren

Analyse duurt te lang?

  • Verdeel grote teksten in kleinere stukken
  • Verminder het aantal geselecteerde entiteitstypen
  • Gebruik presets om te voorkomen dat ongebruikte detectiemodellen worden geladen

Next Steps

Laatst bijgewerkt: maart 2026