PII Analyzer

Detecteer persoonlijk identificeerbare informatie in uw tekst

De PII Analyzer scant uw tekst en identificeert gevoelige informatie zoals namen, e-mails, telefoonnummers, adressen en meer.

Hoe Het Werkt

De Analyzer gebruikt meerdere detectiemethoden om PII te identificeren:

Patroonherkenning

Reguliere expressies detecteren gestructureerde gegevens zoals e-mailadressen, telefoonnummers, creditcards en IBAN's met hoge nauwkeurigheid.

Machine Learning (NER)

Named Entity Recognition-modellen identificeren contextafhankelijke entiteiten zoals persoonsnamen, organisaties en locaties met behulp van spaCy, Stanza en Transformers.

Checksumvalidatie

Creditcards, IBAN's en andere financiële identificatoren worden gevalideerd met behulp van checksum-algoritmen (Luhn, MOD-97) om valse positieven te verminderen.

De Analyzer gebruiken

Stap 1: Voer uw tekst in

Navigeer naar de Anonimiseer-pagina
Plak of typ uw tekst in het invoerveld
De interface toont een teken telling en token schatting

Stap 2: Selecteer Entiteitstypen

Kies welke soorten PII u wilt detecteren:

Entiteitstypen	We ondersteunen 256 entiteitstypen georganiseerd in 10 categorieën:	Tekst - De daadwerkelijke tekst die als PII werd geïdentificeerd
Persoonlijk - Namen, e-mails, telefoonnummers, geboortedata	PERSON, EMAIL_ADDRESS, PHONE_NUMBER	John Doe, john@email.com
Financieel - Creditcards, bankrekeningen, IBAN, crypto wallets	CREDIT_CARD, IBAN_CODE, SWIFT_CODE	4111-1111-1111-1111
Locatie - Adressen, steden, landen, coördinaten	LOCATION, ADDRESS, COORDINATES	123 Main St, New York
Overheid - SSN, paspoortnummers, rijbewijzen, nationale ID's	SSN, PASSPORT, DRIVER_LICENSE	123-45-6789
Technisch - IP-adressen, MAC-adressen, apparaatsleutels	IP_ADDRESS, MAC_ADDRESS	192.168.1.1

Gebruik in plaats van handmatig entiteiten te selecteren, Presets om snel veelvoorkomende entiteitsconfiguraties toe te passen zoals "GDPR-naleving" of "Financiële gegevens".

Instead of selecting entities manually, use Presets to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Stap 3: Selecteer Taal

Kies de taal van uw tekst voor optimale detectienauwkeurigheid:

Automatisch detecteren - Laat het systeem de taal bepalen - Let the system determine the language
Specifieke taal - Kies uit 27 ondersteunde talen - Select from 27 supported languages

Taalselectie is belangrijk

Het selecteren van de juiste taal verbetert de detectienauwkeurigheid aanzienlijk, vooral voor persoonsnamen en locaties.

Stap 4: Voer Analyse uit

Klik op de Analyseer-knop
Wacht tot de analyse is voltooid (typisch 1-3 seconden)
Bekijk de gedetecteerde entiteiten in het resultaatpaneel

Resultaten begrijpen

Na de analyse toont elke gedetecteerde entiteit:

PERSONJohn Doevertrouwen

Positie: tekens

Resultaatvelden

Entiteitstype - De categorie van gedetecteerde PII (PERSON, EMAIL, enz.) - The category of PII detected (PERSON, EMAIL, etc.)
Tekst - De daadwerkelijke tekst die als PII werd geïdentificeerd - The actual text that was identified as PII
Vertrouwensscore - Hoe zeker het systeem is (0-100%) - How certain the system is (0-100%)
Positie - Begin- en eindpositie van tekens - Start and end character positions

Vertrouwensdrempel

Pas de vertrouwensdrempel aan om de gevoeligheid te regelen:

Drempel	Effect	Het beste voor
Laag	Meer entiteiten gedetecteerd, meer valse positieven	Maximale dekking, handmatige controle
Standaard	Gebalanceerde detectie en nauwkeurigheid	Algemeen gebruik
Hoog	Minder entiteiten, hogere zekerheid	Geautomatiseerde verwerking
Zeer hoog	Alleen zeer zekere overeenkomsten	Minimale interventie

Resultaten selecteren

Na de analyse kunt u verfijnen welke entiteiten u wilt anonimiseren:

Selecteer/Deselecteer alles

Gebruik het selectievakje in de kop om alle resultaten te selecteren of te deselecteren
Alleen geselecteerde entiteiten worden geanonimiseerd

Individuele selectie

Klik op individuele selectievakjes om specifieke entiteiten in of uit te sluiten
Nuttig wanneer de analyzer valse positieven detecteert
Nuttig wanneer u bepaalde informatie zichtbaar wilt houden

Filter op type

Klik op een entiteitstype-badge om resultaten op dat type te filteren
Selecteer snel alle entiteiten van een specifiek type

Bekijk de resultaten voordat u gaat anonimiseren. De analyzer kan af en toe valse positieven detecteren, vooral voor namen die ook veelvoorkomende woorden zijn.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.

Tokenkosten

Analysebewerkingen verbruiken tokens op basis van:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

text_k = Tekstlengte
entities_enabled = Entiteiten
entities_found = number of entities detected

Typische kosten

Tekstlengte	Entiteiten	Typische kosten
100 characters	3 types, 2 found	2 tokens
1,000 characters	5 types, 5 found	3 tokens
5,000 characters	10 types, 15 found	6 tokens
10,000 characters	15 types, 30 found	10 tokens

Token-systeemdocumentatie Token System documentation for complete pricing details.

Beste praktijken

✅Selecteer alleen de entiteitstypen die u nodig heeft - vermindert kosten en valse positieven

✅Gebruik taalspecifieke presets voor betere nauwkeurigheid in niet-Engelse tekst

✅Bekijk de resultaten voordat u gaat anonimiseren, vooral voor namen en locaties

✅Gebruik hogere vertrouwensdrempels voor geautomatiseerde verwerking

✅Verwerk tekst in redelijke stukken (onder de 10.000 tekens) voor de beste prestaties

Probleemoplossing

Entiteit niet gedetecteerd?

Zorg ervoor dat het entiteitstype is ingeschakeld in uw selectie
Probeer de vertrouwensdrempel te verlagen
Controleer of de juiste taal is geselecteerd
Controleer of het tekstformaat overeenkomt met de verwachte patronen

Te veel valse positieven?

Verhoog de vertrouwensdrempel
Deselecteer brede entiteitstypen zoals LOCATIE
Gebruik entiteit-specifieke presets in plaats van alles te selecteren

Analyse duurt te lang?

Verdeel grote teksten in kleinere stukken
Verminder het aantal geselecteerde entiteitstypen
Gebruik presets om te voorkomen dat ongebruikte detectiemodellen worden geladen

Next Steps

Anonimizer-gids

Leer hoe u gedetecteerde entiteiten kunt anonimiseren

Presets

Sla entiteitsconfiguraties op en hergebruik ze

Laatst bijgewerkt: maart 2026