PII Analyzer
Detecteer persoonlijk identificeerbare informatie in uw tekst
De PII Analyzer scant uw tekst en identificeert gevoelige informatie zoals namen, e-mails, telefoonnummers, adressen en meer.
Hoe Het Werkt
De Analyzer gebruikt meerdere detectiemethoden om PII te identificeren:
Patroonherkenning
Reguliere expressies detecteren gestructureerde gegevens zoals e-mailadressen, telefoonnummers, creditcards en IBAN's met hoge nauwkeurigheid.
Machine Learning (NER)
Named Entity Recognition-modellen identificeren contextafhankelijke entiteiten zoals persoonsnamen, organisaties en locaties met behulp van spaCy, Stanza en Transformers.
Checksumvalidatie
Creditcards, IBAN's en andere financiële identificatoren worden gevalideerd met behulp van checksum-algoritmen (Luhn, MOD-97) om valse positieven te verminderen.
De Analyzer gebruiken
Stap 1: Voer uw tekst in
- Navigeer naar de Anonimiseer-pagina
- Plak of typ uw tekst in het invoerveld
- De interface toont een teken telling en token schatting
Stap 2: Selecteer Entiteitstypen
Kies welke soorten PII u wilt detecteren:
| Entiteitstypen | We ondersteunen 256 entiteitstypen georganiseerd in 10 categorieën: | Tekst - De daadwerkelijke tekst die als PII werd geïdentificeerd |
|---|---|---|
| Persoonlijk - Namen, e-mails, telefoonnummers, geboortedata | PERSON, EMAIL_ADDRESS, PHONE_NUMBER | John Doe, john@email.com |
| Financieel - Creditcards, bankrekeningen, IBAN, crypto wallets | CREDIT_CARD, IBAN_CODE, SWIFT_CODE | 4111-1111-1111-1111 |
| Locatie - Adressen, steden, landen, coördinaten | LOCATION, ADDRESS, COORDINATES | 123 Main St, New York |
| Overheid - SSN, paspoortnummers, rijbewijzen, nationale ID's | SSN, PASSPORT, DRIVER_LICENSE | 123-45-6789 |
| Technisch - IP-adressen, MAC-adressen, apparaatsleutels | IP_ADDRESS, MAC_ADDRESS | 192.168.1.1 |
Gebruik in plaats van handmatig entiteiten te selecteren, Presets om snel veelvoorkomende entiteitsconfiguraties toe te passen zoals "GDPR-naleving" of "Financiële gegevens".
Instead of selecting entities manually, use Presets to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".
Stap 3: Selecteer Taal
Kies de taal van uw tekst voor optimale detectienauwkeurigheid:
- Automatisch detecteren - Laat het systeem de taal bepalen - Let the system determine the language
- Specifieke taal - Kies uit 27 ondersteunde talen - Select from 27 supported languages
Taalselectie is belangrijk
Het selecteren van de juiste taal verbetert de detectienauwkeurigheid aanzienlijk, vooral voor persoonsnamen en locaties.
Stap 4: Voer Analyse uit
- Klik op de Analyseer-knop
- Wacht tot de analyse is voltooid (typisch 1-3 seconden)
- Bekijk de gedetecteerde entiteiten in het resultaatpaneel
Resultaten begrijpen
Na de analyse toont elke gedetecteerde entiteit:
Positie: tekens
Resultaatvelden
- Entiteitstype - De categorie van gedetecteerde PII (PERSON, EMAIL, enz.) - The category of PII detected (PERSON, EMAIL, etc.)
- Tekst - De daadwerkelijke tekst die als PII werd geïdentificeerd - The actual text that was identified as PII
- Vertrouwensscore - Hoe zeker het systeem is (0-100%) - How certain the system is (0-100%)
- Positie - Begin- en eindpositie van tekens - Start and end character positions
Vertrouwensdrempel
Pas de vertrouwensdrempel aan om de gevoeligheid te regelen:
| Drempel | Effect | Het beste voor |
|---|---|---|
| Laag | Meer entiteiten gedetecteerd, meer valse positieven | Maximale dekking, handmatige controle |
| Standaard | Gebalanceerde detectie en nauwkeurigheid | Algemeen gebruik |
| Hoog | Minder entiteiten, hogere zekerheid | Geautomatiseerde verwerking |
| Zeer hoog | Alleen zeer zekere overeenkomsten | Minimale interventie |
Resultaten selecteren
Na de analyse kunt u verfijnen welke entiteiten u wilt anonimiseren:
Selecteer/Deselecteer alles
- Gebruik het selectievakje in de kop om alle resultaten te selecteren of te deselecteren
- Alleen geselecteerde entiteiten worden geanonimiseerd
Individuele selectie
- Klik op individuele selectievakjes om specifieke entiteiten in of uit te sluiten
- Nuttig wanneer de analyzer valse positieven detecteert
- Nuttig wanneer u bepaalde informatie zichtbaar wilt houden
Filter op type
- Klik op een entiteitstype-badge om resultaten op dat type te filteren
- Selecteer snel alle entiteiten van een specifiek type
Bekijk de resultaten voordat u gaat anonimiseren. De analyzer kan af en toe valse positieven detecteren, vooral voor namen die ook veelvoorkomende woorden zijn.
Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.
Tokenkosten
Analysebewerkingen verbruiken tokens op basis van:
Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found
Final = ceil(Cost × 0.5)
Where:
text_k= Tekstlengteentities_enabled= Entiteitenentities_found= number of entities detected
Typische kosten
| Tekstlengte | Entiteiten | Typische kosten |
|---|---|---|
| 100 characters | 3 types, 2 found | 2 tokens |
| 1,000 characters | 5 types, 5 found | 3 tokens |
| 5,000 characters | 10 types, 15 found | 6 tokens |
| 10,000 characters | 15 types, 30 found | 10 tokens |
Token-systeemdocumentatie Token System documentation for complete pricing details.
Beste praktijken
Probleemoplossing
Entiteit niet gedetecteerd?
- Zorg ervoor dat het entiteitstype is ingeschakeld in uw selectie
- Probeer de vertrouwensdrempel te verlagen
- Controleer of de juiste taal is geselecteerd
- Controleer of het tekstformaat overeenkomt met de verwachte patronen
Te veel valse positieven?
- Verhoog de vertrouwensdrempel
- Deselecteer brede entiteitstypen zoals LOCATIE
- Gebruik entiteit-specifieke presets in plaats van alles te selecteren
Analyse duurt te lang?
- Verdeel grote teksten in kleinere stukken
- Verminder het aantal geselecteerde entiteitstypen
- Gebruik presets om te voorkomen dat ongebruikte detectiemodellen worden geladen
Next Steps
Laatst bijgewerkt: maart 2026