PII-analysator
Upptäck personligt identifierbar information i din text
PII-analysatorn skannar din text och identifierar känslig information som namn, e-post, telefonnummer, adresser och mer.
Hur det fungerar
Analyzern använder flera detektionsmetoder för att identifiera PII:
Mönstermatchning
Reguljära uttryck upptäcker strukturerad data som e-postadresser, telefonnummer, kreditkort och IBAN med hög noggrannhet.
Maskininlärning (NER)
Modeller för Namnigenkänning identifierar kontextberoende enheter som personnamn, organisationer och platser med hjälp av spaCy, Stanza och Transformers.
Kontrollsummevalidering
Kreditkort, IBAN och andra finansiella identifierare valideras med hjälp av kontrollsummealgoritmer (Luhn, MOD-97) för att minska falska positiva.
Använda Analyzern
Steg 1: Ange Din Text
- Navigera till Anonymisera-sidan
- Klistra in eller skriv din text i inmatningsområdet
- Gränssnittet visar en teckenräkning och en uppskattning av token
Steg 2: Välj Enhetstyper
Välj vilka typer av PII som ska upptäckas:
| Enhetstyper | Vi stöder 256 enhetstyper organiserade i 10 kategorier: | Text - Den faktiska text som identifierades som PII |
|---|---|---|
| Personlig - Namn, e-post, telefonnummer, födelsedatum | PERSON, EMAIL_ADDRESS, PHONE_NUMBER | John Doe, john@email.com |
| Finansiell - Kreditkort, bankkonton, IBAN, kryptovaluta plånböcker | CREDIT_CARD, IBAN_CODE, SWIFT_CODE | 4111-1111-1111-1111 |
| Plats - Adresser, städer, länder, koordinater | LOCATION, ADDRESS, COORDINATES | 123 Main St, New York |
| Statlig - SSN, passnummer, körkort, nationella ID | SSN, PASSPORT, DRIVER_LICENSE | 123-45-6789 |
| Teknisk - IP-adresser, MAC-adresser, enhets-ID | IP_ADDRESS, MAC_ADDRESS | 192.168.1.1 |
Istället för att välja enheter manuellt, använd Förinställningar för att snabbt tillämpa vanliga enhetskonfigurationer som "GDPR-efterlevnad" eller "Finansiella Data".
Instead of selecting entities manually, use Förinställningar to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".
Steg 3: Välj Språk
Välj språket för din text för optimal detektionsnoggrannhet:
- Automatisk detektion - Låt systemet bestämma språket - Let the system determine the language
- Specifikt språk - Välj från 27 stödda språk - Select from 27 supported languages
Språkval är Viktigt
Att välja rätt språk förbättrar avsevärt detektionsnoggrannheten, särskilt för personnamn och platser.
Steg 4: Kör Analys
- Klicka på Analysera-knappen
- Vänta på att analysen ska slutföras (vanligtvis 1-3 sekunder)
- Granska de upptäckta enheterna i resultatpanelen
Förstå Resultat
Efter analys visar varje upptäckt enhet:
Position: tecken
Resultatfält
- Enhetstyp - Kategorin av PII som upptäckts (PERSON, EMAIL, etc.) - The category of PII detected (PERSON, EMAIL, etc.)
- Text - Den faktiska text som identifierades som PII - The actual text that was identified as PII
- Konfidenspoäng - Hur säker systemet är (0-100%) - How certain the system is (0-100%)
- Position - Start- och slutteckenpositioner - Start and end character positions
Konfidensgräns
Justera konfidensgränsen för att kontrollera känslighet:
| Gräns | Effekt | Bäst för |
|---|---|---|
| Låg | Fler enheter upptäckta, fler falska positiva | Maximal täckning, manuell granskning |
| Standard | Balanserad detektion och noggrannhet | Allmänt bruk |
| Hög | Färre enheter, högre konfidens | Automatiserad bearbetning |
| Mycket Hög | Endast mycket säkra träffar | Minimal intervention |
Välja Resultat
Efter analys kan du förfina vilka enheter som ska anonymiseras:
Välj/Deselektera Alla
- Använd kryssrutan i rubriken för att välja eller deselektera alla resultat
- Endast valda enheter kommer att anonymiseras
Individuell Val
- Klicka på individuella kryssrutor för att inkludera/exkludera specifika enheter
- Användbart när analyzern upptäcker falska positiva
- Användbart när du vill behålla viss information synlig
Filtrera efter Typ
- Klicka på en enhetstyp-badge för att filtrera resultat efter den typen
- Välj/deselektera snabbt alla enheter av en specifik typ
Granska resultat innan anonymisering. Analyzern kan ibland upptäcka falska positiva, särskilt för namn som också är vanliga ord.
Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.
Tokenkostnader
Analysoperationer förbrukar tokens baserat på:
Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found
Final = ceil(Cost × 0.5)
Where:
text_k= Textlängdentities_enabled= Enheterentities_found= number of entities detected
Typisk Kostnad
| Textlängd | Enheter | Typisk Kostnad |
|---|---|---|
| 100 characters | 3 types, 2 found | 2 tokens |
| 1,000 characters | 5 types, 5 found | 3 tokens |
| 5,000 characters | 10 types, 15 found | 6 tokens |
| 10,000 characters | 15 types, 30 found | 10 tokens |
Token System dokumentation Token System documentation for complete pricing details.
Bästa Praxis
Felsökning
Enhet inte upptäckt?
- Se till att enhetstypen är aktiverad i ditt val
- Försök sänka konfidensgränsen
- Kontrollera att rätt språk är valt
- Verifiera att textformatet matchar förväntade mönster
För många falska positiva?
- Öka konfidensgränsen
- Deselektera breda enhetstyper som PLATS
- Använd enhetsspecifika förinställningar istället för att välja alla
Analysen tar för lång tid?
- Dela stora texter i mindre bitar
- Minska antalet valda enhetstyper
- Använd förinställningar för att undvika att ladda oanvända detektionsmodeller
Next Steps
Senast uppdaterad: Mars 2026