Analizor PII
Detectați informații personale identificabile în textul dumneavoastră
Analizorul PII scanează textul dumneavoastră și identifică informații sensibile precum nume, emailuri, numere de telefon, adrese și altele.
Cum funcționează
Analyzerul folosește multiple metode de detectare pentru a identifica PII:
Potrivirea modelului
Expresiile regulate detectează date structurate precum adrese de email, numere de telefon, carduri de credit și IBAN-uri cu o acuratețe ridicată.
Învățare automată (NER)
Modelele de recunoaștere a entităților numite identifică entități dependente de context, precum nume de persoane, organizații și locații folosind spaCy, Stanza și Transformers.
Validarea checksum-ului
Cardurile de credit, IBAN-urile și alte identificatori financiari sunt validate folosind algoritmi de checksum (Luhn, MOD-97) pentru a reduce falsurile pozitive.
Folosind Analyzerul
Pasul 1: Introduceți Textul Dvs.
- Navigați la pagina Anonymize
- Lipiti sau tastați textul dvs. în zona de introducere
- Interfața arată un număr de caractere și o estimare a token-urilor
Pasul 2: Selectați Tipurile de Entități
Alegeți ce tipuri de PII să detectați:
| Tipuri de entități | Susținem 256 de tipuri de entități organizate în 10 categorii: | Text - Textul efectiv care a fost identificat ca PII |
|---|---|---|
| Personal - Nume, emailuri, numere de telefon, date de naștere | PERSON, EMAIL_ADDRESS, PHONE_NUMBER | John Doe, john@email.com |
| Financiar - Carduri de credit, conturi bancare, IBAN, portofele cripto | CREDIT_CARD, IBAN_CODE, SWIFT_CODE | 4111-1111-1111-1111 |
| Locație - Adrese, orașe, țări, coordonate | LOCATION, ADDRESS, COORDINATES | 123 Main St, New York |
| Guvernamental - SSN, numere de pașaport, permise de conducere, ID-uri naționale | SSN, PASSPORT, DRIVER_LICENSE | 123-45-6789 |
| Tehnic - Adrese IP, adrese MAC, ID-uri de dispozitive | IP_ADDRESS, MAC_ADDRESS | 192.168.1.1 |
În loc să selectați entitățile manual, folosiți Presets pentru a aplica rapid configurații comune ale entităților precum "Conformitate GDPR" sau "Date Financiare".
Instead of selecting entities manually, use Presetări to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".
Pasul 3: Selectați Limba
Alegeți limba textului dvs. pentru o acuratețe optimă a detectării:
- Detectare automată - Lăsați sistemul să determine limba - Let the system determine the language
- Limba specifică - Selectați din 27 de limbi suportate - Select from 27 supported languages
Selecția Limbii Contează
Selectarea limbii corecte îmbunătățește semnificativ acuratețea detectării, în special pentru numele persoanelor și locații.
Pasul 4: Rulați Analiza
- Faceți clic pe butonul Analizați
- Așteptați finalizarea analizei (de obicei 1-3 secunde)
- Revizuiți entitățile detectate în panoul de rezultate
Înțelegerea Rezultatelor
După analiză, fiecare entitate detectată arată:
Poziție: caractere
Câmpuri de Rezultate
- Tip Entitate - Categoria de PII detectată (PERSON, EMAIL, etc.) - The category of PII detected (PERSON, EMAIL, etc.)
- Text - Textul efectiv care a fost identificat ca PII - The actual text that was identified as PII
- Scor de Încredere - Cât de sigur este sistemul (0-100%) - How certain the system is (0-100%)
- Poziție - Pozițiile de început și sfârșit ale caracterelor - Start and end character positions
Prag de Încredere
Ajustați pragul de încredere pentru a controla sensibilitatea:
| Prag | Efect | Cel Mai Bun Pentru |
|---|---|---|
| Scăzut | Mai multe entități detectate, mai multe falsuri pozitive | Acoperire maximă, revizuire manuală |
| Implicit | Detectare și acuratețe echilibrate | Utilizare generală |
| Ridicat | Mai puține entități, încredere mai mare | Procesare automată |
| Foarte Ridicat | Numai potriviri foarte sigure | Intervenție minimă |
Selectarea Rezultatelor
După analiză, puteți rafina ce entități să fie anonimizate:
Selectați/Deselectați Tot
- Folosiți caseta de selectare din antet pentru a selecta sau deselecta toate rezultatele
- Numai entitățile selectate vor fi anonimizate
Selecție Individuală
- Faceți clic pe casetele de selectare individuale pentru a include/exclude entități specifice
- Util pentru când analyzerul detectează falsuri pozitive
- Util pentru când doriți să păstrați anumite informații vizibile
Filtrați după Tip
- Faceți clic pe un badge de tip entitate pentru a filtra rezultatele după acel tip
- Selectați/deselectați rapid toate entitățile de un tip specific
Revizuiți rezultatele înainte de a anonimiza. Analyzerul poate detecta ocazional falsuri pozitive, în special pentru nume care sunt și cuvinte comune.
Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.
Costuri pentru Token-uri
Operațiunile de analiză consumă token-uri pe baza:
Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found
Final = ceil(Cost × 0.5)
Where:
text_k= Lungimea Textuluientities_enabled= Entitățientities_found= number of entities detected
Cost Tipic
| Lungimea Textului | Entități | Cost Tipic |
|---|---|---|
| 100 characters | 3 types, 2 found | 2 tokens |
| 1,000 characters | 5 types, 5 found | 3 tokens |
| 5,000 characters | 10 types, 15 found | 6 tokens |
| 10,000 characters | 15 types, 30 found | 10 tokens |
Documentația sistemului de token-uri Token System documentation for complete pricing details.
Cele Mai Bune Practici
Depanare
Entitate neidentificată?
- Asigurați-vă că tipul de entitate este activat în selecția dvs.
- Încercați să reduceți pragul de încredere
- Verificați că limba corectă este selectată
- Verificați că formatul textului se potrivește cu modelele așteptate
Prea multe falsuri pozitive?
- Creșteți pragul de încredere
- Deselecționați tipuri de entități generale precum LOCATION
- Folosiți presetări specifice entității în loc să selectați toate
Analiza durează prea mult?
- Împărțiți textele mari în bucăți mai mici
- Reduceți numărul de tipuri de entități selectate
- Folosiți presetări pentru a evita încărcarea modelelor de detectare neutilizate
Next Steps
Ultima actualizare: Martie 2026