Analizor PII

Detectați informații personale identificabile în textul dumneavoastră

Analizorul PII scanează textul dumneavoastră și identifică informații sensibile precum nume, emailuri, numere de telefon, adrese și altele.

Cum funcționează

Analyzerul folosește multiple metode de detectare pentru a identifica PII:

Potrivirea modelului

Expresiile regulate detectează date structurate precum adrese de email, numere de telefon, carduri de credit și IBAN-uri cu o acuratețe ridicată.

Învățare automată (NER)

Modelele de recunoaștere a entităților numite identifică entități dependente de context, precum nume de persoane, organizații și locații folosind spaCy, Stanza și Transformers.

Validarea checksum-ului

Cardurile de credit, IBAN-urile și alte identificatori financiari sunt validate folosind algoritmi de checksum (Luhn, MOD-97) pentru a reduce falsurile pozitive.

Folosind Analyzerul

Pasul 1: Introduceți Textul Dvs.

Navigați la pagina Anonymize
Lipiti sau tastați textul dvs. în zona de introducere
Interfața arată un număr de caractere și o estimare a token-urilor

Pasul 2: Selectați Tipurile de Entități

Alegeți ce tipuri de PII să detectați:

Tipuri de entități	Susținem 256 de tipuri de entități organizate în 10 categorii:	Text - Textul efectiv care a fost identificat ca PII
Personal - Nume, emailuri, numere de telefon, date de naștere	PERSON, EMAIL_ADDRESS, PHONE_NUMBER	John Doe, john@email.com
Financiar - Carduri de credit, conturi bancare, IBAN, portofele cripto	CREDIT_CARD, IBAN_CODE, SWIFT_CODE	4111-1111-1111-1111
Locație - Adrese, orașe, țări, coordonate	LOCATION, ADDRESS, COORDINATES	123 Main St, New York
Guvernamental - SSN, numere de pașaport, permise de conducere, ID-uri naționale	SSN, PASSPORT, DRIVER_LICENSE	123-45-6789
Tehnic - Adrese IP, adrese MAC, ID-uri de dispozitive	IP_ADDRESS, MAC_ADDRESS	192.168.1.1

În loc să selectați entitățile manual, folosiți Presets pentru a aplica rapid configurații comune ale entităților precum "Conformitate GDPR" sau "Date Financiare".

Instead of selecting entities manually, use Presetări to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Pasul 3: Selectați Limba

Alegeți limba textului dvs. pentru o acuratețe optimă a detectării:

Detectare automată - Lăsați sistemul să determine limba - Let the system determine the language
Limba specifică - Selectați din 27 de limbi suportate - Select from 27 supported languages

Selecția Limbii Contează

Selectarea limbii corecte îmbunătățește semnificativ acuratețea detectării, în special pentru numele persoanelor și locații.

Pasul 4: Rulați Analiza

Faceți clic pe butonul Analizați
Așteptați finalizarea analizei (de obicei 1-3 secunde)
Revizuiți entitățile detectate în panoul de rezultate

Înțelegerea Rezultatelor

După analiză, fiecare entitate detectată arată:

PERSONJohn Doeîncredere

Poziție: caractere

Câmpuri de Rezultate

Tip Entitate - Categoria de PII detectată (PERSON, EMAIL, etc.) - The category of PII detected (PERSON, EMAIL, etc.)
Text - Textul efectiv care a fost identificat ca PII - The actual text that was identified as PII
Scor de Încredere - Cât de sigur este sistemul (0-100%) - How certain the system is (0-100%)
Poziție - Pozițiile de început și sfârșit ale caracterelor - Start and end character positions

Prag de Încredere

Ajustați pragul de încredere pentru a controla sensibilitatea:

Prag	Efect	Cel Mai Bun Pentru
Scăzut	Mai multe entități detectate, mai multe falsuri pozitive	Acoperire maximă, revizuire manuală
Implicit	Detectare și acuratețe echilibrate	Utilizare generală
Ridicat	Mai puține entități, încredere mai mare	Procesare automată
Foarte Ridicat	Numai potriviri foarte sigure	Intervenție minimă

Selectarea Rezultatelor

După analiză, puteți rafina ce entități să fie anonimizate:

Selectați/Deselectați Tot

Folosiți caseta de selectare din antet pentru a selecta sau deselecta toate rezultatele
Numai entitățile selectate vor fi anonimizate

Selecție Individuală

Faceți clic pe casetele de selectare individuale pentru a include/exclude entități specifice
Util pentru când analyzerul detectează falsuri pozitive
Util pentru când doriți să păstrați anumite informații vizibile

Filtrați după Tip

Faceți clic pe un badge de tip entitate pentru a filtra rezultatele după acel tip
Selectați/deselectați rapid toate entitățile de un tip specific

Revizuiți rezultatele înainte de a anonimiza. Analyzerul poate detecta ocazional falsuri pozitive, în special pentru nume care sunt și cuvinte comune.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.

Costuri pentru Token-uri

Operațiunile de analiză consumă token-uri pe baza:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

text_k = Lungimea Textului
entities_enabled = Entități
entities_found = number of entities detected

Cost Tipic

Lungimea Textului	Entități	Cost Tipic
100 characters	3 types, 2 found	2 tokens
1,000 characters	5 types, 5 found	3 tokens
5,000 characters	10 types, 15 found	6 tokens
10,000 characters	15 types, 30 found	10 tokens

Documentația sistemului de token-uri Token System documentation for complete pricing details.

Cele Mai Bune Practici

✅Selectați doar tipurile de entități de care aveți nevoie - reduce costurile și falsurile pozitive

✅Folosiți presetări specifice limbii pentru o acuratețe mai bună în textul non-englezesc

✅Revizuiți rezultatele înainte de a anonimiza, în special pentru nume și locații

✅Folosiți praguri de încredere mai mari pentru procesarea automată

✅Procesați textul în bucăți rezonabile (sub 10.000 de caractere) pentru cea mai bună performanță

Depanare

Entitate neidentificată?

Asigurați-vă că tipul de entitate este activat în selecția dvs.
Încercați să reduceți pragul de încredere
Verificați că limba corectă este selectată
Verificați că formatul textului se potrivește cu modelele așteptate

Prea multe falsuri pozitive?

Creșteți pragul de încredere
Deselecționați tipuri de entități generale precum LOCATION
Folosiți presetări specifice entității în loc să selectați toate

Analiza durează prea mult?

Împărțiți textele mari în bucăți mai mici
Reduceți numărul de tipuri de entități selectate
Folosiți presetări pentru a evita încărcarea modelelor de detectare neutilizate

Next Steps

Ghid pentru Anonimizare

Învățați cum să anonimizați entitățile detectate

Presetări

Salvați și reutilizați configurațiile entităților

Ultima actualizare: Martie 2026