common.skipToContent

Analizor PII

Detectați informații personale identificabile în textul dumneavoastră

Analizorul PII scanează textul dumneavoastră și identifică informații sensibile precum nume, emailuri, numere de telefon, adrese și altele.


Cum funcționează

Analyzerul folosește multiple metode de detectare pentru a identifica PII:

Potrivirea modelului

Expresiile regulate detectează date structurate precum adrese de email, numere de telefon, carduri de credit și IBAN-uri cu o acuratețe ridicată.

Învățare automată (NER)

Modelele de recunoaștere a entităților numite identifică entități dependente de context, precum nume de persoane, organizații și locații folosind spaCy, Stanza și Transformers.

Validarea checksum-ului

Cardurile de credit, IBAN-urile și alte identificatori financiari sunt validate folosind algoritmi de checksum (Luhn, MOD-97) pentru a reduce falsurile pozitive.


Folosind Analyzerul

Pasul 1: Introduceți Textul Dvs.

  1. Navigați la pagina Anonymize
  2. Lipiti sau tastați textul dvs. în zona de introducere
  3. Interfața arată un număr de caractere și o estimare a token-urilor

Pasul 2: Selectați Tipurile de Entități

Alegeți ce tipuri de PII să detectați:

Tipuri de entitățiSusținem 256 de tipuri de entități organizate în 10 categorii:Text - Textul efectiv care a fost identificat ca PII
Personal - Nume, emailuri, numere de telefon, date de nașterePERSON, EMAIL_ADDRESS, PHONE_NUMBERJohn Doe, john@email.com
Financiar - Carduri de credit, conturi bancare, IBAN, portofele criptoCREDIT_CARD, IBAN_CODE, SWIFT_CODE4111-1111-1111-1111
Locație - Adrese, orașe, țări, coordonateLOCATION, ADDRESS, COORDINATES123 Main St, New York
Guvernamental - SSN, numere de pașaport, permise de conducere, ID-uri naționaleSSN, PASSPORT, DRIVER_LICENSE123-45-6789
Tehnic - Adrese IP, adrese MAC, ID-uri de dispozitiveIP_ADDRESS, MAC_ADDRESS192.168.1.1

În loc să selectați entitățile manual, folosiți Presets pentru a aplica rapid configurații comune ale entităților precum "Conformitate GDPR" sau "Date Financiare".

Instead of selecting entities manually, use Presetări to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Pasul 3: Selectați Limba

Alegeți limba textului dvs. pentru o acuratețe optimă a detectării:

  • Detectare automată - Lăsați sistemul să determine limba - Let the system determine the language
  • Limba specifică - Selectați din 27 de limbi suportate - Select from 27 supported languages

Selecția Limbii Contează

Selectarea limbii corecte îmbunătățește semnificativ acuratețea detectării, în special pentru numele persoanelor și locații.

Pasul 4: Rulați Analiza

  1. Faceți clic pe butonul Analizați
  2. Așteptați finalizarea analizei (de obicei 1-3 secunde)
  3. Revizuiți entitățile detectate în panoul de rezultate

Înțelegerea Rezultatelor

După analiză, fiecare entitate detectată arată:

PERSONJohn Doeîncredere

Poziție: caractere

Câmpuri de Rezultate

  • Tip Entitate - Categoria de PII detectată (PERSON, EMAIL, etc.) - The category of PII detected (PERSON, EMAIL, etc.)
  • Text - Textul efectiv care a fost identificat ca PII - The actual text that was identified as PII
  • Scor de Încredere - Cât de sigur este sistemul (0-100%) - How certain the system is (0-100%)
  • Poziție - Pozițiile de început și sfârșit ale caracterelor - Start and end character positions

Prag de Încredere

Ajustați pragul de încredere pentru a controla sensibilitatea:

PragEfectCel Mai Bun Pentru
ScăzutMai multe entități detectate, mai multe falsuri pozitiveAcoperire maximă, revizuire manuală
ImplicitDetectare și acuratețe echilibrateUtilizare generală
RidicatMai puține entități, încredere mai mareProcesare automată
Foarte RidicatNumai potriviri foarte sigureIntervenție minimă

Selectarea Rezultatelor

După analiză, puteți rafina ce entități să fie anonimizate:

Selectați/Deselectați Tot

  • Folosiți caseta de selectare din antet pentru a selecta sau deselecta toate rezultatele
  • Numai entitățile selectate vor fi anonimizate

Selecție Individuală

  • Faceți clic pe casetele de selectare individuale pentru a include/exclude entități specifice
  • Util pentru când analyzerul detectează falsuri pozitive
  • Util pentru când doriți să păstrați anumite informații vizibile

Filtrați după Tip

  • Faceți clic pe un badge de tip entitate pentru a filtra rezultatele după acel tip
  • Selectați/deselectați rapid toate entitățile de un tip specific

Revizuiți rezultatele înainte de a anonimiza. Analyzerul poate detecta ocazional falsuri pozitive, în special pentru nume care sunt și cuvinte comune.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.


Costuri pentru Token-uri

Operațiunile de analiză consumă token-uri pe baza:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

  • text_k = Lungimea Textului
  • entities_enabled = Entități
  • entities_found = number of entities detected

Cost Tipic

Lungimea TextuluiEntitățiCost Tipic
100 characters3 types, 2 found2 tokens
1,000 characters5 types, 5 found3 tokens
5,000 characters10 types, 15 found6 tokens
10,000 characters15 types, 30 found10 tokens

Documentația sistemului de token-uri Token System documentation for complete pricing details.


Cele Mai Bune Practici

Selectați doar tipurile de entități de care aveți nevoie - reduce costurile și falsurile pozitive
Folosiți presetări specifice limbii pentru o acuratețe mai bună în textul non-englezesc
Revizuiți rezultatele înainte de a anonimiza, în special pentru nume și locații
Folosiți praguri de încredere mai mari pentru procesarea automată
Procesați textul în bucăți rezonabile (sub 10.000 de caractere) pentru cea mai bună performanță

Depanare

Entitate neidentificată?

  • Asigurați-vă că tipul de entitate este activat în selecția dvs.
  • Încercați să reduceți pragul de încredere
  • Verificați că limba corectă este selectată
  • Verificați că formatul textului se potrivește cu modelele așteptate

Prea multe falsuri pozitive?

  • Creșteți pragul de încredere
  • Deselecționați tipuri de entități generale precum LOCATION
  • Folosiți presetări specifice entității în loc să selectați toate

Analiza durează prea mult?

  • Împărțiți textele mari în bucăți mai mici
  • Reduceți numărul de tipuri de entități selectate
  • Folosiți presetări pentru a evita încărcarea modelelor de detectare neutilizate

Next Steps

Ultima actualizare: Martie 2026