common.skipToContent

PII Analizator

Odkrijte osebno prepoznavne informacije v vašem besedilu

PII Analizator pregleda vaše besedilo in identificira občutljive informacije, kot so imena, e-poštni naslovi, telefonske številke, naslovi in še več.


Kako deluje

Analizator uporablja več metod zaznavanja za identifikacijo PII:

Ujemanje vzorcev

Redne izraze zaznavajo strukturirane podatke, kot so e-poštni naslovi, telefonske številke, kreditne kartice in IBAN-i z visoko natančnostjo.

Strojno učenje (NER)

Modeli prepoznavanja poimenovanih entitet identificirajo kontekstualno odvisne entitete, kot so imena oseb, organizacije in lokacije, z uporabo spaCy, Stanza in Transformers.

Validacija kontrolne vsote

Kreditne kartice, IBAN-i in drugi finančni identifikatorji se validirajo z algoritmi kontrolne vsote (Luhn, MOD-97) za zmanjšanje lažnih pozitivnih rezultatov.


Uporaba analizatorja

Korak 1: Vnesite svoj tekst

  1. Pojdite na stran Anonimizacija
  2. Prilepite ali vnesite svoj tekst v vhodno območje
  3. Vmesnik prikazuje število znakov in oceno tokenov

Korak 2: Izberite vrste entitet

Izberite, katere vrste PII želite zaznati:

Vrste entitetPodpiramo 256 vrst entitet, razporejenih v 10 kategorij:Tekst - Dejanski tekst, ki je bil identificiran kot PII
Osebno - Imena, e-poštni naslovi, telefonske številke, datumi rojstvaPERSON, EMAIL_ADDRESS, PHONE_NUMBERJohn Doe, john@email.com
Finančno - Kreditne kartice, bančni računi, IBAN, kripto denarniceCREDIT_CARD, IBAN_CODE, SWIFT_CODE4111-1111-1111-1111
Lokacija - Naslovi, mesta, države, koordinateLOCATION, ADDRESS, COORDINATES123 Main St, New York
Vladno - SSN, številke potnih listov, vozniška dovoljenja, nacionalne identifikacijske številkeSSN, PASSPORT, DRIVER_LICENSE123-45-6789
Tehnično - IP naslovi, MAC naslovi, ID-ji napravIP_ADDRESS, MAC_ADDRESS192.168.1.1

Namesto ročne izbire entitet uporabite Prednastavitve za hitro uporabo pogostih konfiguracij entitet, kot so "GDPR skladnost" ali "Finančni podatki".

Instead of selecting entities manually, use Prednastavitve to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Korak 3: Izberite jezik

Izberite jezik svojega teksta za optimalno natančnost zaznavanja:

  • Samodejno zaznavanje - Pustite sistemu, da določi jezik - Let the system determine the language
  • Specifičen jezik - Izberite iz 27 podprtih jezikov - Select from 27 supported languages

Izbira jezika je pomembna

Izbira pravilnega jezika znatno izboljša natančnost zaznavanja, zlasti za imena oseb in lokacije.

Korak 4: Izvedite analizo

  1. Kliknite gumb Analiziraj
  2. Počakajte, da se analiza zaključi (običajno 1-3 sekunde)
  3. Preglejte zaznane entitete v rezultatskem panelu

Razumevanje rezultatov

Po analizi vsaka zaznana entiteta prikazuje:

PERSONJohn Doezaupanje

Pozicija: znaki

Polja rezultata

  • Vrsta entitete - Kategorija zaznanega PII (OSEBA, E-POŠTA itd.) - The category of PII detected (PERSON, EMAIL, etc.)
  • Tekst - Dejanski tekst, ki je bil identificiran kot PII - The actual text that was identified as PII
  • Ocena zaupanja - Koliko je sistem prepričan (0-100%) - How certain the system is (0-100%)
  • Pozicija - Začetne in končne pozicije znakov - Start and end character positions

Prag zaupanja

Prilagodite prag zaupanja za nadzor občutljivosti:

PragUčinekNajboljše za
NizkoVeč zaznanih entitet, več lažnih pozitivnih rezultatovMaksimalna pokritost, ročni pregled
PrivzetoUravnoteženo zaznavanje in natančnostSplošna uporaba
VisokoManj entitet, višje zaupanjeAvtomatizirano obdelovanje
Zelo visokoSamo zelo zanesljivi ujemanjaMinimalna intervencija

Izbira rezultatov

Po analizi lahko natančneje določite, katere entitete želite anonimizirati:

Izberi/Prekliči izbiro vsega

  • Uporabite potrditveno polje v glavi za izbiro ali preklic izbire vseh rezultatov
  • Samo izbrane entitete bodo anonimizirane

Posamezna izbira

  • Kliknite posamezna potrditvena polja za vključitev/izključitev specifičnih entitet
  • Koristno, ko analizator zazna lažne pozitivne rezultate
  • Koristno, ko želite obdržati določene informacije vidne

Filtriraj po vrsti

  • Kliknite na oznako vrste entitete za filtriranje rezultatov po tej vrsti
  • Hitro izberite/prekličite izbiro vseh entitet določene vrste

Preglejte rezultate pred anonimizacijo. Analizator lahko občasno zazna lažne pozitivne rezultate, zlasti za imena, ki so tudi pogoste besede.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.


Stroški tokenov

Analizne operacije porabijo tokene na podlagi:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

  • text_k = Dolžina besedila
  • entities_enabled = Entitete
  • entities_found = number of entities detected

Tipični strošek

Dolžina besedilaEntiteteTipični strošek
100 characters3 types, 2 found2 tokens
1,000 characters5 types, 5 found3 tokens
5,000 characters10 types, 15 found6 tokens
10,000 characters15 types, 30 found10 tokens

Dokumentacija sistema tokenov Token System documentation for complete pricing details.


Najboljše prakse

Izberite samo vrste entitet, ki jih potrebujete - zmanjšuje stroške in lažne pozitivne rezultate
Uporabite jezikovno specifične prednastavitve za boljšo natančnost v neangleščini
Preglejte rezultate pred anonimizacijo, zlasti za imena in lokacije
Uporabite višje prage zaupanja za avtomatizirano obdelovanje
Obdelujte tekst v razumnih delih (pod 10.000 znakov) za najboljšo zmogljivost

Odpravljanje težav

Entiteta ni bila zaznana?

  • Prepričajte se, da je vrsta entitete omogočena v vaši izbiri
  • Poskusite znižati prag zaupanja
  • Preverite, ali je izbran pravilen jezik
  • Preverite, ali format besedila ustreza pričakovanim vzorcem

Preveč lažnih pozitivnih rezultatov?

  • Povečajte prag zaupanja
  • Prekličite izbiro širokih vrst entitet, kot je LOKACIJA
  • Uporabite specifične prednastavitve entitet namesto izbire vseh

Analiza traja predolgo?

  • Razdelite velike tekste na manjše dele
  • Zmanjšajte število izbranih vrst entitet
  • Uporabite prednastavitve, da se izognete nalaganju neuporabljenih modelov zaznavanja

Next Steps

Zadnja posodobitev: marec 2026