PII Analizator

Odkrijte osebno prepoznavne informacije v vašem besedilu

PII Analizator pregleda vaše besedilo in identificira občutljive informacije, kot so imena, e-poštni naslovi, telefonske številke, naslovi in še več.

Kako deluje

Analizator uporablja več metod zaznavanja za identifikacijo PII:

Ujemanje vzorcev

Redne izraze zaznavajo strukturirane podatke, kot so e-poštni naslovi, telefonske številke, kreditne kartice in IBAN-i z visoko natančnostjo.

Strojno učenje (NER)

Modeli prepoznavanja poimenovanih entitet identificirajo kontekstualno odvisne entitete, kot so imena oseb, organizacije in lokacije, z uporabo spaCy, Stanza in Transformers.

Validacija kontrolne vsote

Kreditne kartice, IBAN-i in drugi finančni identifikatorji se validirajo z algoritmi kontrolne vsote (Luhn, MOD-97) za zmanjšanje lažnih pozitivnih rezultatov.

Uporaba analizatorja

Korak 1: Vnesite svoj tekst

Pojdite na stran Anonimizacija
Prilepite ali vnesite svoj tekst v vhodno območje
Vmesnik prikazuje število znakov in oceno tokenov

Korak 2: Izberite vrste entitet

Izberite, katere vrste PII želite zaznati:

Vrste entitet	Podpiramo 256 vrst entitet, razporejenih v 10 kategorij:	Tekst - Dejanski tekst, ki je bil identificiran kot PII
Osebno - Imena, e-poštni naslovi, telefonske številke, datumi rojstva	PERSON, EMAIL_ADDRESS, PHONE_NUMBER	John Doe, john@email.com
Finančno - Kreditne kartice, bančni računi, IBAN, kripto denarnice	CREDIT_CARD, IBAN_CODE, SWIFT_CODE	4111-1111-1111-1111
Lokacija - Naslovi, mesta, države, koordinate	LOCATION, ADDRESS, COORDINATES	123 Main St, New York
Vladno - SSN, številke potnih listov, vozniška dovoljenja, nacionalne identifikacijske številke	SSN, PASSPORT, DRIVER_LICENSE	123-45-6789
Tehnično - IP naslovi, MAC naslovi, ID-ji naprav	IP_ADDRESS, MAC_ADDRESS	192.168.1.1

Namesto ročne izbire entitet uporabite Prednastavitve za hitro uporabo pogostih konfiguracij entitet, kot so "GDPR skladnost" ali "Finančni podatki".

Instead of selecting entities manually, use Prednastavitve to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Korak 3: Izberite jezik

Izberite jezik svojega teksta za optimalno natančnost zaznavanja:

Samodejno zaznavanje - Pustite sistemu, da določi jezik - Let the system determine the language
Specifičen jezik - Izberite iz 27 podprtih jezikov - Select from 27 supported languages

Izbira jezika je pomembna

Izbira pravilnega jezika znatno izboljša natančnost zaznavanja, zlasti za imena oseb in lokacije.

Korak 4: Izvedite analizo

Kliknite gumb Analiziraj
Počakajte, da se analiza zaključi (običajno 1-3 sekunde)
Preglejte zaznane entitete v rezultatskem panelu

Razumevanje rezultatov

Po analizi vsaka zaznana entiteta prikazuje:

PERSONJohn Doezaupanje

Pozicija: znaki

Polja rezultata

Vrsta entitete - Kategorija zaznanega PII (OSEBA, E-POŠTA itd.) - The category of PII detected (PERSON, EMAIL, etc.)
Tekst - Dejanski tekst, ki je bil identificiran kot PII - The actual text that was identified as PII
Ocena zaupanja - Koliko je sistem prepričan (0-100%) - How certain the system is (0-100%)
Pozicija - Začetne in končne pozicije znakov - Start and end character positions

Prag zaupanja

Prilagodite prag zaupanja za nadzor občutljivosti:

Prag	Učinek	Najboljše za
Nizko	Več zaznanih entitet, več lažnih pozitivnih rezultatov	Maksimalna pokritost, ročni pregled
Privzeto	Uravnoteženo zaznavanje in natančnost	Splošna uporaba
Visoko	Manj entitet, višje zaupanje	Avtomatizirano obdelovanje
Zelo visoko	Samo zelo zanesljivi ujemanja	Minimalna intervencija

Izbira rezultatov

Po analizi lahko natančneje določite, katere entitete želite anonimizirati:

Izberi/Prekliči izbiro vsega

Uporabite potrditveno polje v glavi za izbiro ali preklic izbire vseh rezultatov
Samo izbrane entitete bodo anonimizirane

Posamezna izbira

Kliknite posamezna potrditvena polja za vključitev/izključitev specifičnih entitet
Koristno, ko analizator zazna lažne pozitivne rezultate
Koristno, ko želite obdržati določene informacije vidne

Filtriraj po vrsti

Kliknite na oznako vrste entitete za filtriranje rezultatov po tej vrsti
Hitro izberite/prekličite izbiro vseh entitet določene vrste

Preglejte rezultate pred anonimizacijo. Analizator lahko občasno zazna lažne pozitivne rezultate, zlasti za imena, ki so tudi pogoste besede.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.

Stroški tokenov

Analizne operacije porabijo tokene na podlagi:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

text_k = Dolžina besedila
entities_enabled = Entitete
entities_found = number of entities detected

Tipični strošek

Dolžina besedila	Entitete	Tipični strošek
100 characters	3 types, 2 found	2 tokens
1,000 characters	5 types, 5 found	3 tokens
5,000 characters	10 types, 15 found	6 tokens
10,000 characters	15 types, 30 found	10 tokens

Dokumentacija sistema tokenov Token System documentation for complete pricing details.

Najboljše prakse

✅Izberite samo vrste entitet, ki jih potrebujete - zmanjšuje stroške in lažne pozitivne rezultate

✅Uporabite jezikovno specifične prednastavitve za boljšo natančnost v neangleščini

✅Preglejte rezultate pred anonimizacijo, zlasti za imena in lokacije

✅Uporabite višje prage zaupanja za avtomatizirano obdelovanje

✅Obdelujte tekst v razumnih delih (pod 10.000 znakov) za najboljšo zmogljivost

Odpravljanje težav

Entiteta ni bila zaznana?

Prepričajte se, da je vrsta entitete omogočena v vaši izbiri
Poskusite znižati prag zaupanja
Preverite, ali je izbran pravilen jezik
Preverite, ali format besedila ustreza pričakovanim vzorcem

Preveč lažnih pozitivnih rezultatov?

Povečajte prag zaupanja
Prekličite izbiro širokih vrst entitet, kot je LOKACIJA
Uporabite specifične prednastavitve entitet namesto izbire vseh

Analiza traja predolgo?

Razdelite velike tekste na manjše dele
Zmanjšajte število izbranih vrst entitet
Uporabite prednastavitve, da se izognete nalaganju neuporabljenih modelov zaznavanja

Next Steps

Vodnik za anonimizator

Naučite se, kako anonimizirati zaznane entitete

Prednastavitve

Shranjujte in ponovno uporabite konfiguracije entitet

Zadnja posodobitev: marec 2026