PII Analizator
Odkrijte osebno prepoznavne informacije v vašem besedilu
PII Analizator pregleda vaše besedilo in identificira občutljive informacije, kot so imena, e-poštni naslovi, telefonske številke, naslovi in še več.
Kako deluje
Analizator uporablja več metod zaznavanja za identifikacijo PII:
Ujemanje vzorcev
Redne izraze zaznavajo strukturirane podatke, kot so e-poštni naslovi, telefonske številke, kreditne kartice in IBAN-i z visoko natančnostjo.
Strojno učenje (NER)
Modeli prepoznavanja poimenovanih entitet identificirajo kontekstualno odvisne entitete, kot so imena oseb, organizacije in lokacije, z uporabo spaCy, Stanza in Transformers.
Validacija kontrolne vsote
Kreditne kartice, IBAN-i in drugi finančni identifikatorji se validirajo z algoritmi kontrolne vsote (Luhn, MOD-97) za zmanjšanje lažnih pozitivnih rezultatov.
Uporaba analizatorja
Korak 1: Vnesite svoj tekst
- Pojdite na stran Anonimizacija
- Prilepite ali vnesite svoj tekst v vhodno območje
- Vmesnik prikazuje število znakov in oceno tokenov
Korak 2: Izberite vrste entitet
Izberite, katere vrste PII želite zaznati:
| Vrste entitet | Podpiramo 256 vrst entitet, razporejenih v 10 kategorij: | Tekst - Dejanski tekst, ki je bil identificiran kot PII |
|---|---|---|
| Osebno - Imena, e-poštni naslovi, telefonske številke, datumi rojstva | PERSON, EMAIL_ADDRESS, PHONE_NUMBER | John Doe, john@email.com |
| Finančno - Kreditne kartice, bančni računi, IBAN, kripto denarnice | CREDIT_CARD, IBAN_CODE, SWIFT_CODE | 4111-1111-1111-1111 |
| Lokacija - Naslovi, mesta, države, koordinate | LOCATION, ADDRESS, COORDINATES | 123 Main St, New York |
| Vladno - SSN, številke potnih listov, vozniška dovoljenja, nacionalne identifikacijske številke | SSN, PASSPORT, DRIVER_LICENSE | 123-45-6789 |
| Tehnično - IP naslovi, MAC naslovi, ID-ji naprav | IP_ADDRESS, MAC_ADDRESS | 192.168.1.1 |
Namesto ročne izbire entitet uporabite Prednastavitve za hitro uporabo pogostih konfiguracij entitet, kot so "GDPR skladnost" ali "Finančni podatki".
Instead of selecting entities manually, use Prednastavitve to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".
Korak 3: Izberite jezik
Izberite jezik svojega teksta za optimalno natančnost zaznavanja:
- Samodejno zaznavanje - Pustite sistemu, da določi jezik - Let the system determine the language
- Specifičen jezik - Izberite iz 27 podprtih jezikov - Select from 27 supported languages
Izbira jezika je pomembna
Izbira pravilnega jezika znatno izboljša natančnost zaznavanja, zlasti za imena oseb in lokacije.
Korak 4: Izvedite analizo
- Kliknite gumb Analiziraj
- Počakajte, da se analiza zaključi (običajno 1-3 sekunde)
- Preglejte zaznane entitete v rezultatskem panelu
Razumevanje rezultatov
Po analizi vsaka zaznana entiteta prikazuje:
Pozicija: znaki
Polja rezultata
- Vrsta entitete - Kategorija zaznanega PII (OSEBA, E-POŠTA itd.) - The category of PII detected (PERSON, EMAIL, etc.)
- Tekst - Dejanski tekst, ki je bil identificiran kot PII - The actual text that was identified as PII
- Ocena zaupanja - Koliko je sistem prepričan (0-100%) - How certain the system is (0-100%)
- Pozicija - Začetne in končne pozicije znakov - Start and end character positions
Prag zaupanja
Prilagodite prag zaupanja za nadzor občutljivosti:
| Prag | Učinek | Najboljše za |
|---|---|---|
| Nizko | Več zaznanih entitet, več lažnih pozitivnih rezultatov | Maksimalna pokritost, ročni pregled |
| Privzeto | Uravnoteženo zaznavanje in natančnost | Splošna uporaba |
| Visoko | Manj entitet, višje zaupanje | Avtomatizirano obdelovanje |
| Zelo visoko | Samo zelo zanesljivi ujemanja | Minimalna intervencija |
Izbira rezultatov
Po analizi lahko natančneje določite, katere entitete želite anonimizirati:
Izberi/Prekliči izbiro vsega
- Uporabite potrditveno polje v glavi za izbiro ali preklic izbire vseh rezultatov
- Samo izbrane entitete bodo anonimizirane
Posamezna izbira
- Kliknite posamezna potrditvena polja za vključitev/izključitev specifičnih entitet
- Koristno, ko analizator zazna lažne pozitivne rezultate
- Koristno, ko želite obdržati določene informacije vidne
Filtriraj po vrsti
- Kliknite na oznako vrste entitete za filtriranje rezultatov po tej vrsti
- Hitro izberite/prekličite izbiro vseh entitet določene vrste
Preglejte rezultate pred anonimizacijo. Analizator lahko občasno zazna lažne pozitivne rezultate, zlasti za imena, ki so tudi pogoste besede.
Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.
Stroški tokenov
Analizne operacije porabijo tokene na podlagi:
Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found
Final = ceil(Cost × 0.5)
Where:
text_k= Dolžina besedilaentities_enabled= Entiteteentities_found= number of entities detected
Tipični strošek
| Dolžina besedila | Entitete | Tipični strošek |
|---|---|---|
| 100 characters | 3 types, 2 found | 2 tokens |
| 1,000 characters | 5 types, 5 found | 3 tokens |
| 5,000 characters | 10 types, 15 found | 6 tokens |
| 10,000 characters | 15 types, 30 found | 10 tokens |
Dokumentacija sistema tokenov Token System documentation for complete pricing details.
Najboljše prakse
Odpravljanje težav
Entiteta ni bila zaznana?
- Prepričajte se, da je vrsta entitete omogočena v vaši izbiri
- Poskusite znižati prag zaupanja
- Preverite, ali je izbran pravilen jezik
- Preverite, ali format besedila ustreza pričakovanim vzorcem
Preveč lažnih pozitivnih rezultatov?
- Povečajte prag zaupanja
- Prekličite izbiro širokih vrst entitet, kot je LOKACIJA
- Uporabite specifične prednastavitve entitet namesto izbire vseh
Analiza traja predolgo?
- Razdelite velike tekste na manjše dele
- Zmanjšajte število izbranih vrst entitet
- Uporabite prednastavitve, da se izognete nalaganju neuporabljenih modelov zaznavanja
Next Steps
Zadnja posodobitev: marec 2026