PII Analizator
Otkrivanje osobno identificirajućih informacija u vašem tekstu
PII Analizator skenira vaš tekst i identificira osjetljive informacije poput imena, e-mailova, brojeva telefona, adresa i još mnogo toga.
Kako to radi
Analizator koristi više metoda otkrivanja za identifikaciju PII:
Usklađivanje obrazaca
Regularni izrazi otkrivaju strukturirane podatke poput adresa e-pošte, brojeva telefona, kreditnih kartica i IBAN-ova s visokom točnošću.
Strojno učenje (NER)
Modeli prepoznavanja imenskih entiteta identificiraju entitete ovisne o kontekstu poput imena osoba, organizacija i lokacija koristeći spaCy, Stanza i Transformere.
Validacija kontrolnog zbroja
Kreditne kartice, IBAN-ovi i drugi financijski identifikatori validiraju se pomoću algoritama kontrolnog zbroja (Luhn, MOD-97) radi smanjenja lažno pozitivnih rezultata.
Korištenje Analizatora
Korak 1: Unesite svoj tekst
- Idite na stranicu Anonimiziraj
- Zalijepite ili upišite svoj tekst u ulazno područje
- Sučelje prikazuje broj znakova i procjenu tokena
Korak 2: Odaberite vrste entiteta
Odaberite koje vrste PII želite otkriti:
| Tipovi entiteta | Podržavamo 256 tipova entiteta organiziranih u 10 kategorija: | Tekst - Stvarni tekst koji je identificiran kao PII |
|---|---|---|
| Osobni - Imena, e-mailovi, brojevi telefona, datumi rođenja | PERSON, EMAIL_ADDRESS, PHONE_NUMBER | John Doe, john@email.com |
| Financijski - Kreditne kartice, bankovni računi, IBAN, kripto novčanici | CREDIT_CARD, IBAN_CODE, SWIFT_CODE | 4111-1111-1111-1111 |
| Lokacija - Adrese, gradovi, zemlje, koordinate | LOCATION, ADDRESS, COORDINATES | 123 Main St, New York |
| Vladini - OIB, brojevi putovnica, vozačke dozvole, nacionalni identifikatori | SSN, PASSPORT, DRIVER_LICENSE | 123-45-6789 |
| Tehnički - IP adrese, MAC adrese, ID-evi uređaja | IP_ADDRESS, MAC_ADDRESS | 192.168.1.1 |
Umjesto da ručno odabirete entitete, koristite unaprijed postavke za brzo primjenjivanje uobičajenih konfiguracija entiteta poput "GDPR usklađenosti" ili "Financijski podaci".
Instead of selecting entities manually, use Unaprijed postavke to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".
Korak 3: Odaberite jezik
Odaberite jezik svog teksta za optimalnu točnost otkrivanja:
- Automatsko otkrivanje - Dopustite sustavu da odredi jezik - Let the system determine the language
- Specifični jezik - Odaberite iz 27 podržanih jezika - Select from 27 supported languages
Odabir jezika je važan
Odabir ispravnog jezika značajno poboljšava točnost otkrivanja, posebno za imena osoba i lokacije.
Korak 4: Pokrenite analizu
- Kliknite na gumb Analiziraj
- Pričekajte da analiza završi (obično 1-3 sekunde)
- Pregledajte otkrivene entitete u panelu rezultata
Razumijevanje rezultata
Nakon analize, svaki otkriveni entitet pokazuje:
Pozicija: znakovi
Polja rezultata
- Vrsta entiteta - Kategorija otkrivenog PII (OSOBA, E-POŠTA, itd.) - The category of PII detected (PERSON, EMAIL, etc.)
- Tekst - Stvarni tekst koji je identificiran kao PII - The actual text that was identified as PII
- Ocjena pouzdanosti - Koliko je sustav siguran (0-100%) - How certain the system is (0-100%)
- Pozicija - Početne i završne pozicije znakova - Start and end character positions
Prag pouzdanosti
Podesite prag pouzdanosti kako biste kontrolirali osjetljivost:
| Prag | Učinak | Najbolje za |
|---|---|---|
| Nizak | Više otkrivenih entiteta, više lažno pozitivnih rezultata | Maksimalno pokriće, ručni pregled |
| Zadano | Izbalansirano otkrivanje i točnost | Opća upotreba |
| Visok | Manje entiteta, veća pouzdanost | Automatizirana obrada |
| Vrlo visok | Samo vrlo pouzdani podudari | Minimalna intervencija |
Odabir rezultata
Nakon analize, možete precizirati koje entitete želite anonimizirati:
Odaberi/Ne odaberi sve
- Koristite potvrdni okvir u zaglavlju za odabir ili neodabir svih rezultata
- Samo odabrani entiteti bit će anonimizirani
Individualni odabir
- Kliknite na pojedinačne potvrdne okvire za uključivanje/isključivanje specifičnih entiteta
- Koristan kada analizator otkrije lažno pozitivne rezultate
- Koristan kada želite zadržati određene informacije vidljivima
Filtriraj po vrsti
- Kliknite na oznaku vrste entiteta za filtriranje rezultata po toj vrsti
- Brzo odaberite/ne odaberite sve entitete određene vrste
Pregledajte rezultate prije anonimizacije. Analizator ponekad može otkriti lažno pozitivne rezultate, posebno za imena koja su također uobičajene riječi.
Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.
Troškovi tokena
Operacije analize troše tokene na temelju:
Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found
Final = ceil(Cost × 0.5)
Where:
text_k= Duljina tekstaentities_enabled= Entitetientities_found= number of entities detected
Tipični trošak
| Duljina teksta | Entiteti | Tipični trošak |
|---|---|---|
| 100 characters | 3 types, 2 found | 2 tokens |
| 1,000 characters | 5 types, 5 found | 3 tokens |
| 5,000 characters | 10 types, 15 found | 6 tokens |
| 10,000 characters | 15 types, 30 found | 10 tokens |
Dokumentacija sustava tokena Token System documentation for complete pricing details.
Najbolje prakse
Rješavanje problema
Entitet nije otkriven?
- Osigurajte da je vrsta entiteta omogućena u vašem odabiru
- Pokušajte smanjiti prag pouzdanosti
- Provjerite je li odabran ispravan jezik
- Provjerite da format teksta odgovara očekivanim obrascima
Previše lažno pozitivnih rezultata?
- Povećajte prag pouzdanosti
- Ne odabirete široke vrste entiteta poput LOKACIJA
- Koristite unaprijed postavke specifične za entitete umjesto da odaberete sve
Analiza traje predugo?
- Podijelite velike tekstove na manje dijelove
- Smanjite broj odabranih vrsta entiteta
- Koristite unaprijed postavke kako biste izbjegli učitavanje neiskorištenih modela otkrivanja
Next Steps
Zadnje ažuriranje: Ožujak 2026