common.skipToContent

Analizzatore PII

Rileva informazioni personali identificabili nel tuo testo

L'analizzatore PII scansiona il tuo testo e identifica informazioni sensibili come nomi, email, numeri di telefono, indirizzi e altro.


Come funziona

L'Analyzer utilizza più metodi di rilevamento per identificare PII:

Riconoscimento Modelli

Le espressioni regolari rilevano dati strutturati come indirizzi email, numeri di telefono, carte di credito e IBAN con alta precisione.

Apprendimento Automatico (NER)

I modelli di Riconoscimento Entità Nominate identificano entità dipendenti dal contesto come nomi di persone, organizzazioni e luoghi utilizzando spaCy, Stanza e Transformers.

Validazione del Controllo

Le carte di credito, gli IBAN e altri identificatori finanziari vengono convalidati utilizzando algoritmi di controllo (Luhn, MOD-97) per ridurre i falsi positivi.


Utilizzare l'Analyzer

Passo 1: Inserisci il Tuo Testo

  1. Naviga alla pagina Anonimizza
  2. Incolla o digita il tuo testo nell'area di input
  3. L'interfaccia mostra un conteggio dei caratteri e una stima dei token

Passo 2: Seleziona Tipi di Entità

Scegli quali tipi di PII rilevare:

Tipi di entitàSupportiamo 256 tipi di entità organizzati in 10 categorie:Testo - Il testo effettivo identificato come PII
Personale - Nomi, email, numeri di telefono, date di nascitaPERSON, EMAIL_ADDRESS, PHONE_NUMBERJohn Doe, john@email.com
Finanziario - Carte di credito, conti bancari, IBAN, portafogli cryptoCREDIT_CARD, IBAN_CODE, SWIFT_CODE4111-1111-1111-1111
Posizione - Indirizzi, città, paesi, coordinateLOCATION, ADDRESS, COORDINATES123 Main St, New York
Governo - SSN, numeri di passaporto, patenti di guida, ID nazionaliSSN, PASSPORT, DRIVER_LICENSE123-45-6789
Tecnico - Indirizzi IP, indirizzi MAC, ID dispositivoIP_ADDRESS, MAC_ADDRESS192.168.1.1

Invece di selezionare manualmente le entità, utilizza i Preset per applicare rapidamente configurazioni comuni delle entità come "Conformità GDPR" o "Dati Finanziari".

Instead of selecting entities manually, use Preset to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Passo 3: Seleziona Lingua

Scegli la lingua del tuo testo per una precisione di rilevamento ottimale:

  • Rilevamento automatico - Lascia che il sistema determini la lingua - Let the system determine the language
  • Lingua specifica - Seleziona tra 27 lingue supportate - Select from 27 supported languages

La Selezione della Lingua è Importante

Selezionare la lingua corretta migliora significativamente la precisione del rilevamento, specialmente per nomi di persone e luoghi.

Passo 4: Esegui Analisi

  1. Clicca il pulsante Analizza
  2. Attendi il completamento dell'analisi (tipicamente 1-3 secondi)
  3. Rivedi le entità rilevate nel pannello dei risultati

Comprendere i Risultati

Dopo l'analisi, ogni entità rilevata mostra:

PERSONJohn Doeconfidenza

Posizione: caratteri

Campi di Risultato

  • Tipo di Entità - La categoria di PII rilevata (PERSONA, EMAIL, ecc.) - The category of PII detected (PERSON, EMAIL, etc.)
  • Testo - Il testo effettivo identificato come PII - The actual text that was identified as PII
  • Punteggio di Confidenza - Quanto è certo il sistema (0-100%) - How certain the system is (0-100%)
  • Posizione - Posizioni dei caratteri di inizio e fine - Start and end character positions

Soglia di Confidenza

Regola la soglia di confidenza per controllare la sensibilità:

SogliaEffettoMigliore per
BassaMaggiore rilevamento di entità, più falsi positiviMassima copertura, revisione manuale
PredefinitoRilevamento e precisione bilanciatiUso generale
AltaMeno entità, maggiore confidenzaElaborazione automatizzata
Molto AltaSolo corrispondenze molto sicureIntervento minimo

Selezionare i Risultati

Dopo l'analisi, puoi affinare quali entità anonimizzare:

Seleziona/Deseleziona Tutto

  • Utilizza la casella di controllo nell'intestazione per selezionare o deselezionare tutti i risultati
  • Solo le entità selezionate saranno anonimizzate

Selezione Individuale

  • Clicca sulle caselle di controllo individuali per includere/escludere entità specifiche
  • Utile quando l'analyzer rileva falsi positivi
  • Utile quando desideri mantenere visibile certa informazione

Filtra per Tipo

  • Clicca su un badge di tipo entità per filtrare i risultati per quel tipo
  • Seleziona/deseleziona rapidamente tutte le entità di un tipo specifico

Rivedi i risultati prima di anonimizzare. L'analyzer può occasionalmente rilevare falsi positivi, specialmente per nomi che sono anche parole comuni.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.


Costi dei Token

Le operazioni di analisi consumano token in base a:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

  • text_k = Lunghezza del Testo
  • entities_enabled = Entità
  • entities_found = number of entities detected

Costo Tipico

Lunghezza del TestoEntitàCosto Tipico
100 characters3 types, 2 found2 tokens
1,000 characters5 types, 5 found3 tokens
5,000 characters10 types, 15 found6 tokens
10,000 characters15 types, 30 found10 tokens

Documentazione del Sistema di Token Token System documentation for complete pricing details.


Migliori Pratiche

Seleziona solo i tipi di entità di cui hai bisogno - riduce i costi e i falsi positivi
Utilizza preset specifici per lingua per una migliore precisione in testi non inglesi
Rivedi i risultati prima di anonimizzare, specialmente per nomi e luoghi
Utilizza soglie di confidenza più elevate per l'elaborazione automatizzata
Elabora il testo in porzioni ragionevoli (sotto i 10.000 caratteri) per le migliori prestazioni

Risoluzione dei Problemi

Entità non rilevata?

  • Assicurati che il tipo di entità sia abilitato nella tua selezione
  • Prova a ridurre la soglia di confidenza
  • Controlla che la lingua corretta sia selezionata
  • Verifica che il formato del testo corrisponda ai modelli attesi

Troppi falsi positivi?

  • Aumenta la soglia di confidenza
  • Deseleziona tipi di entità ampi come LOCALITÀ
  • Utilizza preset specifici per entità invece di selezionare tutto

L'analisi richiede troppo tempo?

  • Dividi testi lunghi in porzioni più piccole
  • Riduci il numero di tipi di entità selezionati
  • Utilizza preset per evitare di caricare modelli di rilevamento non utilizzati

Next Steps

Ultimo aggiornamento: Marzo 2026