Analitzador de PII
Detecta informació personalment identificable en el teu text
L'analitzador de PII escaneja el teu text i identifica informació sensible com noms, correus electrònics, números de telèfon, adreces i més.
Com funciona
L'Analitzador utilitza múltiples mètodes de detecció per identificar PII:
Coincidència de Patró
Les expressions regulars detecten dades estructurades com adreces de correu electrònic, números de telèfon, targetes de crèdit i IBANs amb alta precisió.
Aprenentatge Automàtic (NER)
Els models de Reconeixement d'Entitats Nomenades identifiquen entitats dependents del context com noms de persones, organitzacions i ubicacions utilitzant spaCy, Stanza i Transformers.
Validació de Comprovació
Les targetes de crèdit, IBANs i altres identificadors financers es validen mitjançant algoritmes de comprovació (Luhn, MOD-97) per reduir falsos positius.
Utilitzant l'Analitzador
Pas 1: Introduïu el vostre text
- Navegueu a la pàgina d'Anonimització
- Enganxeu o escriviu el vostre text a l'àrea d'entrada
- La interfície mostra un recompte de caràcters i una estimació de tokens
Pas 2: Seleccioneu Tipus d'Entitats
Trieu quins tipus de PII detectar:
| Tipus d'entitats | Donem suport a 256 tipus d'entitats organitzats en 10 categories: | Text - El text real que es va identificar com a PII |
|---|---|---|
| Personal - Noms, correus electrònics, números de telèfon, dates de naixement | PERSON, EMAIL_ADDRESS, PHONE_NUMBER | John Doe, john@email.com |
| Financer - Targetes de crèdit, comptes bancaris, IBAN, moneders de criptomonedes | CREDIT_CARD, IBAN_CODE, SWIFT_CODE | 4111-1111-1111-1111 |
| Ubicació - Adreces, ciutats, països, coordenades | LOCATION, ADDRESS, COORDINATES | 123 Main St, New York |
| Gubernamental - SSN, números de passaport, llicències de conduir, identificadors nacionals | SSN, PASSPORT, DRIVER_LICENSE | 123-45-6789 |
| Tècnic - Adreces IP, adreces MAC, ID de dispositius | IP_ADDRESS, MAC_ADDRESS | 192.168.1.1 |
En comptes de seleccionar entitats manualment, utilitzeu Presets per aplicar ràpidament configuracions d'entitats comunes com "Compliment GDPR" o "Dades Financeres".
Instead of selecting entities manually, use Presets to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".
Pas 3: Seleccioneu Llengua
Trieu la llengua del vostre text per a una precisió de detecció òptima:
- Detecció automàtica - Deixeu que el sistema determini la llengua - Let the system determine the language
- Llengua específica - Seleccioneu entre 27 llengües suportades - Select from 27 supported languages
La Selecció de Llengua És Important
Seleccionar la llengua correcta millora significativament la precisió de detecció, especialment per noms de persones i ubicacions.
Pas 4: Executar Anàlisi
- Feu clic al botó Analitzar
- Espereu que l'anàlisi es completi (normalment 1-3 segons)
- Reviseu les entitats detectades al panell de resultats
Entenent els Resultats
Després de l'anàlisi, cada entitat detectada mostra:
Posició: caràcters
Camp de Resultats
- Tipus d'Entitat - La categoria de PII detectada (PERSONA, CORREU ELECTRÒNIC, etc.) - The category of PII detected (PERSON, EMAIL, etc.)
- Text - El text real que es va identificar com a PII - The actual text that was identified as PII
- Puntuació de Confiança - Quina certesa té el sistema (0-100%) - How certain the system is (0-100%)
- Posició - Posicions de caràcters d'inici i fi - Start and end character positions
Límit de Confiança
Ajusteu el límit de confiança per controlar la sensibilitat:
| Límit | Efecte | Millor per |
|---|---|---|
| Baix | Més entitats detectades, més falsos positius | Cobertura màxima, revisió manual |
| Per defecte | Detecció i precisió equilibrades | Ús general |
| Alt | Menys entitats, més confiança | Processament automatitzat |
| Molt Alt | Només coincidències molt segures | Intervenció mínima |
Seleccionant Resultats
Després de l'anàlisi, podeu refinar quines entitats voleu anonimitzar:
Seleccionar/Deseleccionar Totes
- Utilitzeu la casella de selecció a l'encapçalament per seleccionar o deseleccionar tots els resultats
- Només les entitats seleccionades seran anonimitzades
Selecció Individual
- Feu clic a les caselles de selecció individuals per incloure/excloure entitats específiques
- Útil quan l'analitzador detecta falsos positius
- Útil quan voleu mantenir certa informació visible
Filtrar per Tipus
- Feu clic en un distintiu de tipus d'entitat per filtrar resultats per aquest tipus
- Seleccioneu/deseleccioneu ràpidament totes les entitats d'un tipus específic
Reviseu els resultats abans d'anonimitzar. L'analitzador pot detectar ocasionalment falsos positius, especialment per noms que també són paraules comunes.
Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.
Costos de Tokens
Les operacions d'anàlisi consumeixen tokens basats en:
Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found
Final = ceil(Cost × 0.5)
Where:
text_k= Longitud del Textentities_enabled= Entitatsentities_found= number of entities detected
Cost Típic
| Longitud del Text | Entitats | Cost Típic |
|---|---|---|
| 100 characters | 3 types, 2 found | 2 tokens |
| 1,000 characters | 5 types, 5 found | 3 tokens |
| 5,000 characters | 10 types, 15 found | 6 tokens |
| 10,000 characters | 15 types, 30 found | 10 tokens |
Documentació del Sistema de Tokens Token System documentation for complete pricing details.
Millors Pràctiques
Resolució de Problemes
Entitat no detectada?
- Assegureu-vos que el tipus d'entitat estigui habilitat a la vostra selecció
- Proveu de baixar el límit de confiança
- Comproveu que la llengua correcta estigui seleccionada
- Verifiqueu que el format del text coincideixi amb els patrons esperats
Masses falsos positius?
- Augmenteu el límit de confiança
- Deseleccioneu tipus d'entitats àmplies com UBICACIÓ
- Utilitzeu presets específics d'entitat en comptes de seleccionar totes
L'anàlisi triga massa?
- Dividiu textos grans en trossos més petits
- Reduïu el nombre de tipus d'entitats seleccionades
- Utilitzeu presets per evitar carregar models de detecció no utilitzats
Next Steps
Última actualització: març de 2026