common.skipToContent

Analitzador de PII

Detecta informació personalment identificable en el teu text

L'analitzador de PII escaneja el teu text i identifica informació sensible com noms, correus electrònics, números de telèfon, adreces i més.


Com funciona

L'Analitzador utilitza múltiples mètodes de detecció per identificar PII:

Coincidència de Patró

Les expressions regulars detecten dades estructurades com adreces de correu electrònic, números de telèfon, targetes de crèdit i IBANs amb alta precisió.

Aprenentatge Automàtic (NER)

Els models de Reconeixement d'Entitats Nomenades identifiquen entitats dependents del context com noms de persones, organitzacions i ubicacions utilitzant spaCy, Stanza i Transformers.

Validació de Comprovació

Les targetes de crèdit, IBANs i altres identificadors financers es validen mitjançant algoritmes de comprovació (Luhn, MOD-97) per reduir falsos positius.


Utilitzant l'Analitzador

Pas 1: Introduïu el vostre text

  1. Navegueu a la pàgina d'Anonimització
  2. Enganxeu o escriviu el vostre text a l'àrea d'entrada
  3. La interfície mostra un recompte de caràcters i una estimació de tokens

Pas 2: Seleccioneu Tipus d'Entitats

Trieu quins tipus de PII detectar:

Tipus d'entitatsDonem suport a 256 tipus d'entitats organitzats en 10 categories:Text - El text real que es va identificar com a PII
Personal - Noms, correus electrònics, números de telèfon, dates de naixementPERSON, EMAIL_ADDRESS, PHONE_NUMBERJohn Doe, john@email.com
Financer - Targetes de crèdit, comptes bancaris, IBAN, moneders de criptomonedesCREDIT_CARD, IBAN_CODE, SWIFT_CODE4111-1111-1111-1111
Ubicació - Adreces, ciutats, països, coordenadesLOCATION, ADDRESS, COORDINATES123 Main St, New York
Gubernamental - SSN, números de passaport, llicències de conduir, identificadors nacionalsSSN, PASSPORT, DRIVER_LICENSE123-45-6789
Tècnic - Adreces IP, adreces MAC, ID de dispositiusIP_ADDRESS, MAC_ADDRESS192.168.1.1

En comptes de seleccionar entitats manualment, utilitzeu Presets per aplicar ràpidament configuracions d'entitats comunes com "Compliment GDPR" o "Dades Financeres".

Instead of selecting entities manually, use Presets to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Pas 3: Seleccioneu Llengua

Trieu la llengua del vostre text per a una precisió de detecció òptima:

  • Detecció automàtica - Deixeu que el sistema determini la llengua - Let the system determine the language
  • Llengua específica - Seleccioneu entre 27 llengües suportades - Select from 27 supported languages

La Selecció de Llengua És Important

Seleccionar la llengua correcta millora significativament la precisió de detecció, especialment per noms de persones i ubicacions.

Pas 4: Executar Anàlisi

  1. Feu clic al botó Analitzar
  2. Espereu que l'anàlisi es completi (normalment 1-3 segons)
  3. Reviseu les entitats detectades al panell de resultats

Entenent els Resultats

Després de l'anàlisi, cada entitat detectada mostra:

PERSONJohn Doeconfiança

Posició: caràcters

Camp de Resultats

  • Tipus d'Entitat - La categoria de PII detectada (PERSONA, CORREU ELECTRÒNIC, etc.) - The category of PII detected (PERSON, EMAIL, etc.)
  • Text - El text real que es va identificar com a PII - The actual text that was identified as PII
  • Puntuació de Confiança - Quina certesa té el sistema (0-100%) - How certain the system is (0-100%)
  • Posició - Posicions de caràcters d'inici i fi - Start and end character positions

Límit de Confiança

Ajusteu el límit de confiança per controlar la sensibilitat:

LímitEfecteMillor per
BaixMés entitats detectades, més falsos positiusCobertura màxima, revisió manual
Per defecteDetecció i precisió equilibradesÚs general
AltMenys entitats, més confiançaProcessament automatitzat
Molt AltNomés coincidències molt seguresIntervenció mínima

Seleccionant Resultats

Després de l'anàlisi, podeu refinar quines entitats voleu anonimitzar:

Seleccionar/Deseleccionar Totes

  • Utilitzeu la casella de selecció a l'encapçalament per seleccionar o deseleccionar tots els resultats
  • Només les entitats seleccionades seran anonimitzades

Selecció Individual

  • Feu clic a les caselles de selecció individuals per incloure/excloure entitats específiques
  • Útil quan l'analitzador detecta falsos positius
  • Útil quan voleu mantenir certa informació visible

Filtrar per Tipus

  • Feu clic en un distintiu de tipus d'entitat per filtrar resultats per aquest tipus
  • Seleccioneu/deseleccioneu ràpidament totes les entitats d'un tipus específic

Reviseu els resultats abans d'anonimitzar. L'analitzador pot detectar ocasionalment falsos positius, especialment per noms que també són paraules comunes.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.


Costos de Tokens

Les operacions d'anàlisi consumeixen tokens basats en:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

  • text_k = Longitud del Text
  • entities_enabled = Entitats
  • entities_found = number of entities detected

Cost Típic

Longitud del TextEntitatsCost Típic
100 characters3 types, 2 found2 tokens
1,000 characters5 types, 5 found3 tokens
5,000 characters10 types, 15 found6 tokens
10,000 characters15 types, 30 found10 tokens

Documentació del Sistema de Tokens Token System documentation for complete pricing details.


Millors Pràctiques

Seleccioneu només els tipus d'entitat que necessiteu - redueix costos i falsos positius
Utilitzeu presets específics de llengua per a una millor precisió en textos no anglesos
Reviseu els resultats abans d'anonimitzar, especialment per noms i ubicacions
Utilitzeu llindars de confiança més alts per al processament automatitzat
Processar text en trossos raonables (menys de 10,000 caràcters) per obtenir el millor rendiment

Resolució de Problemes

Entitat no detectada?

  • Assegureu-vos que el tipus d'entitat estigui habilitat a la vostra selecció
  • Proveu de baixar el límit de confiança
  • Comproveu que la llengua correcta estigui seleccionada
  • Verifiqueu que el format del text coincideixi amb els patrons esperats

Masses falsos positius?

  • Augmenteu el límit de confiança
  • Deseleccioneu tipus d'entitats àmplies com UBICACIÓ
  • Utilitzeu presets específics d'entitat en comptes de seleccionar totes

L'anàlisi triga massa?

  • Dividiu textos grans en trossos més petits
  • Reduïu el nombre de tipus d'entitats seleccionades
  • Utilitzeu presets per evitar carregar models de detecció no utilitzats

Next Steps

Última actualització: març de 2026