Analitzador de PII

Detecta informació personalment identificable en el teu text

L'analitzador de PII escaneja el teu text i identifica informació sensible com noms, correus electrònics, números de telèfon, adreces i més.

Com funciona

L'Analitzador utilitza múltiples mètodes de detecció per identificar PII:

Coincidència de Patró

Les expressions regulars detecten dades estructurades com adreces de correu electrònic, números de telèfon, targetes de crèdit i IBANs amb alta precisió.

Aprenentatge Automàtic (NER)

Els models de Reconeixement d'Entitats Nomenades identifiquen entitats dependents del context com noms de persones, organitzacions i ubicacions utilitzant spaCy, Stanza i Transformers.

Validació de Comprovació

Les targetes de crèdit, IBANs i altres identificadors financers es validen mitjançant algoritmes de comprovació (Luhn, MOD-97) per reduir falsos positius.

Utilitzant l'Analitzador

Pas 1: Introduïu el vostre text

Navegueu a la pàgina d'Anonimització
Enganxeu o escriviu el vostre text a l'àrea d'entrada
La interfície mostra un recompte de caràcters i una estimació de tokens

Pas 2: Seleccioneu Tipus d'Entitats

Trieu quins tipus de PII detectar:

Tipus d'entitats	Donem suport a 256 tipus d'entitats organitzats en 10 categories:	Text - El text real que es va identificar com a PII
Personal - Noms, correus electrònics, números de telèfon, dates de naixement	PERSON, EMAIL_ADDRESS, PHONE_NUMBER	John Doe, john@email.com
Financer - Targetes de crèdit, comptes bancaris, IBAN, moneders de criptomonedes	CREDIT_CARD, IBAN_CODE, SWIFT_CODE	4111-1111-1111-1111
Ubicació - Adreces, ciutats, països, coordenades	LOCATION, ADDRESS, COORDINATES	123 Main St, New York
Gubernamental - SSN, números de passaport, llicències de conduir, identificadors nacionals	SSN, PASSPORT, DRIVER_LICENSE	123-45-6789
Tècnic - Adreces IP, adreces MAC, ID de dispositius	IP_ADDRESS, MAC_ADDRESS	192.168.1.1

En comptes de seleccionar entitats manualment, utilitzeu Presets per aplicar ràpidament configuracions d'entitats comunes com "Compliment GDPR" o "Dades Financeres".

Instead of selecting entities manually, use Presets to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Pas 3: Seleccioneu Llengua

Trieu la llengua del vostre text per a una precisió de detecció òptima:

Detecció automàtica - Deixeu que el sistema determini la llengua - Let the system determine the language
Llengua específica - Seleccioneu entre 27 llengües suportades - Select from 27 supported languages

La Selecció de Llengua És Important

Seleccionar la llengua correcta millora significativament la precisió de detecció, especialment per noms de persones i ubicacions.

Pas 4: Executar Anàlisi

Feu clic al botó Analitzar
Espereu que l'anàlisi es completi (normalment 1-3 segons)
Reviseu les entitats detectades al panell de resultats

Entenent els Resultats

Després de l'anàlisi, cada entitat detectada mostra:

PERSONJohn Doeconfiança

Posició: caràcters

Camp de Resultats

Tipus d'Entitat - La categoria de PII detectada (PERSONA, CORREU ELECTRÒNIC, etc.) - The category of PII detected (PERSON, EMAIL, etc.)
Text - El text real que es va identificar com a PII - The actual text that was identified as PII
Puntuació de Confiança - Quina certesa té el sistema (0-100%) - How certain the system is (0-100%)
Posició - Posicions de caràcters d'inici i fi - Start and end character positions

Límit de Confiança

Ajusteu el límit de confiança per controlar la sensibilitat:

Límit	Efecte	Millor per
Baix	Més entitats detectades, més falsos positius	Cobertura màxima, revisió manual
Per defecte	Detecció i precisió equilibrades	Ús general
Alt	Menys entitats, més confiança	Processament automatitzat
Molt Alt	Només coincidències molt segures	Intervenció mínima

Seleccionant Resultats

Després de l'anàlisi, podeu refinar quines entitats voleu anonimitzar:

Seleccionar/Deseleccionar Totes

Utilitzeu la casella de selecció a l'encapçalament per seleccionar o deseleccionar tots els resultats
Només les entitats seleccionades seran anonimitzades

Selecció Individual

Feu clic a les caselles de selecció individuals per incloure/excloure entitats específiques
Útil quan l'analitzador detecta falsos positius
Útil quan voleu mantenir certa informació visible

Filtrar per Tipus

Feu clic en un distintiu de tipus d'entitat per filtrar resultats per aquest tipus
Seleccioneu/deseleccioneu ràpidament totes les entitats d'un tipus específic

Reviseu els resultats abans d'anonimitzar. L'analitzador pot detectar ocasionalment falsos positius, especialment per noms que també són paraules comunes.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.

Costos de Tokens

Les operacions d'anàlisi consumeixen tokens basats en:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

text_k = Longitud del Text
entities_enabled = Entitats
entities_found = number of entities detected

Cost Típic

Longitud del Text	Entitats	Cost Típic
100 characters	3 types, 2 found	2 tokens
1,000 characters	5 types, 5 found	3 tokens
5,000 characters	10 types, 15 found	6 tokens
10,000 characters	15 types, 30 found	10 tokens

Documentació del Sistema de Tokens Token System documentation for complete pricing details.

Millors Pràctiques

✅Seleccioneu només els tipus d'entitat que necessiteu - redueix costos i falsos positius

✅Utilitzeu presets específics de llengua per a una millor precisió en textos no anglesos

✅Reviseu els resultats abans d'anonimitzar, especialment per noms i ubicacions

✅Utilitzeu llindars de confiança més alts per al processament automatitzat

✅Processar text en trossos raonables (menys de 10,000 caràcters) per obtenir el millor rendiment

Resolució de Problemes

Entitat no detectada?

Assegureu-vos que el tipus d'entitat estigui habilitat a la vostra selecció
Proveu de baixar el límit de confiança
Comproveu que la llengua correcta estigui seleccionada
Verifiqueu que el format del text coincideixi amb els patrons esperats

Masses falsos positius?

Augmenteu el límit de confiança
Deseleccioneu tipus d'entitats àmplies com UBICACIÓ
Utilitzeu presets específics d'entitat en comptes de seleccionar totes

L'anàlisi triga massa?

Dividiu textos grans en trossos més petits
Reduïu el nombre de tipus d'entitats seleccionades
Utilitzeu presets per evitar carregar models de detecció no utilitzats

Next Steps

Guia d'Anonimització

Apreneu com anonimitzar les entitats detectades

Presets

Desa i reutilitza configuracions d'entitats

Última actualització: març de 2026