Analizador de PII

Detecte información personal identificable en su texto

El Analizador de PII escanea su texto e identifica información sensible como nombres, correos electrónicos, números de teléfono, direcciones y más.

Cómo Funciona

El Analizador utiliza múltiples métodos de detección para identificar PII:

Coincidencia de Patrones

Las expresiones regulares detectan datos estructurados como direcciones de correo electrónico, números de teléfono, tarjetas de crédito e IBANs con alta precisión.

Aprendizaje Automático (NER)

Los modelos de Reconocimiento de Entidades Nombradas identifican entidades dependientes del contexto como nombres de personas, organizaciones y ubicaciones utilizando spaCy, Stanza y Transformers.

Validación de Suma de Comprobación

Las tarjetas de crédito, IBANs y otros identificadores financieros se validan utilizando algoritmos de suma de comprobación (Luhn, MOD-97) para reducir los falsos positivos.

Usando el Analizador

Paso 1: Ingrese su Texto

Navegue a la página de Anonimizar
Pegue o escriba su texto en el área de entrada
La interfaz muestra un conteo de caracteres y una estimación de tokens

Paso 2: Seleccione Tipos de Entidades

Elija qué tipos de PII detectar:

Tipos de Entidades	Soportamos 256 tipos de entidades organizados en 10 categorías:	Texto - El texto real que fue identificado como PII
Personal - Nombres, correos electrónicos, números de teléfono, fechas de nacimiento	PERSON, EMAIL_ADDRESS, PHONE_NUMBER	John Doe, john@email.com
Financiero - Tarjetas de crédito, cuentas bancarias, IBAN, billeteras de criptomonedas	CREDIT_CARD, IBAN_CODE, SWIFT_CODE	4111-1111-1111-1111
Ubicación - Direcciones, ciudades, países, coordenadas	LOCATION, ADDRESS, COORDINATES	123 Main St, New York
Gobierno - SSN, números de pasaporte, licencias de conducir, identificaciones nacionales	SSN, PASSPORT, DRIVER_LICENSE	123-45-6789
Técnico - Direcciones IP, direcciones MAC, IDs de dispositivos	IP_ADDRESS, MAC_ADDRESS	192.168.1.1

En lugar de seleccionar entidades manualmente, use Presets para aplicar rápidamente configuraciones comunes de entidades como "Cumplimiento de GDPR" o "Datos Financieros".

Instead of selecting entities manually, use Presets to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Paso 3: Seleccione Idioma

Elija el idioma de su texto para una precisión óptima en la detección:

Detección automática - Deje que el sistema determine el idioma - Let the system determine the language
Idioma específico - Seleccione entre 27 idiomas soportados - Select from 27 supported languages

La Selección de Idioma es Importante

Seleccionar el idioma correcto mejora significativamente la precisión de detección, especialmente para nombres de personas y ubicaciones.

Paso 4: Ejecutar Análisis

Haga clic en el botón Analizar
Espere a que se complete el análisis (típicamente 1-3 segundos)
Revise las entidades detectadas en el panel de resultados

Entendiendo los Resultados

Después del análisis, cada entidad detectada muestra:

PERSONJohn Doeconfianza

Posición: caracteres

Campos de Resultado

Tipo de Entidad - La categoría de PII detectada (PERSONA, CORREO ELECTRÓNICO, etc.) - The category of PII detected (PERSON, EMAIL, etc.)
Texto - El texto real que fue identificado como PII - The actual text that was identified as PII
Puntuación de Confianza - Qué tan seguro está el sistema (0-100%) - How certain the system is (0-100%)
Posición - Posiciones de caracteres de inicio y fin - Start and end character positions

Umbral de Confianza

Ajuste el umbral de confianza para controlar la sensibilidad:

Umbral	Efecto	Mejor Para
Bajo	Más entidades detectadas, más falsos positivos	Cobertura máxima, revisión manual
Predeterminado	Detección y precisión equilibradas	Uso general
Alto	Menos entidades, mayor confianza	Procesamiento automatizado
Muy Alto	Solo coincidencias muy seguras	Intervención mínima

Seleccionando Resultados

Después del análisis, puede refinar qué entidades anonimizar:

Seleccionar/Deseleccionar Todo

Utilice la casilla de verificación en el encabezado para seleccionar o deseleccionar todos los resultados
Solo las entidades seleccionadas serán anonimizadas

Selección Individual

Haga clic en las casillas de verificación individuales para incluir/excluir entidades específicas
Útil cuando el analizador detecta falsos positivos
Útil cuando desea mantener cierta información visible

Filtrar por Tipo

Haga clic en una insignia de tipo de entidad para filtrar resultados por ese tipo
Seleccione/deseleccione rápidamente todas las entidades de un tipo específico

Revise los resultados antes de anonimizar. El analizador puede detectar ocasionalmente falsos positivos, especialmente para nombres que también son palabras comunes.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.

Costos de Tokens

Las operaciones de análisis consumen tokens basados en:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

text_k = Longitud del Texto
entities_enabled = Entidades
entities_found = number of entities detected

Costo Típico

Longitud del Texto	Entidades	Costo Típico
100 characters	3 types, 2 found	2 tokens
1,000 characters	5 types, 5 found	3 tokens
5,000 characters	10 types, 15 found	6 tokens
10,000 characters	15 types, 30 found	10 tokens

Documentación del Sistema de Tokens Token System documentation for complete pricing details.

Mejores Prácticas

✅Seleccione solo los tipos de entidad que necesita - reduce costos y falsos positivos

✅Utilice presets específicos del idioma para una mejor precisión en textos no en inglés

✅Revise los resultados antes de anonimizar, especialmente para nombres y ubicaciones

✅Utilice umbrales de confianza más altos para procesamiento automatizado

✅Procese texto en fragmentos razonables (menos de 10,000 caracteres) para un mejor rendimiento

Resolución de Problemas

¿Entidad no detectada?

Asegúrese de que el tipo de entidad esté habilitado en su selección
Intente reducir el umbral de confianza
Verifique que el idioma correcto esté seleccionado
Verifique que el formato del texto coincida con los patrones esperados

¿Demasiados falsos positivos?

Aumente el umbral de confianza
Deseleccione tipos de entidad amplios como UBICACIÓN
Utilice presets específicos de entidad en lugar de seleccionar todos

¿El análisis está tardando demasiado?

Divida textos grandes en fragmentos más pequeños
Reduzca el número de tipos de entidad seleccionados
Utilice presets para evitar cargar modelos de detección no utilizados

Next Steps

Guía del Anonimizador

Aprenda cómo anonimizar entidades detectadas

Presets

Guarde y reutilice configuraciones de entidades

Última actualización: marzo de 2026