common.skipToContent

Analizador de PII

Detecte información personal identificable en su texto

El Analizador de PII escanea su texto e identifica información sensible como nombres, correos electrónicos, números de teléfono, direcciones y más.


Cómo Funciona

El Analizador utiliza múltiples métodos de detección para identificar PII:

Coincidencia de Patrones

Las expresiones regulares detectan datos estructurados como direcciones de correo electrónico, números de teléfono, tarjetas de crédito e IBANs con alta precisión.

Aprendizaje Automático (NER)

Los modelos de Reconocimiento de Entidades Nombradas identifican entidades dependientes del contexto como nombres de personas, organizaciones y ubicaciones utilizando spaCy, Stanza y Transformers.

Validación de Suma de Comprobación

Las tarjetas de crédito, IBANs y otros identificadores financieros se validan utilizando algoritmos de suma de comprobación (Luhn, MOD-97) para reducir los falsos positivos.


Usando el Analizador

Paso 1: Ingrese su Texto

  1. Navegue a la página de Anonimizar
  2. Pegue o escriba su texto en el área de entrada
  3. La interfaz muestra un conteo de caracteres y una estimación de tokens

Paso 2: Seleccione Tipos de Entidades

Elija qué tipos de PII detectar:

Tipos de EntidadesSoportamos 256 tipos de entidades organizados en 10 categorías:Texto - El texto real que fue identificado como PII
Personal - Nombres, correos electrónicos, números de teléfono, fechas de nacimientoPERSON, EMAIL_ADDRESS, PHONE_NUMBERJohn Doe, john@email.com
Financiero - Tarjetas de crédito, cuentas bancarias, IBAN, billeteras de criptomonedasCREDIT_CARD, IBAN_CODE, SWIFT_CODE4111-1111-1111-1111
Ubicación - Direcciones, ciudades, países, coordenadasLOCATION, ADDRESS, COORDINATES123 Main St, New York
Gobierno - SSN, números de pasaporte, licencias de conducir, identificaciones nacionalesSSN, PASSPORT, DRIVER_LICENSE123-45-6789
Técnico - Direcciones IP, direcciones MAC, IDs de dispositivosIP_ADDRESS, MAC_ADDRESS192.168.1.1

En lugar de seleccionar entidades manualmente, use Presets para aplicar rápidamente configuraciones comunes de entidades como "Cumplimiento de GDPR" o "Datos Financieros".

Instead of selecting entities manually, use Presets to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Paso 3: Seleccione Idioma

Elija el idioma de su texto para una precisión óptima en la detección:

  • Detección automática - Deje que el sistema determine el idioma - Let the system determine the language
  • Idioma específico - Seleccione entre 27 idiomas soportados - Select from 27 supported languages

La Selección de Idioma es Importante

Seleccionar el idioma correcto mejora significativamente la precisión de detección, especialmente para nombres de personas y ubicaciones.

Paso 4: Ejecutar Análisis

  1. Haga clic en el botón Analizar
  2. Espere a que se complete el análisis (típicamente 1-3 segundos)
  3. Revise las entidades detectadas en el panel de resultados

Entendiendo los Resultados

Después del análisis, cada entidad detectada muestra:

PERSONJohn Doeconfianza

Posición: caracteres

Campos de Resultado

  • Tipo de Entidad - La categoría de PII detectada (PERSONA, CORREO ELECTRÓNICO, etc.) - The category of PII detected (PERSON, EMAIL, etc.)
  • Texto - El texto real que fue identificado como PII - The actual text that was identified as PII
  • Puntuación de Confianza - Qué tan seguro está el sistema (0-100%) - How certain the system is (0-100%)
  • Posición - Posiciones de caracteres de inicio y fin - Start and end character positions

Umbral de Confianza

Ajuste el umbral de confianza para controlar la sensibilidad:

UmbralEfectoMejor Para
BajoMás entidades detectadas, más falsos positivosCobertura máxima, revisión manual
PredeterminadoDetección y precisión equilibradasUso general
AltoMenos entidades, mayor confianzaProcesamiento automatizado
Muy AltoSolo coincidencias muy segurasIntervención mínima

Seleccionando Resultados

Después del análisis, puede refinar qué entidades anonimizar:

Seleccionar/Deseleccionar Todo

  • Utilice la casilla de verificación en el encabezado para seleccionar o deseleccionar todos los resultados
  • Solo las entidades seleccionadas serán anonimizadas

Selección Individual

  • Haga clic en las casillas de verificación individuales para incluir/excluir entidades específicas
  • Útil cuando el analizador detecta falsos positivos
  • Útil cuando desea mantener cierta información visible

Filtrar por Tipo

  • Haga clic en una insignia de tipo de entidad para filtrar resultados por ese tipo
  • Seleccione/deseleccione rápidamente todas las entidades de un tipo específico

Revise los resultados antes de anonimizar. El analizador puede detectar ocasionalmente falsos positivos, especialmente para nombres que también son palabras comunes.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.


Costos de Tokens

Las operaciones de análisis consumen tokens basados en:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

  • text_k = Longitud del Texto
  • entities_enabled = Entidades
  • entities_found = number of entities detected

Costo Típico

Longitud del TextoEntidadesCosto Típico
100 characters3 types, 2 found2 tokens
1,000 characters5 types, 5 found3 tokens
5,000 characters10 types, 15 found6 tokens
10,000 characters15 types, 30 found10 tokens

Documentación del Sistema de Tokens Token System documentation for complete pricing details.


Mejores Prácticas

Seleccione solo los tipos de entidad que necesita - reduce costos y falsos positivos
Utilice presets específicos del idioma para una mejor precisión en textos no en inglés
Revise los resultados antes de anonimizar, especialmente para nombres y ubicaciones
Utilice umbrales de confianza más altos para procesamiento automatizado
Procese texto en fragmentos razonables (menos de 10,000 caracteres) para un mejor rendimiento

Resolución de Problemas

¿Entidad no detectada?

  • Asegúrese de que el tipo de entidad esté habilitado en su selección
  • Intente reducir el umbral de confianza
  • Verifique que el idioma correcto esté seleccionado
  • Verifique que el formato del texto coincida con los patrones esperados

¿Demasiados falsos positivos?

  • Aumente el umbral de confianza
  • Deseleccione tipos de entidad amplios como UBICACIÓN
  • Utilice presets específicos de entidad en lugar de seleccionar todos

¿El análisis está tardando demasiado?

  • Divida textos grandes en fragmentos más pequeños
  • Reduzca el número de tipos de entidad seleccionados
  • Utilice presets para evitar cargar modelos de detección no utilizados

Next Steps

Última actualización: marzo de 2026