Analizador de PII
Detecte información personal identificable en su texto
El Analizador de PII escanea su texto e identifica información sensible como nombres, correos electrónicos, números de teléfono, direcciones y más.
Cómo Funciona
El Analizador utiliza múltiples métodos de detección para identificar PII:
Coincidencia de Patrones
Las expresiones regulares detectan datos estructurados como direcciones de correo electrónico, números de teléfono, tarjetas de crédito e IBANs con alta precisión.
Aprendizaje Automático (NER)
Los modelos de Reconocimiento de Entidades Nombradas identifican entidades dependientes del contexto como nombres de personas, organizaciones y ubicaciones utilizando spaCy, Stanza y Transformers.
Validación de Suma de Comprobación
Las tarjetas de crédito, IBANs y otros identificadores financieros se validan utilizando algoritmos de suma de comprobación (Luhn, MOD-97) para reducir los falsos positivos.
Usando el Analizador
Paso 1: Ingrese su Texto
- Navegue a la página de Anonimizar
- Pegue o escriba su texto en el área de entrada
- La interfaz muestra un conteo de caracteres y una estimación de tokens
Paso 2: Seleccione Tipos de Entidades
Elija qué tipos de PII detectar:
| Tipos de Entidades | Soportamos 256 tipos de entidades organizados en 10 categorías: | Texto - El texto real que fue identificado como PII |
|---|---|---|
| Personal - Nombres, correos electrónicos, números de teléfono, fechas de nacimiento | PERSON, EMAIL_ADDRESS, PHONE_NUMBER | John Doe, john@email.com |
| Financiero - Tarjetas de crédito, cuentas bancarias, IBAN, billeteras de criptomonedas | CREDIT_CARD, IBAN_CODE, SWIFT_CODE | 4111-1111-1111-1111 |
| Ubicación - Direcciones, ciudades, países, coordenadas | LOCATION, ADDRESS, COORDINATES | 123 Main St, New York |
| Gobierno - SSN, números de pasaporte, licencias de conducir, identificaciones nacionales | SSN, PASSPORT, DRIVER_LICENSE | 123-45-6789 |
| Técnico - Direcciones IP, direcciones MAC, IDs de dispositivos | IP_ADDRESS, MAC_ADDRESS | 192.168.1.1 |
En lugar de seleccionar entidades manualmente, use Presets para aplicar rápidamente configuraciones comunes de entidades como "Cumplimiento de GDPR" o "Datos Financieros".
Instead of selecting entities manually, use Presets to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".
Paso 3: Seleccione Idioma
Elija el idioma de su texto para una precisión óptima en la detección:
- Detección automática - Deje que el sistema determine el idioma - Let the system determine the language
- Idioma específico - Seleccione entre 27 idiomas soportados - Select from 27 supported languages
La Selección de Idioma es Importante
Seleccionar el idioma correcto mejora significativamente la precisión de detección, especialmente para nombres de personas y ubicaciones.
Paso 4: Ejecutar Análisis
- Haga clic en el botón Analizar
- Espere a que se complete el análisis (típicamente 1-3 segundos)
- Revise las entidades detectadas en el panel de resultados
Entendiendo los Resultados
Después del análisis, cada entidad detectada muestra:
Posición: caracteres
Campos de Resultado
- Tipo de Entidad - La categoría de PII detectada (PERSONA, CORREO ELECTRÓNICO, etc.) - The category of PII detected (PERSON, EMAIL, etc.)
- Texto - El texto real que fue identificado como PII - The actual text that was identified as PII
- Puntuación de Confianza - Qué tan seguro está el sistema (0-100%) - How certain the system is (0-100%)
- Posición - Posiciones de caracteres de inicio y fin - Start and end character positions
Umbral de Confianza
Ajuste el umbral de confianza para controlar la sensibilidad:
| Umbral | Efecto | Mejor Para |
|---|---|---|
| Bajo | Más entidades detectadas, más falsos positivos | Cobertura máxima, revisión manual |
| Predeterminado | Detección y precisión equilibradas | Uso general |
| Alto | Menos entidades, mayor confianza | Procesamiento automatizado |
| Muy Alto | Solo coincidencias muy seguras | Intervención mínima |
Seleccionando Resultados
Después del análisis, puede refinar qué entidades anonimizar:
Seleccionar/Deseleccionar Todo
- Utilice la casilla de verificación en el encabezado para seleccionar o deseleccionar todos los resultados
- Solo las entidades seleccionadas serán anonimizadas
Selección Individual
- Haga clic en las casillas de verificación individuales para incluir/excluir entidades específicas
- Útil cuando el analizador detecta falsos positivos
- Útil cuando desea mantener cierta información visible
Filtrar por Tipo
- Haga clic en una insignia de tipo de entidad para filtrar resultados por ese tipo
- Seleccione/deseleccione rápidamente todas las entidades de un tipo específico
Revise los resultados antes de anonimizar. El analizador puede detectar ocasionalmente falsos positivos, especialmente para nombres que también son palabras comunes.
Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.
Costos de Tokens
Las operaciones de análisis consumen tokens basados en:
Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found
Final = ceil(Cost × 0.5)
Where:
text_k= Longitud del Textoentities_enabled= Entidadesentities_found= number of entities detected
Costo Típico
| Longitud del Texto | Entidades | Costo Típico |
|---|---|---|
| 100 characters | 3 types, 2 found | 2 tokens |
| 1,000 characters | 5 types, 5 found | 3 tokens |
| 5,000 characters | 10 types, 15 found | 6 tokens |
| 10,000 characters | 15 types, 30 found | 10 tokens |
Documentación del Sistema de Tokens Token System documentation for complete pricing details.
Mejores Prácticas
Resolución de Problemas
¿Entidad no detectada?
- Asegúrese de que el tipo de entidad esté habilitado en su selección
- Intente reducir el umbral de confianza
- Verifique que el idioma correcto esté seleccionado
- Verifique que el formato del texto coincida con los patrones esperados
¿Demasiados falsos positivos?
- Aumente el umbral de confianza
- Deseleccione tipos de entidad amplios como UBICACIÓN
- Utilice presets específicos de entidad en lugar de seleccionar todos
¿El análisis está tardando demasiado?
- Divida textos grandes en fragmentos más pequeños
- Reduzca el número de tipos de entidad seleccionados
- Utilice presets para evitar cargar modelos de detección no utilizados
Next Steps
Última actualización: marzo de 2026