Analisador de PII
Detecte informações pessoalmente identificáveis em seu texto
O Analisador de PII escaneia seu texto e identifica informações sensíveis como nomes, e-mails, números de telefone, endereços e mais.
Como Funciona
O Analisador utiliza múltiplos métodos de detecção para identificar PII:
Correspondência de Padrões
Expressões regulares detectam dados estruturados como endereços de e-mail, números de telefone, cartões de crédito e IBANs com alta precisão.
Aprendizado de Máquina (NER)
Modelos de Reconhecimento de Entidades Nomeadas identificam entidades dependentes de contexto, como nomes de pessoas, organizações e locais, usando spaCy, Stanza e Transformers.
Validação de Checksum
Cartões de crédito, IBANs e outros identificadores financeiros são validados usando algoritmos de checksum (Luhn, MOD-97) para reduzir falsos positivos.
Usando o Analisador
Passo 1: Insira Seu Texto
- Navegue até a página de Anonimização
- Cole ou digite seu texto na área de entrada
- A interface mostra uma contagem de caracteres e uma estimativa de tokens
Passo 2: Selecione Tipos de Entidade
Escolha quais tipos de PII detectar:
| Tipos de Entidade | Suportamos 256 tipos de entidade organizados em 10 categorias: | Texto - O texto real que foi identificado como PII |
|---|---|---|
| Pessoal - Nomes, e-mails, números de telefone, datas de nascimento | PERSON, EMAIL_ADDRESS, PHONE_NUMBER | John Doe, john@email.com |
| Financeiro - Cartões de crédito, contas bancárias, IBAN, carteiras de criptomoedas | CREDIT_CARD, IBAN_CODE, SWIFT_CODE | 4111-1111-1111-1111 |
| Localização - Endereços, cidades, países, coordenadas | LOCATION, ADDRESS, COORDINATES | 123 Main St, New York |
| Governo - SSN, números de passaporte, carteiras de motorista, IDs nacionais | SSN, PASSPORT, DRIVER_LICENSE | 123-45-6789 |
| Técnico - Endereços IP, endereços MAC, IDs de dispositivos | IP_ADDRESS, MAC_ADDRESS | 192.168.1.1 |
Em vez de selecionar entidades manualmente, use Predefinições para aplicar rapidamente configurações comuns de entidades como "Conformidade com o GDPR" ou "Dados Financeiros".
Instead of selecting entities manually, use Predefinições to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".
Passo 3: Selecione o Idioma
Escolha o idioma do seu texto para uma precisão de detecção ideal:
- Detecção automática - Deixe o sistema determinar o idioma - Let the system determine the language
- Idioma específico - Selecione entre 27 idiomas suportados - Select from 27 supported languages
A Seleção de Idioma Importa
Selecionar o idioma correto melhora significativamente a precisão da detecção, especialmente para nomes de pessoas e locais.
Passo 4: Executar Análise
- Clique no botão Analisar
- Aguarde a conclusão da análise (geralmente 1-3 segundos)
- Revise as entidades detectadas no painel de resultados
Entendendo os Resultados
Após a análise, cada entidade detectada mostra:
Posição: caracteres
Campos de Resultado
- Tipo de Entidade - A categoria de PII detectada (PESSOA, EMAIL, etc.) - The category of PII detected (PERSON, EMAIL, etc.)
- Texto - O texto real que foi identificado como PII - The actual text that was identified as PII
- Pontuação de Confiança - Quão certo o sistema está (0-100%) - How certain the system is (0-100%)
- Posição - Posições de caracteres inicial e final - Start and end character positions
Limite de Confiança
Ajuste o limite de confiança para controlar a sensibilidade:
| Limite | Efeito | Melhor Para |
|---|---|---|
| Baixo | Mais entidades detectadas, mais falsos positivos | Cobertura máxima, revisão manual |
| Padrão | Detecção e precisão equilibradas | Uso geral |
| Alto | Menos entidades, maior confiança | Processamento automatizado |
| Muito Alto | Apenas correspondências com alta confiança | Intervenção mínima |
Selecionando Resultados
Após a análise, você pode refinar quais entidades anonimizar:
Selecionar/Deselecionar Todos
- Use a caixa de seleção no cabeçalho para selecionar ou desmarcar todos os resultados
- Apenas entidades selecionadas serão anonimizadas
Seleção Individual
- Clique nas caixas de seleção individuais para incluir/excluir entidades específicas
- Útil quando o analisador detecta falsos positivos
- Útil quando você deseja manter certas informações visíveis
Filtrar por Tipo
- Clique em um distintivo de tipo de entidade para filtrar resultados por esse tipo
- Selecione/deselecione rapidamente todas as entidades de um tipo específico
Revise os resultados antes de anonimizar. O analisador pode ocasionalmente detectar falsos positivos, especialmente para nomes que também são palavras comuns.
Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.
Custos de Tokens
Operações de análise consomem tokens com base em:
Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found
Final = ceil(Cost × 0.5)
Where:
text_k= Comprimento do Textoentities_enabled= Entidadesentities_found= number of entities detected
Custo Típico
| Comprimento do Texto | Entidades | Custo Típico |
|---|---|---|
| 100 characters | 3 types, 2 found | 2 tokens |
| 1,000 characters | 5 types, 5 found | 3 tokens |
| 5,000 characters | 10 types, 15 found | 6 tokens |
| 10,000 characters | 15 types, 30 found | 10 tokens |
Documentação do Sistema de Tokens Token System documentation for complete pricing details.
Melhores Práticas
Solução de Problemas
Entidade não detectada?
- Certifique-se de que o tipo de entidade está habilitado em sua seleção
- Tente diminuir o limite de confiança
- Verifique se o idioma correto está selecionado
- Verifique se o formato do texto corresponde aos padrões esperados
Muitos falsos positivos?
- Aumente o limite de confiança
- Desmarque tipos de entidades amplos como LOCALIZAÇÃO
- Use predefinições específicas de entidade em vez de selecionar todas
Análise demorando muito?
- Divida textos grandes em partes menores
- Reduza o número de tipos de entidades selecionados
- Use predefinições para evitar carregar modelos de detecção não utilizados
Next Steps
Última Atualização: Março de 2026