common.skipToContent

Analisador de PII

Detecte informações pessoalmente identificáveis em seu texto

O Analisador de PII escaneia seu texto e identifica informações sensíveis como nomes, e-mails, números de telefone, endereços e mais.


Como Funciona

O Analisador utiliza múltiplos métodos de detecção para identificar PII:

Correspondência de Padrões

Expressões regulares detectam dados estruturados como endereços de e-mail, números de telefone, cartões de crédito e IBANs com alta precisão.

Aprendizado de Máquina (NER)

Modelos de Reconhecimento de Entidades Nomeadas identificam entidades dependentes de contexto, como nomes de pessoas, organizações e locais, usando spaCy, Stanza e Transformers.

Validação de Checksum

Cartões de crédito, IBANs e outros identificadores financeiros são validados usando algoritmos de checksum (Luhn, MOD-97) para reduzir falsos positivos.


Usando o Analisador

Passo 1: Insira Seu Texto

  1. Navegue até a página de Anonimização
  2. Cole ou digite seu texto na área de entrada
  3. A interface mostra uma contagem de caracteres e uma estimativa de tokens

Passo 2: Selecione Tipos de Entidade

Escolha quais tipos de PII detectar:

Tipos de EntidadeSuportamos 256 tipos de entidade organizados em 10 categorias:Texto - O texto real que foi identificado como PII
Pessoal - Nomes, e-mails, números de telefone, datas de nascimentoPERSON, EMAIL_ADDRESS, PHONE_NUMBERJohn Doe, john@email.com
Financeiro - Cartões de crédito, contas bancárias, IBAN, carteiras de criptomoedasCREDIT_CARD, IBAN_CODE, SWIFT_CODE4111-1111-1111-1111
Localização - Endereços, cidades, países, coordenadasLOCATION, ADDRESS, COORDINATES123 Main St, New York
Governo - SSN, números de passaporte, carteiras de motorista, IDs nacionaisSSN, PASSPORT, DRIVER_LICENSE123-45-6789
Técnico - Endereços IP, endereços MAC, IDs de dispositivosIP_ADDRESS, MAC_ADDRESS192.168.1.1

Em vez de selecionar entidades manualmente, use Predefinições para aplicar rapidamente configurações comuns de entidades como "Conformidade com o GDPR" ou "Dados Financeiros".

Instead of selecting entities manually, use Predefinições to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Passo 3: Selecione o Idioma

Escolha o idioma do seu texto para uma precisão de detecção ideal:

  • Detecção automática - Deixe o sistema determinar o idioma - Let the system determine the language
  • Idioma específico - Selecione entre 27 idiomas suportados - Select from 27 supported languages

A Seleção de Idioma Importa

Selecionar o idioma correto melhora significativamente a precisão da detecção, especialmente para nomes de pessoas e locais.

Passo 4: Executar Análise

  1. Clique no botão Analisar
  2. Aguarde a conclusão da análise (geralmente 1-3 segundos)
  3. Revise as entidades detectadas no painel de resultados

Entendendo os Resultados

Após a análise, cada entidade detectada mostra:

PERSONJohn Doeconfiança

Posição: caracteres

Campos de Resultado

  • Tipo de Entidade - A categoria de PII detectada (PESSOA, EMAIL, etc.) - The category of PII detected (PERSON, EMAIL, etc.)
  • Texto - O texto real que foi identificado como PII - The actual text that was identified as PII
  • Pontuação de Confiança - Quão certo o sistema está (0-100%) - How certain the system is (0-100%)
  • Posição - Posições de caracteres inicial e final - Start and end character positions

Limite de Confiança

Ajuste o limite de confiança para controlar a sensibilidade:

LimiteEfeitoMelhor Para
BaixoMais entidades detectadas, mais falsos positivosCobertura máxima, revisão manual
PadrãoDetecção e precisão equilibradasUso geral
AltoMenos entidades, maior confiançaProcessamento automatizado
Muito AltoApenas correspondências com alta confiançaIntervenção mínima

Selecionando Resultados

Após a análise, você pode refinar quais entidades anonimizar:

Selecionar/Deselecionar Todos

  • Use a caixa de seleção no cabeçalho para selecionar ou desmarcar todos os resultados
  • Apenas entidades selecionadas serão anonimizadas

Seleção Individual

  • Clique nas caixas de seleção individuais para incluir/excluir entidades específicas
  • Útil quando o analisador detecta falsos positivos
  • Útil quando você deseja manter certas informações visíveis

Filtrar por Tipo

  • Clique em um distintivo de tipo de entidade para filtrar resultados por esse tipo
  • Selecione/deselecione rapidamente todas as entidades de um tipo específico

Revise os resultados antes de anonimizar. O analisador pode ocasionalmente detectar falsos positivos, especialmente para nomes que também são palavras comuns.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.


Custos de Tokens

Operações de análise consomem tokens com base em:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

  • text_k = Comprimento do Texto
  • entities_enabled = Entidades
  • entities_found = number of entities detected

Custo Típico

Comprimento do TextoEntidadesCusto Típico
100 characters3 types, 2 found2 tokens
1,000 characters5 types, 5 found3 tokens
5,000 characters10 types, 15 found6 tokens
10,000 characters15 types, 30 found10 tokens

Documentação do Sistema de Tokens Token System documentation for complete pricing details.


Melhores Práticas

Selecione apenas os tipos de entidade que você precisa - reduz custos e falsos positivos
Use predefinições específicas de idioma para melhor precisão em textos não ingleses
Revise os resultados antes de anonimizar, especialmente para nomes e locais
Use limites de confiança mais altos para processamento automatizado
Processar texto em partes razoáveis (menos de 10.000 caracteres) para melhor desempenho

Solução de Problemas

Entidade não detectada?

  • Certifique-se de que o tipo de entidade está habilitado em sua seleção
  • Tente diminuir o limite de confiança
  • Verifique se o idioma correto está selecionado
  • Verifique se o formato do texto corresponde aos padrões esperados

Muitos falsos positivos?

  • Aumente o limite de confiança
  • Desmarque tipos de entidades amplos como LOCALIZAÇÃO
  • Use predefinições específicas de entidade em vez de selecionar todas

Análise demorando muito?

  • Divida textos grandes em partes menores
  • Reduza o número de tipos de entidades selecionados
  • Use predefinições para evitar carregar modelos de detecção não utilizados

Next Steps

Última Atualização: Março de 2026