common.skipToContent

Anonimizador de PII

Proteja dados sensíveis enquanto preserva a estrutura do texto

O Anonimizador de PII transforma entidades detectadas usando vários métodos para proteger informações sensíveis.


Operadores de Anonimização

Escolha o operador certo com base em suas necessidades:

Substituir

Substitua PII por texto de espaço reservado como [PESSOA] ou [EMAIL]. Mantém a legibilidade do texto.

John Doe → [PERSON]

Melhor para: Texto anonimizado legível por humanos

Mascarar

Oculte parcialmente PII como ****@email.com ou John D***. Mostra o formato enquanto oculta os valores.

john@email.com → j***@email.com

Melhor para: Manter legibilidade parcial

Redigir

Remova completamente PII do texto. Opção mais agressiva.

Contact John Doe at → Contact at

Melhor para: Remoção completa de dados sensíveis

Hash

Converta PII em hash SHA-256. A mesma entrada sempre produz o mesmo hash, útil para análise de dados.

John Doe → a3f2b1c4d5...

Melhor para: Análise de dados enquanto preserva a singularidade

CriptografarReversível

Criptografe PII com AES-256-GCM. Pode ser descriptografado mais tarde com sua chave de criptografia.

John Doe → [ENC:a3f2b1c4...]

Melhor para: Anonimização temporária com restauração futura


Comparação de Operadores

OperadorReversívelPreserva FormatoSaída ConsistenteCaso de Uso
ReplaceNãoNãoSimCompartilhando documentos anonimizados
MaskNãoParcialSimSuporte ao cliente, logs
RedactNãoNãoSimDocumentos legais, FOIA
HashNãoNãoSim*Análise de dados, deduplicação
EncryptSimNãoPor chaveAnonimização temporária

* Hash produz saída consistente para o mesmo valor de entrada


Usando o Anonimizador

Passo 1: Analise Primeiro

Antes de anonimizar, você deve analisar seu texto para detectar entidades PII. O anonimizador funciona com os resultados do analisador.

Passo 2: Selecione Entidades

Revise e selecione quais entidades detectadas você deseja anonimizar:

  • Use caixas de seleção para selecionar/deselecionar entidades individuais
  • Entidades não selecionadas permanecerão inalteradas na saída
  • Clique em distintivos de tipo de entidade para selecionar/deselecionar em massa por tipo

Passo 3: Escolha o Operador

Selecione o método de anonimização:

  • Operador global: Aplica o mesmo método a todas as entidades selecionadas Applies the same method to all selected entities
  • Operador por entidade: Defina métodos diferentes para diferentes tipos de entidades Set different methods for different entity types

Passo 4: Configure Opções

Cada operador tem opções de configuração:

Opções de Substituição
  • new_value - The replacement text (default: [ENTITY_TYPE])
Opções de Máscara
  • masking_char - Character to use for masking (default: *)
  • chars_to_mask - Number of characters to mask
  • from_end - Mask from end instead of beginning
Opções de Hash
  • hash_type - Algorithm to use (default: sha256)
Opções de Criptografia
  • Requires an encryption key configured in Settings
  • Uses AES-256-GCM encryption

Passo 5: Execute a Anonimização

  1. Clique no botão Anonimizar
  2. Revise a saída anonimizada
  3. Copie ou baixe o resultado

Criptografia & Desanonimização

O operador Criptografar permite anonimização reversível. Você pode restaurar valores originais usando a mesma chave de criptografia.

Configurando uma Chave de Criptografia

  1. Go to Settings → Security
  2. Under "Encryption Keys," click Add Key
  3. Enter a name and your secret key (32+ characters recommended)
  4. Save the key securely - it's required for deanonymization

Segurança da Chave

Sua chave de criptografia é armazenada criptografada em sua conta. Se você perder a chave, os dados criptografados não podem ser recuperados.

Desanonimizando Texto

  1. Go to the Deanonymize tab
  2. Paste text containing encrypted entities (e.g., [ENC:a3f2b1c4...])
  3. Select the encryption key used during anonymization
  4. Click Deanonymize
  5. The original values are restored

Custos de Tokens

Operações de anonimização consomem tokens com base em:

Cost = 1 + 0.2 × ops_count + 0.8 × encrypt_count + 0.1 × entities + 0.2 × text_k

Final = ceil(Cost × 0.5)

Where:

  • ops_count = number of anonymization operations
  • encrypt_count = number of encryption operations (higher cost)
  • entities = number of entities processed
  • text_k = text length in thousands of characters
OperaçãoCusto Típico
Anonymize (apply only)1-5 tokens
Anonymize (full)2-15 tokens
Deanonymize1-4 tokens

Melhores Práticas

Use Substituir para documentos que serão compartilhados publicamente
Use Máscara quando precisar manter legibilidade parcial
Use Hash ao analisar dados enquanto preserva a singularidade da entidade
Use Criptografar apenas quando precisar restaurar valores originais depois
Armazene chaves de criptografia com segurança - perdê-las significa perder acesso aos dados criptografados
Teste a anonimização em uma pequena amostra antes de processar grandes conjuntos de dados

Related Documentation

Última Atualização: Março de 2026