Como Funciona a anonymize.today

Detecção de PII determinística e baseada em regex que oferece resultados 100% reproduzíveis. Mesmo input, mesmo output—todas as vezes. Sem IA, sem adivinhações, apenas correspondência de padrões transparente.

Por Que Regex, Não IA?

Nossa Abordagem

  • Resultados 100% reproduzíveis
  • Totalmente auditável para conformidade
  • Nenhum dado de treinamento necessário
  • Decisões transparentes
  • Desempenho rápido e previsível
  • Sem deriva de modelo ao longo do tempo

Abordagens de IA/ML

  • Resultados variam entre execuções
  • Decisões em caixa-preta
  • Requer dados de treinamento
  • Difícil de auditar
  • Custos computacionais mais altos
  • Deriva de modelo ao longo do tempo

O Processo em 10 Etapas

Do input ao output, aqui está exatamente o que acontece com seu documento

1

Texto de Entrada

Envie seu documento via interface web, API ou complemento do Word

2

Detecção de Idioma

O sistema identifica o idioma do documento para processamento ideal

3

Tokenização

O texto é dividido em tokens para correspondência de padrões

4

Correspondência de Padrões

Padrões regex escaneiam 256 tipos de entidades

5

Análise de Contexto

Texto circundante melhora a precisão da detecção

6

Pontuação de Confiança

Cada detecção recebe uma pontuação de confiança

7

Classificação de Entidades

Itens detectados são categorizados por tipo

8

Revisar Resultados

Veja todas as detecções com posições e pontuações

9

Aplicar Anonimização

Escolha seu método: Substituir, Redigir, Hash, Criptografar ou Mascarar

10

Documento de Saída

Baixe seu documento anonimizado

Perguntas Frequentes

Por que o anonymize.today usa regex em vez de IA para a detecção de PII?
A detecção baseada em regex oferece resultados 100% reproduzíveis — a mesma entrada sempre produz a mesma saída. Modelos de IA e aprendizado de máquina podem produzir resultados diferentes entre execuções, sofrer de desvio de modelo ao longo do tempo e operar como caixas-pretas que são difíceis de auditar. Para conformidade regulatória sob o GDPR e ISO 27001, as organizações precisam de processos explicáveis e repetíveis, que é exatamente o que a correspondência de padrões baseada em regex oferece.
Qual é a precisão da detecção de PII?
O anonymize.today fornece pontuações de confiança de 0,0 a 1,0 para cada detecção. Os usuários podem definir limiares de confiança mínimos para controlar a sensibilidade. Entidades baseadas em padrões, como números de cartões de crédito e SSNs, alcançam 95-99% de precisão, enquanto entidades baseadas em NLP, como nomes e locais, alcançam 85-95% de precisão. A plataforma suporta 256 tipos de entidades com padrões cuidadosamente elaborados para cada um.
Posso auditar como o anonymize.today processa meus dados?
Sim, cada detecção no anonymize.today mostra o padrão exato correspondido, a pontuação de confiança e o tipo de entidade identificada. O Analyzer destaca as entidades detectadas com cores específicas de categoria e posições dentro do texto. Essa total transparência torna fácil explicar as decisões de detecção a auditores, oficiais de conformidade ou autoridades de proteção de dados.
O que acontece com meus dados durante o processamento?
O texto enviado ao anonymize.today é enviado por meio de conexões criptografadas TLS 1.3 para servidores certificados ISO 27001 na Alemanha. O texto é processado na memória usando Microsoft Presidio, e os resultados são retornados imediatamente. Nenhum conteúdo do usuário é armazenado nos servidores após o processamento. Os dados nunca saem da União Europeia.
Como o anonymize.today lida com múltiplas línguas em um único texto?
O anonymize.today suporta detecção automática de idiomas para identificar o idioma principal de um documento. Para textos multilíngues, os usuários podem criar predefinições personalizadas que combinam tipos de entidades através das fronteiras linguísticas. A plataforma suporta 27 idiomas de detecção de PII usando spaCy, Stanza e modelos Transformer, permitindo a detecção de entidades específicas de países, como IDs fiscais alemães, números NIR franceses ou IDs My Number japoneses dentro do mesmo documento.

Veja em Ação

Experimente nossa detecção de PII e anonimização gratuitamente com 300 tokens por mês.