Jak działa anonymize.today

Deterministyczne wykrywanie PII oparte na regex, które zapewnia 100% powtarzalne wyniki. Ten sam input, ten sam output - za każdym razem. Bez AI, bez zgadywania, tylko przejrzyste dopasowywanie wzorców.

Dlaczego regex, a nie AI?

Nasze podejście

  • 100% powtarzalne wyniki
  • W pełni audytowalne dla zgodności
  • Brak wymaganych danych treningowych
  • Przejrzyste podejmowanie decyzji
  • Szybka, przewidywalna wydajność
  • Brak dryfu modelu w czasie

Podejścia AI/ML

  • Wyniki różnią się między uruchomieniami
  • Decyzje w czarnej skrzynce
  • Wymaga danych treningowych
  • Trudne do audytowania
  • Wyższe koszty obliczeniowe
  • Dryf modelu w czasie

Proces 10 kroków

Od wejścia do wyjścia, oto co dokładnie dzieje się z Twoim dokumentem

1

Tekst wejściowy

Prześlij swój dokument za pośrednictwem interfejsu webowego, API lub dodatku do Worda

2

Wykrywanie języka

System identyfikuje język dokumentu dla optymalnego przetwarzania

3

Tokenizacja

Tekst jest dzielony na tokeny do dopasowywania wzorców

4

Dopasowywanie wzorców

Wzorce regex skanują 256 typów encji

5

Analiza kontekstu

Otaczający tekst poprawia dokładność wykrywania

6

Ocena pewności

Każde wykrycie otrzymuje ocenę pewności

7

Klasyfikacja encji

Wykryte elementy są klasyfikowane według typu

8

Przegląd wyników

Zobacz wszystkie wykrycia z pozycjami i ocenami

9

Zastosuj anonimizację

Wybierz swoją metodę: Zastąp, Zredaguj, Haszuj, Szyfruj lub Zamaskuj

10

Dokument wyjściowy

Pobierz swój zanonimizowany dokument

Najczęściej Zadawane Pytania

Dlaczego anonymize.today używa regex zamiast AI do wykrywania PII?
Wykrywanie oparte na regex daje 100% powtarzalne wyniki — ten sam input zawsze produkuje ten sam output. Modele AI i uczenia maszynowego mogą dawać różne wyniki między uruchomieniami, cierpieć na dryf modelu w czasie i działać jako czarne skrzynki, które są trudne do audytu. Dla zgodności regulacyjnej zgodnie z GDPR i ISO 27001 organizacje potrzebują wyjaśnialnych, powtarzalnych procesów, co dokładnie dostarcza dopasowanie wzorców oparte na regex.
Jak dokładne jest wykrywanie PII?
anonymize.today dostarcza wskaźniki pewności od 0.0 do 1.0 dla każdego wykrycia. Użytkownicy mogą ustawić minimalne progi pewności, aby kontrolować czułość. Podmioty oparte na wzorcach, takie jak numery kart kredytowych i numery SSN, osiągają dokładność 95-99%, podczas gdy podmioty oparte na NLP, takie jak imiona i lokalizacje, osiągają dokładność 85-95%. Platforma obsługuje 256 typów podmiotów z starannie opracowanymi wzorcami dla każdego.
Czy mogę audytować, jak anonymize.today przetwarza moje dane?
Tak, każde wykrycie w anonymize.today pokazuje dokładny wzór, który został dopasowany, wskaźnik pewności oraz zidentyfikowany typ podmiotu. Analyzer wyróżnia wykryte podmioty kolorami specyficznymi dla kategorii i pozycjami w tekście. Ta pełna przejrzystość ułatwia wyjaśnienie decyzji dotyczących wykrycia audytorom, oficerom ds. zgodności lub organom ochrony danych.
Co się dzieje z moimi danymi podczas przetwarzania?
Tekst przesłany do anonymize.today jest wysyłany za pośrednictwem połączeń szyfrowanych TLS 1.3 do serwerów certyfikowanych zgodnie z ISO 27001 w Niemczech. Tekst jest przetwarzany w pamięci przy użyciu Microsoft Presidio, a wyniki są zwracane natychmiast. Żaden zawartość użytkownika nie jest przechowywana na serwerach po przetworzeniu. Dane nigdy nie opuszczają Unii Europejskiej.
Jak anonymize.today radzi sobie z wieloma językami w jednym tekście?
anonymize.today obsługuje automatyczne wykrywanie języka, aby zidentyfikować główny język dokumentu. Dla tekstów wielojęzycznych użytkownicy mogą tworzyć niestandardowe ustawienia, które łączą typy podmiotów w różnych językach. Platforma obsługuje 27 języków wykrywania PII, korzystając z modeli spaCy, Stanza i Transformer, umożliwiając wykrywanie podmiotów specyficznych dla kraju, takich jak niemieckie numery identyfikacji podatkowej, francuskie numery NIR czy japońskie numery My Number w tym samym dokumencie.

Zobacz to w akcji

Wypróbuj nasze wykrywanie PII i anonimizację za darmo z 300 tokenami miesięcznie.