common.skipToContent

Anonimizator PII

Chroń wrażliwe dane, zachowując strukturę tekstu

Anonimizator PII przekształca wykryte encje za pomocą różnych metod, aby chronić wrażliwe informacje.


Operatory anonimizacji

Wybierz odpowiedni operator w zależności od swoich potrzeb:

Zamień

Zamień PII na tekst zastępczy, taki jak [OSOBA] lub [EMAIL]. Zachowuje czytelność tekstu.

John Doe → [PERSON]

Najlepsze dla: Czytelnego tekstu zanonimizowanego

Zamaskuj

Częściowo ukryj PII, takie jak ****@email.com lub John D***. Pokazuje format, ukrywając wartości.

john@email.com → j***@email.com

Najlepsze dla: Utrzymania częściowej czytelności

Zredaguj

Całkowicie usuń PII z tekstu. Najbardziej agresywna opcja.

Contact John Doe at → Contact at

Najlepsze dla: Całkowitego usunięcia danych wrażliwych

Zhashuj

Przekształć PII w hash SHA-256. Ten sam input zawsze produkuje ten sam hash, przydatny do analizy danych.

John Doe → a3f2b1c4d5...

Najlepsze dla: Analizy danych przy zachowaniu unikalności

SzyfrujOdwrotny

Szyfruj PII za pomocą AES-256-GCM. Może być odszyfrowany później za pomocą klucza szyfrującego.

John Doe → [ENC:a3f2b1c4...]

Najlepsze dla: Tymczasowej anonimizacji z możliwością przyszłej przywrócenia


Porównanie operatorów

OperatorOdwrotnyZachowuje formatSpójny wynikPrzykład użycia
ReplaceNieNieTakUdostępnianie zanonimizowanych dokumentów
MaskNieCzęściowaTakWsparcie klienta, logi
RedactNieNieTakDokumenty prawne, FOIA
HashNieNieTak*Analiza danych, deduplikacja
EncryptTakNieNa kluczTymczasowa anonimizacja

* Hash produkuje spójny wynik dla tej samej wartości wejściowej


Używanie Anonimizatora

Krok 1: Najpierw analiza

Przed anonimizacją musisz przeanalizować swój tekst, aby wykryć byty PII. Anonimizator działa na wynikach z analizatora.

Krok 2: Wybierz byty

Przejrzyj i wybierz, które wykryte byty chcesz zanonimizować:

  • Użyj pól wyboru, aby zaznaczyć/odznaczyć poszczególne byty
  • Nie zaznaczone byty pozostaną niezmienione w wyniku
  • Kliknij odznaki typów bytów, aby zbiorowo zaznaczyć/odznaczyć według typu

Krok 3: Wybierz operatora

Wybierz metodę anonimizacji:

  • Operator globalny: Zastosowuje tę samą metodę do wszystkich wybranych bytów Applies the same method to all selected entities
  • Operator per-entity: Ustaw różne metody dla różnych typów bytów Set different methods for different entity types

Krok 4: Skonfiguruj opcje

Każdy operator ma opcje konfiguracyjne:

Opcje zastępowania
  • new_value - The replacement text (default: [ENTITY_TYPE])
Opcje maskowania
  • masking_char - Character to use for masking (default: *)
  • chars_to_mask - Number of characters to mask
  • from_end - Mask from end instead of beginning
Opcje haszowania
  • hash_type - Algorithm to use (default: sha256)
Opcje szyfrowania
  • Requires an encryption key configured in Settings
  • Uses AES-256-GCM encryption

Krok 5: Uruchom anonimizację

  1. Kliknij przycisk Anonimizuj
  2. Przejrzyj zanonimizowany wynik
  3. Skopiuj lub pobierz wynik

Szyfrowanie i deanonimizacja

Operator Szyfruj umożliwia odwrotną anonimizację. Możesz przywrócić oryginalne wartości, używając tego samego klucza szyfrowania.

Ustawienie klucza szyfrowania

  1. Go to Settings → Security
  2. Under "Encryption Keys," click Add Key
  3. Enter a name and your secret key (32+ characters recommended)
  4. Save the key securely - it's required for deanonymization

Bezpieczeństwo klucza

Twój klucz szyfrowania jest przechowywany w formie zaszyfrowanej w Twoim koncie. Jeśli zgubisz klucz, zaszyfrowane dane nie mogą być odzyskane.

Deanonimizacja tekstu

  1. Go to the Deanonymize tab
  2. Paste text containing encrypted entities (e.g., [ENC:a3f2b1c4...])
  3. Select the encryption key used during anonymization
  4. Click Deanonymize
  5. The original values are restored

Koszty tokenów

Operacje anonimizacji konsumują tokeny w oparciu o:

Cost = 1 + 0.2 × ops_count + 0.8 × encrypt_count + 0.1 × entities + 0.2 × text_k

Final = ceil(Cost × 0.5)

Where:

  • ops_count = number of anonymization operations
  • encrypt_count = number of encryption operations (higher cost)
  • entities = number of entities processed
  • text_k = text length in thousands of characters
OperacjaTypowy koszt
Anonymize (apply only)1-5 tokens
Anonymize (full)2-15 tokens
Deanonymize1-4 tokens

Najlepsze praktyki

Użyj Zastąp dla dokumentów, które będą udostępniane publicznie
Użyj Maskuj, gdy musisz utrzymać częściową czytelność
Użyj Haszuj, gdy analizujesz dane, zachowując unikalność bytów
Użyj Szyfruj tylko wtedy, gdy musisz później przywrócić oryginalne wartości
Przechowuj klucze szyfrowania w bezpiecznym miejscu - ich utrata oznacza utratę dostępu do zaszyfrowanych danych
Przetestuj anonimizację na małej próbce przed przetwarzaniem dużych zbiorów danych

Related Documentation

Ostatnia aktualizacja: marzec 2026