common.skipToContent

Анонімізатор PII

Захищайте чутливі дані, зберігаючи структуру тексту

Анонімізатор PII перетворює виявлені сутності, використовуючи різні методи для захисту чутливої інформації.


Оператори анонімізації

Виберіть правильний оператор відповідно до ваших потреб:

Замінити

Замініть PII на текст-заповнювач, наприклад, [PERSON] або [EMAIL]. Зберігає читабельність тексту.

John Doe → [PERSON]

Найкраще для: Людочитний анонімізований текст

Маскувати

Частково приховати PII, наприклад, ****@email.com або John D***. Показує формат, приховуючи значення.

john@email.com → j***@email.com

Найкраще для: Збереження часткової читабельності

Редагувати

Повністю видалити PII з тексту. Найагресивніший варіант.

Contact John Doe at → Contact at

Найкраще для: Повного видалення чутливих даних

Хешувати

Перетворити PII на хеш SHA-256. Один і той же вхід завжди дає один і той же хеш, корисно для аналізу даних.

John Doe → a3f2b1c4d5...

Найкраще для: Аналізу даних при збереженні унікальності

ШифруватиВідновлювальний

Шифрувати PII за допомогою AES-256-GCM. Може бути розшифровано пізніше за допомогою вашого ключа шифрування.

John Doe → [ENC:a3f2b1c4...]

Найкраще для: Тимчасової анонімізації з можливістю відновлення в майбутньому


Порівняння Операторів

ОператорВідновлювальнийЗберігає ФорматСтабільний ВихідСценарій Використання
ReplaceНіНіТакОбмін анонімізованими документами
MaskНіЧастковаТакПідтримка клієнтів, журнали
RedactНіНіТакЮридичні документи, FOIA
HashНіНіТак*Аналіз даних, дедуплікація
EncryptТакНіНа ключТимчасова анонімізація

* Хеш забезпечує стабільний вихід для одного й того ж вхідного значення


Використання Анонімізатора

Крок 1: Спочатку Проаналізуйте

Перед анонімізацією ви повинні проаналізувати свій текст для виявлення сутностей PII. Анонімізатор працює на основі результатів аналізатора.

Крок 2: Виберіть Сутності

Перегляньте та виберіть, які виявлені сутності ви хочете анонімізувати:

  • Використовуйте прапорці для вибору/скасування вибору індивідуальних сутностей
  • Невибрані сутності залишаться незмінними у виході
  • Натискайте на значки типу сутності, щоб масово вибрати/скасувати вибір за типом

Крок 3: Виберіть Оператор

Виберіть метод анонімізації:

  • Глобальний оператор: Застосовує той же метод до всіх вибраних сутностей Applies the same method to all selected entities
  • Оператор на сутність: Встановіть різні методи для різних типів сутностей Set different methods for different entity types

Крок 4: Налаштуйте Опції

Кожен оператор має параметри конфігурації:

Опції Заміни
  • new_value - The replacement text (default: [ENTITY_TYPE])
Опції Маскування
  • masking_char - Character to use for masking (default: *)
  • chars_to_mask - Number of characters to mask
  • from_end - Mask from end instead of beginning
Опції Хешування
  • hash_type - Algorithm to use (default: sha256)
Опції Шифрування
  • Requires an encryption key configured in Settings
  • Uses AES-256-GCM encryption

Крок 5: Запустіть Анонімізацію

  1. Натисніть кнопку Анонімізації
  2. Перегляньте анонімізований вихід
  3. Скопіюйте або завантажте результат

Шифрування та Деанонімізація

Оператор Шифрування дозволяє відновлювальну анонімізацію. Ви можете відновити оригінальні значення, використовуючи той же ключ шифрування.

Налаштування Ключа Шифрування

  1. Go to Settings → Security
  2. Under "Encryption Keys," click Add Key
  3. Enter a name and your secret key (32+ characters recommended)
  4. Save the key securely - it's required for deanonymization

Безпека Ключа

Ваш ключ шифрування зберігається в зашифрованому вигляді у вашому обліковому записі. Якщо ви втратите ключ, зашифровані дані не можуть бути відновлені.

Деанонімізація Тексту

  1. Go to the Deanonymize tab
  2. Paste text containing encrypted entities (e.g., [ENC:a3f2b1c4...])
  3. Select the encryption key used during anonymization
  4. Click Deanonymize
  5. The original values are restored

Витрати Токенів

Операції анонімізації споживають токени на основі:

Cost = 1 + 0.2 × ops_count + 0.8 × encrypt_count + 0.1 × entities + 0.2 × text_k

Final = ceil(Cost × 0.5)

Where:

  • ops_count = number of anonymization operations
  • encrypt_count = number of encryption operations (higher cost)
  • entities = number of entities processed
  • text_k = text length in thousands of characters
ОпераціяТипова Вартість
Anonymize (apply only)1-5 tokens
Anonymize (full)2-15 tokens
Deanonymize1-4 tokens

Найкращі Практики

Використовуйте Заміни для документів, які будуть публічно ділитися
Використовуйте Маскування, коли потрібно зберегти часткову читабельність
Використовуйте Хешування, коли аналізуєте дані, зберігаючи унікальність сутностей
Використовуйте Шифрування лише тоді, коли потрібно відновити оригінальні значення пізніше
Зберігайте ключі шифрування в безпеці - втрата їх означає втрату доступу до зашифрованих даних
Тестуйте анонімізацію на невеликій вибірці перед обробкою великих наборів даних

Related Documentation

Останнє оновлення: березень 2026