common.skipToContent

Анонимизатор PII

Защита конфиденциальных данных при сохранении структуры текста

Анонимизатор PII преобразует обнаруженные сущности с помощью различных методов для защиты конфиденциальной информации.


Операторы анонимизации

Выберите правильный оператор в зависимости от ваших потребностей:

Замена

Заменить PII на текст-заполнитель, такой как [PERSON] или [EMAIL]. Сохраняет читаемость текста.

John Doe → [PERSON]

Лучше всего для: Читаемого анонимизированного текста

Маскировка

Частично скрыть PII, например ****@email.com или John D***. Показывает формат, скрывая значения.

john@email.com → j***@email.com

Лучше всего для: Поддержания частичной читаемости

Редактирование

Полностью удалить PII из текста. Самый агрессивный вариант.

Contact John Doe at → Contact at

Лучше всего для: Полного удаления конфиденциальных данных

Хеширование

Преобразовать PII в хеш SHA-256. Один и тот же ввод всегда дает один и тот же хеш, полезно для анализа данных.

John Doe → a3f2b1c4d5...

Лучше всего для: Анализа данных при сохранении уникальности

ШифрованиеОбратимый

Зашифровать PII с помощью AES-256-GCM. Может быть расшифрован позже с вашим ключом шифрования.

John Doe → [ENC:a3f2b1c4...]

Лучше всего для: Временной анонимизации с возможностью восстановления в будущем


Сравнение операторов

ОператорОбратимыйСохраняет форматПоследовательный выводСлучай использования
ReplaceНетНетДаОбмен анонимизированными документами
MaskНетЧастичнаяДаПоддержка клиентов, журналы
RedactНетНетДаЮридические документы, FOIA
HashНетНетДа*Анализ данных, дедупликация
EncryptДаНетПо ключуВременная анонимизация

* Хэш обеспечивает последовательный вывод для одного и того же входного значения


Использование Анонимизатора

Шаг 1: Сначала проанализируйте

Перед анонимизацией вы должны проанализировать ваш текст, чтобы обнаружить сущности PII. Анонимизатор работает на результатах анализа.

Шаг 2: Выберите сущности

Просмотрите и выберите, какие обнаруженные сущности вы хотите анонимизировать:

  • Используйте флажки, чтобы выбрать/снять выбор с отдельных сущностей
  • Не выбранные сущности останутся без изменений в выходных данных
  • Нажмите на значки типов сущностей, чтобы массово выбрать/снять выбор по типу

Шаг 3: Выберите оператор

Выберите метод анонимизации:

  • Глобальный оператор: Применяет один и тот же метод ко всем выбранным сущностям Applies the same method to all selected entities
  • Оператор по сущности: Установите разные методы для разных типов сущностей Set different methods for different entity types

Шаг 4: Настройте параметры

Каждый оператор имеет параметры конфигурации:

Параметры замены
  • new_value - The replacement text (default: [ENTITY_TYPE])
Параметры маскирования
  • masking_char - Character to use for masking (default: *)
  • chars_to_mask - Number of characters to mask
  • from_end - Mask from end instead of beginning
Параметры хеширования
  • hash_type - Algorithm to use (default: sha256)
Параметры шифрования
  • Requires an encryption key configured in Settings
  • Uses AES-256-GCM encryption

Шаг 5: Запустите анонимизацию

  1. Нажмите кнопку Анонимизировать
  2. Просмотрите анонимизированный результат
  3. Скопируйте или загрузите результат

Шифрование и деанонимизация

Оператор Шифрования позволяет обратимую анонимизацию. Вы можете восстановить оригинальные значения, используя тот же ключ шифрования.

Настройка ключа шифрования

  1. Go to Settings → Security
  2. Under "Encryption Keys," click Add Key
  3. Enter a name and your secret key (32+ characters recommended)
  4. Save the key securely - it's required for deanonymization

Безопасность ключа

Ваш ключ шифрования хранится в зашифрованном виде в вашем аккаунте. Если вы потеряете ключ, зашифрованные данные не могут быть восстановлены.

Деанонимизация текста

  1. Go to the Deanonymize tab
  2. Paste text containing encrypted entities (e.g., [ENC:a3f2b1c4...])
  3. Select the encryption key used during anonymization
  4. Click Deanonymize
  5. The original values are restored

Стоимость токенов

Операции анонимизации потребляют токены на основе:

Cost = 1 + 0.2 × ops_count + 0.8 × encrypt_count + 0.1 × entities + 0.2 × text_k

Final = ceil(Cost × 0.5)

Where:

  • ops_count = number of anonymization operations
  • encrypt_count = number of encryption operations (higher cost)
  • entities = number of entities processed
  • text_k = text length in thousands of characters
ОперацияТипичная стоимость
Anonymize (apply only)1-5 tokens
Anonymize (full)2-15 tokens
Deanonymize1-4 tokens

Лучшие практики

Используйте Замену для документов, которые будут публично доступны
Используйте Маски, когда нужно сохранить частичную читаемость
Используйте Хеш, когда анализируете данные, сохраняя уникальность сущностей
Используйте Шифрование только тогда, когда нужно восстановить оригинальные значения позже
Храните ключи шифрования в безопасности - потеря их означает потерю доступа к зашифрованным данным
Тестируйте анонимизацию на небольшой выборке перед обработкой больших наборов данных

Related Documentation

Последнее обновление: Март 2026