Анонимизатор PII
Защита конфиденциальных данных при сохранении структуры текста
Анонимизатор PII преобразует обнаруженные сущности с помощью различных методов для защиты конфиденциальной информации.
Операторы анонимизации
Выберите правильный оператор в зависимости от ваших потребностей:
Замена
Заменить PII на текст-заполнитель, такой как [PERSON] или [EMAIL]. Сохраняет читаемость текста.
Лучше всего для: Читаемого анонимизированного текста
Маскировка
Частично скрыть PII, например ****@email.com или John D***. Показывает формат, скрывая значения.
Лучше всего для: Поддержания частичной читаемости
Редактирование
Полностью удалить PII из текста. Самый агрессивный вариант.
Лучше всего для: Полного удаления конфиденциальных данных
Хеширование
Преобразовать PII в хеш SHA-256. Один и тот же ввод всегда дает один и тот же хеш, полезно для анализа данных.
Лучше всего для: Анализа данных при сохранении уникальности
ШифрованиеОбратимый
Зашифровать PII с помощью AES-256-GCM. Может быть расшифрован позже с вашим ключом шифрования.
Лучше всего для: Временной анонимизации с возможностью восстановления в будущем
Сравнение операторов
| Оператор | Обратимый | Сохраняет формат | Последовательный вывод | Случай использования |
|---|---|---|---|---|
| Replace | Нет | Нет | Да | Обмен анонимизированными документами |
| Mask | Нет | Частичная | Да | Поддержка клиентов, журналы |
| Redact | Нет | Нет | Да | Юридические документы, FOIA |
| Hash | Нет | Нет | Да* | Анализ данных, дедупликация |
| Encrypt | Да | Нет | По ключу | Временная анонимизация |
* Хэш обеспечивает последовательный вывод для одного и того же входного значения
Использование Анонимизатора
Шаг 1: Сначала проанализируйте
Перед анонимизацией вы должны проанализировать ваш текст, чтобы обнаружить сущности PII. Анонимизатор работает на результатах анализа.
Шаг 2: Выберите сущности
Просмотрите и выберите, какие обнаруженные сущности вы хотите анонимизировать:
- Используйте флажки, чтобы выбрать/снять выбор с отдельных сущностей
- Не выбранные сущности останутся без изменений в выходных данных
- Нажмите на значки типов сущностей, чтобы массово выбрать/снять выбор по типу
Шаг 3: Выберите оператор
Выберите метод анонимизации:
- Глобальный оператор: Применяет один и тот же метод ко всем выбранным сущностям Applies the same method to all selected entities
- Оператор по сущности: Установите разные методы для разных типов сущностей Set different methods for different entity types
Шаг 4: Настройте параметры
Каждый оператор имеет параметры конфигурации:
Параметры замены
new_value- The replacement text (default:[ENTITY_TYPE])
Параметры маскирования
masking_char- Character to use for masking (default:*)chars_to_mask- Number of characters to maskfrom_end- Mask from end instead of beginning
Параметры хеширования
hash_type- Algorithm to use (default:sha256)
Параметры шифрования
- Requires an encryption key configured in Settings
- Uses AES-256-GCM encryption
Шаг 5: Запустите анонимизацию
- Нажмите кнопку Анонимизировать
- Просмотрите анонимизированный результат
- Скопируйте или загрузите результат
Шифрование и деанонимизация
Оператор Шифрования позволяет обратимую анонимизацию. Вы можете восстановить оригинальные значения, используя тот же ключ шифрования.
Настройка ключа шифрования
- Go to Settings → Security
- Under "Encryption Keys," click Add Key
- Enter a name and your secret key (32+ characters recommended)
- Save the key securely - it's required for deanonymization
Безопасность ключа
Ваш ключ шифрования хранится в зашифрованном виде в вашем аккаунте. Если вы потеряете ключ, зашифрованные данные не могут быть восстановлены.
Деанонимизация текста
- Go to the Deanonymize tab
- Paste text containing encrypted entities (e.g.,
[ENC:a3f2b1c4...]) - Select the encryption key used during anonymization
- Click Deanonymize
- The original values are restored
Стоимость токенов
Операции анонимизации потребляют токены на основе:
Cost = 1 + 0.2 × ops_count + 0.8 × encrypt_count + 0.1 × entities + 0.2 × text_k
Final = ceil(Cost × 0.5)
Where:
ops_count= number of anonymization operationsencrypt_count= number of encryption operations (higher cost)entities= number of entities processedtext_k= text length in thousands of characters
| Операция | Типичная стоимость |
|---|---|
| Anonymize (apply only) | 1-5 tokens |
| Anonymize (full) | 2-15 tokens |
| Deanonymize | 1-4 tokens |
Лучшие практики
Related Documentation
Последнее обновление: Март 2026