Как работает anonymize.today

Детерминированное обнаружение PII на основе регулярных выражений, которое дает 100% воспроизводимые результаты. Один и тот же ввод, один и тот же вывод — каждый раз. Без ИИ, без догадок, только прозрачное сопоставление шаблонов.

Почему регулярные выражения, а не ИИ?

Наш подход

  • 100% воспроизводимые результаты
  • Полная возможность аудита для соблюдения требований
  • Не требуется обучающих данных
  • Прозрачное принятие решений
  • Быстрая, предсказуемая производительность
  • Отсутствие дрейфа модели со временем

Подходы ИИ/МЛ

  • Результаты варьируются между запусками
  • Черный ящик в принятии решений
  • Требуются обучающие данные
  • Сложно провести аудит
  • Высокие вычислительные затраты
  • Дрейф модели со временем

10-шаговый процесс

От ввода до вывода, вот что происходит с вашим документом

1

Ввод текста

Отправьте ваш документ через веб-интерфейс, API или надстройку Word

2

Обнаружение языка

Система определяет язык документа для оптимальной обработки

3

Токенизация

Текст разбивается на токены для сопоставления шаблонов

4

Сопоставление шаблонов

Шаблоны регулярных выражений сканируют 256 типов сущностей

5

Анализ контекста

Окружающий текст улучшает точность обнаружения

6

Оценка уверенности

Каждое обнаружение получает оценку уверенности

7

Классификация сущностей

Обнаруженные элементы классифицируются по типу

8

Просмотр результатов

Смотрите все обнаружения с позициями и оценками

9

Применить анонимизацию

Выберите ваш метод: Замена, Удаление, Хеширование, Шифрование или Маскировка

10

Выходной документ

Скачайте ваш анонимизированный документ

Часто задаваемые вопросы

Почему anonymize.today использует regex вместо ИИ для обнаружения PII?
Обнаружение на основе regex дает 100% воспроизводимые результаты — один и тот же ввод всегда дает один и тот же вывод. Модели ИИ и машинного обучения могут давать разные результаты при разных запусках, страдать от смещения модели со временем и работать как черные ящики, которые трудно проверять. Для соблюдения нормативных требований в соответствии с GDPR и ISO 27001 организациям нужны объяснимые, повторяемые процессы, что именно и обеспечивает сопоставление шаблонов на основе regex.
Насколько точна обнаружение PII?
anonymize.today предоставляет коэффициенты уверенности от 0.0 до 1.0 для каждого обнаружения. Пользователи могут устанавливать минимальные пороги уверенности для контроля чувствительности. Сущности на основе шаблонов, такие как номера кредитных карт и SSN, достигают точности 95-99%, в то время как сущности на основе NLP, такие как имена и местоположения, достигают точности 85-95%. Платформа поддерживает 256 типов сущностей с тщательно разработанными шаблонами для каждой.
Могу ли я проверить, как anonymize.today обрабатывает мои данные?
Да, каждое обнаружение в anonymize.today показывает точный совпадающий шаблон, коэффициент уверенности и идентифицированный тип сущности. Анализатор выделяет обнаруженные сущности цветами, специфичными для категории, и позициями в тексте. Эта полная прозрачность делает объяснение решений по обнаружению аудиторам, специалистам по соблюдению норм или органам защиты данных простым.
Что происходит с моими данными во время обработки?
Текст, отправленный в anonymize.today, передается через зашифрованные соединения TLS 1.3 на сервера, сертифицированные по ISO 27001, в Германии. Текст обрабатывается в памяти с использованием Microsoft Presidio, и результаты возвращаются немедленно. Никакой пользовательский контент не сохраняется на серверах после обработки. Данные никогда не покидают Европейский Союз.
Как anonymize.today обрабатывает несколько языков в одном тексте?
anonymize.today поддерживает автоматическое определение языка для идентификации основного языка документа. Для многоязычных текстов пользователи могут создавать пользовательские пресеты, которые объединяют типы сущностей через языковые границы. Платформа поддерживает 27 языков для обнаружения PII с использованием моделей spaCy, Stanza и Transformer, что позволяет обнаруживать специфические для страны сущности, такие как немецкие налоговые номера, французские номера NIR или японские номера My Number в одном и том же документе.

Увидьте это в действии

Попробуйте наше обнаружение и анонимизацию PII бесплатно с 300 токенами в месяц.