Як працює anonymize.today

Детерміноване виявлення PII на основі регулярних виразів, яке забезпечує 100% відтворювані результати. Один і той же вхід, один і той же вихід — щоразу. Без ШІ, без здогадок, лише прозоре зіставлення шаблонів.

Чому регулярні вирази, а не ШІ?

Наш підхід

  • 100% відтворювані результати
  • Повна можливість аудиту для відповідності
  • Не потрібні навчальні дані
  • Прозоре прийняття рішень
  • Швидка, передбачувана продуктивність
  • Відсутність зміщення моделі з часом

Підходи ШІ/МЛ

  • Результати варіюються між запусками
  • Чорна скринька прийняття рішень
  • Потребує навчальних даних
  • Важко підлягає аудиту
  • Вищі витрати на обчислення
  • Зміщення моделі з часом

10-етапний процес

Від входу до виходу, ось що відбувається з вашим документом

1

Вхідний текст

Подайте ваш документ через веб-інтерфейс, API або надбудову Word

2

Виявлення мови

Система визначає мову документа для оптимальної обробки

3

Токенізація

Текст розбивається на токени для зіставлення шаблонів

4

Зіставлення шаблонів

Регулярні вирази сканують 256 типів сутностей

5

Аналіз контексту

Оточуючий текст покращує точність виявлення

6

Оцінка впевненості

Кожне виявлення отримує оцінку впевненості

7

Класифікація сутностей

Виявлені елементи класифікуються за типом

8

Перегляд результатів

Перегляньте всі виявлення з позиціями та оцінками

9

Застосувати анонімізацію

Виберіть ваш метод: Замінити, Закрити, Хешувати, Шифрувати або Замаскувати

10

Вихідний документ

Завантажте ваш анонімізований документ

Поширені запитання

Чому anonymize.today використовує regex замість AI для виявлення PII?
Виявлення на основі regex дає 100% відтворювані результати — один і той же вхід завжди дає один і той же вихід. Моделі AI та машинного навчання можуть давати різні результати між запусками, страждати від зміни моделі з часом і працювати як чорні ящики, які важко перевірити. Для дотримання нормативних вимог відповідно до GDPR та ISO 27001 організаціям потрібні зрозумілі, повторювані процеси, що саме і забезпечує виявлення на основі regex.
Наскільки точним є виявлення PII?
anonymize.today надає оцінки впевненості від 0.0 до 1.0 для кожного виявлення. Користувачі можуть встановлювати мінімальні пороги впевненості для контролю чутливості. Сутності на основі шаблонів, такі як номери кредитних карток і SSN, досягають точності 95-99%, тоді як сутності на основі NLP, такі як імена та місця, досягають точності 85-95%. Платформа підтримує 256 типів сутностей з ретельно розробленими шаблонами для кожного.
Чи можу я перевірити, як anonymize.today обробляє мої дані?
Так, кожне виявлення в anonymize.today показує точний шаблон, що відповідає, оцінку впевненості та тип сутності, що ідентифікується. Аналізатор підсвічує виявлені сутності кольорами, специфічними для категорії, та позиціями в тексті. Ця повна прозорість робить зрозумілим пояснення рішень про виявлення аудиторам, співробітникам з дотримання норм або органам захисту даних.
Що відбувається з моїми даними під час обробки?
Текст, надісланий до anonymize.today, передається через зашифровані з'єднання TLS 1.3 на сервери, сертифіковані за ISO 27001, у Німеччині. Текст обробляється в пам'яті за допомогою Microsoft Presidio, а результати повертаються негайно. Жоден вміст користувача не зберігається на серверах після обробки. Дані ніколи не покидають Європейський Союз.
Як anonymize.today обробляє кілька мов в одному тексті?
anonymize.today підтримує автоматичне виявлення мови для визначення основної мови документа. Для багатомовних текстів користувачі можуть створювати власні пресети, які поєднують типи сутностей через мовні межі. Платформа підтримує 27 мов для виявлення PII, використовуючи spaCy, Stanza та моделі Transformer, що дозволяє виявляти специфічні для країни сутності, такі як німецькі податкові ідентифікатори, французькі номери NIR або японські ідентифікатори My Number в одному документі.

Побачте це в дії

Спробуйте наше виявлення PII та анонімізацію безкоштовно з 300 токенами на місяць.