Како функционира anonymize.today

Детерминистичка, регекс-базирана PII детекција која дава 100% репродуктивни резултати. Исти влез, ист излез—секој пат. Без вештачка интелигенција, без претпоставки, само транспарентно совпаѓање на образци.

Зошто Регекс, а не Вештачка Интелигенција?

Нашиот Пристап

  • 100% репродуктивни резултати
  • Целосно проверливи за усогласеност
  • Не се потребни податоци за обука
  • Транспарентно донесување одлуки
  • Брза, предвидлива перформанса
  • Нема одминување на моделот со текот на времето

Пристапи на Вештачка Интелигенција/Машинско Учење

  • Резултатите варираат помеѓу извршувањата
  • Црна кутија за донесување одлуки
  • Потребни се податоци за обука
  • Тешко за проверка
  • Поголеми трошоци за пресметка
  • Одминување на моделот со текот на времето

Процес од 10 чекори

Од влез до излез, еве што точно се случува со вашиот документ

1

Влезен Текст

Испратете го вашиот документ преку веб интерфејс, API или Word додаток

2

Детекција на Јазик

Системот го идентификува јазикот на документот за оптимално обработување

3

Токенизација

Текстот се дели на токени за совпаѓање на образци

4

Совпаѓање на Образци

Регекс образците скенираат за 256 типови ентитети

5

Анализа на Контекст

Околниот текст ја подобрува точноста на детекцијата

6

Оценка на Доверба

Секоја детекција добива оценка на доверба

7

Класификација на Ентитети

Детектираните предмети се категоризираат по тип

8

Преглед на Резултати

Видете ги сите детекции со позиции и оценки

9

Примени Анонимизација

Изберете ја вашата метода: Замени, Црни, Хаширај, Шифрирај или Маскирај

10

Излезен Документ

Преземете го вашиот анонимен документ

Често Поставувани Прашања

Зошто anonymize.today користи regex наместо AI за детекција на PII?
Детекцијата базирана на regex дава 100% репродуктивни резултати — истиот влез секогаш произведува ист излез. AI и моделите на машинско учење можат да произведат различни резултати помеѓу извршувањата, страдаат од поместување на моделот со текот на времето и функционираат како црни кутии кои се тешки за ревизија. За регулаторна усогласеност под GDPR и ISO 27001, организациите треба објаснувачи, повторливи процеси, што е токму она што детекцијата базирана на шаблони со regex го обезбедува.
Колку е точна детекцијата на PII?
anonymize.today обезбедува оценки на доверба од 0.0 до 1.0 за секоја детекција. Корисниците можат да постават минимални прагови на доверба за контрола на чувствителноста. Субјекти базирани на шаблони како што се броеви на кредитни картички и SSN достигнуваат точност од 95-99%, додека субјекти базирани на NLP како што се имиња и локации достигнуваат точност од 85-95%. Платформата поддржува 256 типови на субјекти со внимателно изработени шаблони за секој.
Можам ли да ревидирам како anonymize.today ги обработува моите податоци?
Да, секоја детекција во anonymize.today покажува токму кој шаблон е совпаѓан, оценката на доверба и типот на субјектот идентификуван. Анализаторот ги истакнува детектираните субјекти со бои специфични за категоријата и позиции во текстот. Оваа целосна транспарентност го прави едноставно да се објаснат одлуките за детекција на ревизори, службеници за усогласеност или органи за заштита на податоци.
Што се случува со моите податоци за време на обработката?
Текстот поднесен на anonymize.today се испраќа преку TLS 1.3 шифрирани врски до сервери сертифицирани со ISO 27001 во Германија. Текстот се обработува во меморија користејќи Microsoft Presidio, и резултатите се враќаат веднаш. Никаков кориснички содржин не се чува на серверите по обработката. Податоците никогаш не ја напуштаат Европската Унија.
Како anonymize.today се справува со повеќе јазици во еден текст?
anonymize.today поддржува автоматска детекција на јазикот за идентификување на примарниот јазик на документот. За текстови на повеќе јазици, корисниците можат да создадат прилагодливи претпоставки кои комбинираат типови на субјекти преку јазични граници. Платформата поддржува 27 јазици за детекција на PII користејќи spaCy, Stanza и Transformer модели, овозможувајќи детекција на специфични за земјата субјекти како германски даночни ID, француски NIR броеви или јапонски My Number ID во истиот документ.

Видете го во Акција

Пробајте ја нашата PII детекција и анонимизација бесплатно со 300 токени месечно.