Kaip veikia anonymize.today

Deterministinis, regex pagrindu veikiantis PII aptikimas, kuris suteikia 100% atkuriamus rezultatus. Tas pats įvestis, tas pats išvestis — kiekvieną kartą. Jokių AI, jokių spėjimų, tik skaidrus modelių atitikimas.

Kodėl Regex, o ne AI?

Mūsų požiūris

  • 100% atkuriami rezultatai
  • Visiškai audituojama atitikties užtikrinimui
  • Nereikia mokymo duomenų
  • Skaidrus sprendimų priėmimas
  • Greitas, prognozuojamas našumas
  • Nėra modelių nukrypimo laikui bėgant

AI/ML požiūriai

  • Rezultatai skiriasi tarp bandymų
  • Juodoji dėžė sprendimų priėmimui
  • Reikalingi mokymo duomenys
  • Sunku audituoti
  • Didesnės skaičiavimo sąnaudos
  • Modelių nukrypimas laikui bėgant

10 žingsnių procesas

Nuo įvesties iki išvesties, štai kas vyksta su jūsų dokumentu

1

Įvesties tekstas

Pateikite savo dokumentą per internetinę sąsają, API arba Word papildinį

2

Kalbos aptikimas

Sistema nustato dokumento kalbą optimaliam apdorojimui

3

Tokenizacija

Tekstas padalijamas į tokenus modelių atitikimui

4

Modelių atitikimas

Regex modeliai tikrina 256 subjektų tipus

5

Konteksto analizė

Aplinkinis tekstas pagerina aptikimo tikslumą

6

Pasitikėjimo balai

Kiekvienas aptikimas gauna pasitikėjimo balą

7

Subjektų klasifikacija

Aptikti elementai klasifikuojami pagal tipą

8

Peržiūrėti rezultatus

Peržiūrėkite visus aptikimus su pozicijomis ir balais

9

Taikyti anonimizavimą

Pasirinkite savo metodą: Pakeisti, Redaguoti, Hash, Šifruoti arba Maskuoti

10

Išvesties dokumentas

Atsisiųskite savo anonimizuotą dokumentą

Dažnai užduodami klausimai

Kodėl anonymize.today naudoja regex vietoj AI PII atpažinimui?
Regex pagrindu atliekamas atpažinimas suteikia 100% pakartojamus rezultatus — tas pats įvestis visada suteikia tą patį išvestį. AI ir mašininio mokymosi modeliai gali duoti skirtingus rezultatus tarp bandymų, laikui bėgant patirti modelių nuokrypį ir veikti kaip juodosios dėžės, kurias sunku audituoti. Norint užtikrinti atitiktį GDPR ir ISO 27001, organizacijoms reikia paaiškinamų, pakartojamų procesų, ką tiksliai suteikia regex pagrindu atliekamas modelių atpažinimas.
Kiek tikslus yra PII atpažinimas?
anonymize.today suteikia pasitikėjimo balus nuo 0.0 iki 1.0 kiekvienam atpažinimui. Vartotojai gali nustatyti minimalius pasitikėjimo slenksčius, kad kontroliuotų jautrumą. Modelių pagrindu atliekami subjektai, tokie kaip kreditinių kortelių numeriai ir SSN, pasiekia 95-99% tikslumą, o NLP pagrindu atliekami subjektai, tokie kaip vardai ir vietovės, pasiekia 85-95% tikslumą. Platforma palaiko 256 subjektų tipus su kruopščiai parengtais modeliais kiekvienam.
Ar galiu audituoti, kaip anonymize.today apdoroja mano duomenis?
Taip, kiekvienas atpažinimas anonymize.today rodo tikslų atitikimo modelį, pasitikėjimo balą ir identifikuotą subjekto tipą. Analizatorius išryškina atpažintus subjektus su kategorijai specifinėmis spalvomis ir pozicijomis tekste. Ši visiška skaidrumas leidžia lengvai paaiškinti atpažinimo sprendimus auditoriams, atitikties pareigūnams ar duomenų apsaugos institucijoms.
Kas nutinka mano duomenims apdorojimo metu?
Tekstas, pateiktas anonymize.today, siunčiamas per TLS 1.3 šifruotas jungtis į ISO 27001 sertifikuotus serverius Vokietijoje. Tekstas apdorojamas atmintyje naudojant Microsoft Presidio, o rezultatai grąžinami iš karto. Jokių vartotojo turinio serveriuose po apdorojimo nesaugoma. Duomenys niekada nepalieka Europos Sąjungos.
Kaip anonymize.today tvarko kelias kalbas viename tekste?
anonymize.today palaiko automatinį kalbos atpažinimą, kad nustatytų dokumento pagrindinę kalbą. Daugialypiuose tekstuose vartotojai gali kurti pasirinktinius nustatymus, kurie sujungia subjektų tipus per kalbų ribas. Platforma palaiko 27 PII atpažinimo kalbas, naudodama spaCy, Stanza ir Transformer modelius, leidžiančius atpažinti šaliai specifinius subjektus, tokius kaip Vokietijos mokesčių ID, Prancūzijos NIR numeriai ar Japonijos My Number ID toje pačioje dokumente.

Pamatykite tai veikiant

Išbandykite mūsų PII aptikimą ir anonimizavimą nemokamai su 300 tokenų per mėnesį.