Kuinka anonymize.today toimii

Deterministinen, regex-pohjainen PII-tunnistus, joka tuottaa 100 % toistettavia tuloksia. Sama syöte, sama tulos—joka kerta. Ei AI:ta, ei arvailua, vain läpinäkyvää kaavojen vertailua.

Miksi Regex, ei AI?

Meidän lähestymistapamme

  • 100 % toistettavat tulokset
  • Täysin auditoitavissa oleva vaatimustenmukaisuus
  • Ei koulutusdataa vaadita
  • Läpinäkyvä päätöksenteko
  • Nopea, ennustettava suorituskyky
  • Ei mallin siirtymistä ajan myötä

AI/ML-lähestymistavat

  • Tulokset vaihtelevat suoritusten välillä
  • Musta laatikko -päätöksenteko
  • Vaatii koulutusdataa
  • Vaikea auditoida
  • Korkeammat laskentakustannukset
  • Mallin siirtyminen ajan myötä

10-vaiheinen prosessi

Syötteestä tulokseen, tässä on tarkalleen mitä tapahtuu asiakirjallesi

1

Syöte

Lähetä asiakirjasi verkkoliittymän, API:n tai Word-lisäosan kautta

2

Kielentunnistus

Järjestelmä tunnistaa asiakirjan kielen optimaalista käsittelyä varten

3

Tokenisointi

Teksti jaetaan tokeneiksi kaavojen vertailua varten

4

Kaavojen vertailu

Regex-kaavat skannaavat 256 entiteettityyppiä

5

Kontekstianalyysi

Ympäröivä teksti parantaa tunnistustarkkuutta

6

Luottamuspisteytys

Jokainen tunnistus saa luottamuspisteen

7

Entiteettiluokittelu

Tunnistetut kohteet luokitellaan tyypin mukaan

8

Tulosten tarkastelu

Näe kaikki tunnistukset sijainteineen ja pisteineen

9

Sovella anonymisointia

Valitse menetelmäsi: Korvata, Poistaa, Hash, Salata tai Peittää

10

Tulostaa asiakirja

Lataa anonymisoitu asiakirjasi

Usein Kysytyt Kysymykset

Miksi anonymize.today käyttää regexiä AI:n sijaan PII-tunnistuksessa?
Regex-pohjainen tunnistus antaa 100 % toistettavia tuloksia — sama syöte tuottaa aina saman tuloksen. AI- ja koneoppimismallit voivat tuottaa erilaisia tuloksia eri ajoissa, kärsiä mallin kulumisesta ajan myötä ja toimia mustina laatikoina, joita on vaikea tarkastaa. Sääntelyn noudattamiseksi GDPR:n ja ISO 27001:n mukaan organisaatioiden on käytettävä selitettäviä ja toistettavia prosesseja, joita regex-pohjainen mallintaminen tarjoaa.
Kuinka tarkka PII-tunnistus on?
anonymize.today tarjoaa luottamusarvioita 0.0–1.0 jokaiselle tunnistukselle. Käyttäjät voivat asettaa vähimmäisluottamusrajoja herkkyyden hallitsemiseksi. Mallipohjaiset entiteetit, kuten luottokorttinumerot ja sosiaaliturvatunnukset, saavuttavat 95-99 % tarkkuuden, kun taas NLP-pohjaiset entiteetit, kuten nimet ja sijainnit, saavuttavat 85-95 % tarkkuuden. Alusta tukee 256 entiteettityyppiä, joilla on huolellisesti laaditut mallit jokaiselle.
Voinko tarkastaa, miten anonymize.today käsittelee tietojani?
Kyllä, jokainen tunnistus anonymize.today:ssa näyttää tarkasti sovitetun mallin, luottamusarvion ja tunnistetun entiteettityypin. Analysoija korostaa havaittuja entiteettejä kategoriakohtaisilla väreillä ja sijainneilla tekstissä. Tämä täydellinen läpinäkyvyys tekee tunnistuspäätösten selittämisestä helppoa tarkastajille, vaatimustenmukaisuuden valvojille tai tietosuojaviranomaisille.
Mitä tapahtuu tiedoilleni käsittelyn aikana?
anonymize.today:lle lähetetty teksti siirretään TLS 1.3 -salattujen yhteyksien kautta ISO 27001 -sertifioiduille palvelimille Saksassa. Teksti käsitellään muistissa Microsoft Presidion avulla, ja tulokset palautetaan välittömästi. Käyttäjätietoja ei tallenneta palvelimille käsittelyn jälkeen. Tiedot eivät koskaan poistu Euroopan unionista.
Miten anonymize.today käsittelee useita kieliä yhdessä tekstissä?
anonymize.today tukee automaattista kielentunnistusta asiakirjan ensisijaisen kielen tunnistamiseksi. Monikielisille teksteille käyttäjät voivat luoda mukautettuja esiasetuksia, jotka yhdistävät entiteettityyppejä kielirajojen yli. Alusta tukee 27 PII-tunnistuskieltä käyttäen spaCyä, Stanzaa ja Transformer-malleja, mahdollistaen maakohtaisten entiteettien, kuten saksalaisten verotunnusten, ranskalaisten NIR-numeroiden tai japanilaisten My Number -tunnusten tunnistamisen samassa asiakirjassa.

Näe se toiminnassa

Kokeile PII-tunnistustamme ja anonymisointia ilmaiseksi 300 tokenia kuukaudessa.