Analizator PII
Wykryj informacje umożliwiające identyfikację osób w swoim tekście
Analizator PII skanuje Twój tekst i identyfikuje wrażliwe informacje, takie jak imiona, e-maile, numery telefonów, adresy i inne.
Jak to działa
Analizator wykorzystuje wiele metod detekcji, aby zidentyfikować PII:
Dopasowanie wzorców
Wyrażenia regularne wykrywają dane strukturalne, takie jak adresy e-mail, numery telefonów, karty kredytowe i IBAN-y z wysoką dokładnością.
Uczenie maszynowe (NER)
Modele rozpoznawania nazwanych bytów identyfikują byty zależne od kontekstu, takie jak imiona osób, organizacje i lokalizacje, wykorzystując spaCy, Stanza i Transformers.
Walidacja sum kontrolnych
Karty kredytowe, IBAN-y i inne identyfikatory finansowe są walidowane przy użyciu algorytmów sum kontrolnych (Luhn, MOD-97) w celu zredukowania fałszywych pozytywów.
Używanie Analizatora
Krok 1: Wprowadź swój tekst
- Przejdź do strony Anonimizuj
- Wklej lub wpisz swój tekst w obszarze wejściowym
- Interfejs pokazuje liczbę znaków i szacowaną liczbę tokenów
Krok 2: Wybierz typy bytów
Wybierz, które typy PII chcesz wykryć:
| Typy encji | Obsługujemy 256 typów encji zorganizowanych w 10 kategoriach: | Tekst - Rzeczywisty tekst, który został zidentyfikowany jako PII |
|---|---|---|
| Osobowe - Imiona, e-maile, numery telefonów, daty urodzenia | PERSON, EMAIL_ADDRESS, PHONE_NUMBER | John Doe, john@email.com |
| Finansowe - Karty kredytowe, konta bankowe, IBAN, portfele kryptowalutowe | CREDIT_CARD, IBAN_CODE, SWIFT_CODE | 4111-1111-1111-1111 |
| Lokalizacja - Adresy, miasta, kraje, współrzędne | LOCATION, ADDRESS, COORDINATES | 123 Main St, New York |
| Rządowe - SSN, numery paszportów, prawa jazdy, numery identyfikacyjne | SSN, PASSPORT, DRIVER_LICENSE | 123-45-6789 |
| Techniczne - Adresy IP, adresy MAC, identyfikatory urządzeń | IP_ADDRESS, MAC_ADDRESS | 192.168.1.1 |
Zamiast ręcznie wybierać byty, użyj Ustawień wstępnych, aby szybko zastosować typowe konfiguracje bytów, takie jak "Zgodność z RODO" lub "Dane finansowe".
Instead of selecting entities manually, use Ustawienia wstępne to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".
Krok 3: Wybierz język
Wybierz język swojego tekstu dla optymalnej dokładności detekcji:
- Automatyczne wykrywanie - pozwól systemowi określić język - Let the system determine the language
- Specyficzny język - Wybierz z 27 obsługiwanych języków - Select from 27 supported languages
Wybór języka ma znaczenie
Wybór poprawnego języka znacznie poprawia dokładność detekcji, szczególnie dla imion osób i lokalizacji.
Krok 4: Uruchom analizę
- Kliknij przycisk Analizuj
- Poczekaj na zakończenie analizy (zwykle 1-3 sekundy)
- Przejrzyj wykryte byty w panelu wyników
Zrozumienie wyników
Po analizie każdy wykryty byt pokazuje:
Pozycja: znaki
Pola wyników
- Typ bytu - Kategoria wykrytego PII (OSOBA, EMAIL itp.) - The category of PII detected (PERSON, EMAIL, etc.)
- Tekst - Rzeczywisty tekst, który został zidentyfikowany jako PII - The actual text that was identified as PII
- Wynik pewności - Jak pewny jest system (0-100%) - How certain the system is (0-100%)
- Pozycja - Pozycje początkowe i końcowe znaków - Start and end character positions
Próg pewności
Dostosuj próg pewności, aby kontrolować czułość:
| Próg | Efekt | Najlepsze dla |
|---|---|---|
| Niski | Więcej wykrytych bytów, więcej fałszywych pozytywów | Maksymalne pokrycie, przegląd ręczny |
| Domyślny | Zrównoważona detekcja i dokładność | Ogólne zastosowanie |
| Wysoki | Mniej bytów, wyższa pewność | Automatyczne przetwarzanie |
| Bardzo wysoki | Tylko bardzo pewne dopasowania | Minimalna interwencja |
Wybieranie wyników
Po analizie możesz doprecyzować, które byty chcesz zanonimizować:
Zaznacz/odznacz wszystkie
- Użyj pola wyboru w nagłówku, aby zaznaczyć lub odznaczyć wszystkie wyniki
- Tylko zaznaczone byty zostaną zanonimizowane
Indywidualny wybór
- Kliknij indywidualne pola wyboru, aby włączyć/wyłączyć konkretne byty
- Przydatne, gdy analizator wykrywa fałszywe pozytywy
- Przydatne, gdy chcesz, aby pewne informacje były widoczne
Filtruj według typu
- Kliknij na odznakę typu bytu, aby filtrować wyniki według tego typu
- Szybko zaznacz/odznacz wszystkie byty danego typu
Przejrzyj wyniki przed anonimizacją. Analizator może czasami wykrywać fałszywe pozytywy, szczególnie dla imion, które są również powszechnymi słowami.
Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.
Koszty tokenów
Operacje analizy konsumują tokeny w oparciu o:
Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found
Final = ceil(Cost × 0.5)
Where:
text_k= Długość tekstuentities_enabled= Bytyentities_found= number of entities detected
Typowy koszt
| Długość tekstu | Byty | Typowy koszt |
|---|---|---|
| 100 characters | 3 types, 2 found | 2 tokens |
| 1,000 characters | 5 types, 5 found | 3 tokens |
| 5,000 characters | 10 types, 15 found | 6 tokens |
| 10,000 characters | 15 types, 30 found | 10 tokens |
Dokumentacja systemu tokenów Token System documentation for complete pricing details.
Najlepsze praktyki
Rozwiązywanie problemów
Byt nie został wykryty?
- Upewnij się, że typ bytu jest włączony w twoim wyborze
- Spróbuj obniżyć próg pewności
- Sprawdź, czy wybrano poprawny język
- Zweryfikuj, czy format tekstu odpowiada oczekiwanym wzorcom
Zbyt wiele fałszywych pozytywów?
- Zwiększ próg pewności
- Odznacz szerokie typy bytów, takie jak LOKALIZACJA
- Użyj ustawień wstępnych specyficznych dla bytów zamiast zaznaczać wszystkie
Analiza trwa zbyt długo?
- Podziel duże teksty na mniejsze fragmenty
- Zredukuj liczbę wybranych typów bytów
- Użyj ustawień wstępnych, aby uniknąć ładowania nieużywanych modeli detekcji
Next Steps
Ostatnia aktualizacja: marzec 2026