PII Analizörü
Metninizde kişisel olarak tanımlanabilir bilgileri tespit edin
PII Analizörü, metninizi tarar ve isimler, e-postalar, telefon numaraları, adresler ve daha fazlası gibi hassas bilgileri tanımlar.
Nasıl Çalışır
Analyzer, PII'yi tanımlamak için birden fazla tespit yöntemi kullanır:
Desen Eşleştirme
Düzenli ifadeler, e-posta adresleri, telefon numaraları, kredi kartları ve IBAN'lar gibi yapılandırılmış verileri yüksek doğrulukla tespit eder.
Makine Öğrenimi (NER)
Adlandırılmış Varlık Tanıma modelleri, spaCy, Stanza ve Transformers kullanarak kişi adları, organizasyonlar ve yerler gibi bağlama bağlı varlıkları tanımlar.
Kontrol Toplamı Doğrulama
Kredi kartları, IBAN'lar ve diğer finansal tanımlayıcılar, yanlış pozitifleri azaltmak için kontrol toplamı algoritmaları (Luhn, MOD-97) kullanılarak doğrulanır.
Analyzer Kullanımı
Adım 1: Metninizi Girin
- Anonymize sayfasına gidin
- Metninizi giriş alanına yapıştırın veya yazın
- Arayüz, bir karakter sayısı ve token tahmini gösterir
Adım 2: Varlık Türlerini Seçin
Tespit etmek istediğiniz PII türlerini seçin:
| Varlık Türleri | 10 kategoriye organize edilmiş 256 varlık türünü destekliyoruz: | Metin - PII olarak tanımlanan gerçek metin |
|---|---|---|
| Kişisel - İsimler, e-postalar, telefon numaraları, doğum tarihleri | PERSON, EMAIL_ADDRESS, PHONE_NUMBER | John Doe, john@email.com |
| Finansal - Kredi kartları, banka hesapları, IBAN, kripto cüzdanlar | CREDIT_CARD, IBAN_CODE, SWIFT_CODE | 4111-1111-1111-1111 |
| Konum - Adresler, şehirler, ülkeler, koordinatlar | LOCATION, ADDRESS, COORDINATES | 123 Main St, New York |
| Devlet - SSN, pasaport numaraları, sürücü belgeleri, ulusal kimlikler | SSN, PASSPORT, DRIVER_LICENSE | 123-45-6789 |
| Teknik - IP adresleri, MAC adresleri, cihaz kimlikleri | IP_ADDRESS, MAC_ADDRESS | 192.168.1.1 |
Varlıkları manuel olarak seçmek yerine, "GDPR Uyumluluğu" veya "Finansal Veri" gibi yaygın varlık yapılandırmalarını hızlıca uygulamak için Preset'leri kullanın.
Instead of selecting entities manually, use Preset'ler to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".
Adım 3: Dili Seçin
Metninizin dilini en iyi tespit doğruluğu için seçin:
- Otomatik tespit - Sistemin dili belirlemesine izin verin - Let the system determine the language
- Belirli dil - 27 desteklenen dilden birini seçin - Select from 27 supported languages
Dil Seçimi Önemlidir
Doğru dili seçmek, özellikle kişi adları ve yerler için tespit doğruluğunu önemli ölçüde artırır.
Adım 4: Analizi Çalıştırın
- Analiz butonuna tıklayın
- Analizin tamamlanmasını bekleyin (genellikle 1-3 saniye)
- Sonuçlar panelinde tespit edilen varlıkları gözden geçirin
Sonuçları Anlamak
Analizden sonra, her tespit edilen varlık şunları gösterir:
Pozisyon: karakterler
Sonuç Alanları
- Varlık Türü - Tespit edilen PII'nin kategorisi (KİŞİ, E-POSTA, vb.) - The category of PII detected (PERSON, EMAIL, etc.)
- Metin - PII olarak tanımlanan gerçek metin - The actual text that was identified as PII
- Güven Skoru - Sistem ne kadar emin (0-100%) - How certain the system is (0-100%)
- Pozisyon - Başlangıç ve bitiş karakter pozisyonları - Start and end character positions
Güven Eşiği
Hassasiyeti kontrol etmek için güven eşiğini ayarlayın:
| Eşik | Etkisi | En İyi Kullanım |
|---|---|---|
| Düşük | Daha fazla varlık tespit edilir, daha fazla yanlış pozitif | Maksimum kapsama, manuel inceleme |
| Varsayılan | Dengeli tespit ve doğruluk | Genel kullanım |
| Yüksek | Daha az varlık, daha yüksek güven | Otomatik işleme |
| Çok Yüksek | Sadece çok emin eşleşmeler | Minimal müdahale |
Sonuçları Seçme
Analizden sonra, hangi varlıkları anonimleştireceğinizi daraltabilirsiniz:
Tümünü Seç / Seçimi Kaldır
- Tüm sonuçları seçmek veya seçimden çıkarmak için başlıktaki onay kutusunu kullanın
- Sadece seçilen varlıklar anonimleştirilecektir
Bireysel Seçim
- Belirli varlıkları dahil etmekten/çıkarmaktan için bireysel onay kutularına tıklayın
- Analyzer yanlış pozitifleri tespit ettiğinde faydalıdır
- Belirli bilgilerin görünür kalmasını istediğinizde faydalıdır
Türe Göre Filtrele
- Sonuçları o türle filtrelemek için bir varlık türü rozetine tıklayın
- Belirli bir türdeki tüm varlıkları hızlıca seçin/seçimden çıkarın
Anonimleştirmeden önce sonuçları gözden geçirin. Analyzer, özellikle yaygın kelimeler olan isimler için zaman zaman yanlış pozitifler tespit edebilir.
Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.
Token Maliyetleri
Analiz işlemleri, aşağıdakilere göre token tüketir:
Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found
Final = ceil(Cost × 0.5)
Where:
text_k= Metin Uzunluğuentities_enabled= Varlıklarentities_found= number of entities detected
Tipik Maliyet
| Metin Uzunluğu | Varlıklar | Tipik Maliyet |
|---|---|---|
| 100 characters | 3 types, 2 found | 2 tokens |
| 1,000 characters | 5 types, 5 found | 3 tokens |
| 5,000 characters | 10 types, 15 found | 6 tokens |
| 10,000 characters | 15 types, 30 found | 10 tokens |
Token Sistemi belgeleri Token System documentation for complete pricing details.
En İyi Uygulamalar
Sorun Giderme
Varlık tespit edilmedi mi?
- Varlık türünün seçiminizde etkin olduğundan emin olun
- Güven eşiğini düşürmeyi deneyin
- Doğru dilin seçildiğini kontrol edin
- Metin formatının beklenen desenlerle eşleştiğini doğrulayın
Çok fazla yanlış pozitif mi?
- Güven eşiğini artırın
- LOKASYON gibi geniş varlık türlerini seçimden çıkarın
- Tümünü seçmek yerine varlık türüne özel preset'ler kullanın
Analiz çok mu uzun sürüyor?
- Büyük metinleri daha küçük parçalara ayırın
- Seçilen varlık türlerinin sayısını azaltın
- Kullanılmayan tespit modellerini yüklemekten kaçınmak için preset'leri kullanın
Next Steps
Son Güncelleme: Mart 2026