common.skipToContent

PII Analizörü

Metninizde kişisel olarak tanımlanabilir bilgileri tespit edin

PII Analizörü, metninizi tarar ve isimler, e-postalar, telefon numaraları, adresler ve daha fazlası gibi hassas bilgileri tanımlar.


Nasıl Çalışır

Analyzer, PII'yi tanımlamak için birden fazla tespit yöntemi kullanır:

Desen Eşleştirme

Düzenli ifadeler, e-posta adresleri, telefon numaraları, kredi kartları ve IBAN'lar gibi yapılandırılmış verileri yüksek doğrulukla tespit eder.

Makine Öğrenimi (NER)

Adlandırılmış Varlık Tanıma modelleri, spaCy, Stanza ve Transformers kullanarak kişi adları, organizasyonlar ve yerler gibi bağlama bağlı varlıkları tanımlar.

Kontrol Toplamı Doğrulama

Kredi kartları, IBAN'lar ve diğer finansal tanımlayıcılar, yanlış pozitifleri azaltmak için kontrol toplamı algoritmaları (Luhn, MOD-97) kullanılarak doğrulanır.


Analyzer Kullanımı

Adım 1: Metninizi Girin

  1. Anonymize sayfasına gidin
  2. Metninizi giriş alanına yapıştırın veya yazın
  3. Arayüz, bir karakter sayısı ve token tahmini gösterir

Adım 2: Varlık Türlerini Seçin

Tespit etmek istediğiniz PII türlerini seçin:

Varlık Türleri10 kategoriye organize edilmiş 256 varlık türünü destekliyoruz:Metin - PII olarak tanımlanan gerçek metin
Kişisel - İsimler, e-postalar, telefon numaraları, doğum tarihleriPERSON, EMAIL_ADDRESS, PHONE_NUMBERJohn Doe, john@email.com
Finansal - Kredi kartları, banka hesapları, IBAN, kripto cüzdanlarCREDIT_CARD, IBAN_CODE, SWIFT_CODE4111-1111-1111-1111
Konum - Adresler, şehirler, ülkeler, koordinatlarLOCATION, ADDRESS, COORDINATES123 Main St, New York
Devlet - SSN, pasaport numaraları, sürücü belgeleri, ulusal kimliklerSSN, PASSPORT, DRIVER_LICENSE123-45-6789
Teknik - IP adresleri, MAC adresleri, cihaz kimlikleriIP_ADDRESS, MAC_ADDRESS192.168.1.1

Varlıkları manuel olarak seçmek yerine, "GDPR Uyumluluğu" veya "Finansal Veri" gibi yaygın varlık yapılandırmalarını hızlıca uygulamak için Preset'leri kullanın.

Instead of selecting entities manually, use Preset'ler to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Adım 3: Dili Seçin

Metninizin dilini en iyi tespit doğruluğu için seçin:

  • Otomatik tespit - Sistemin dili belirlemesine izin verin - Let the system determine the language
  • Belirli dil - 27 desteklenen dilden birini seçin - Select from 27 supported languages

Dil Seçimi Önemlidir

Doğru dili seçmek, özellikle kişi adları ve yerler için tespit doğruluğunu önemli ölçüde artırır.

Adım 4: Analizi Çalıştırın

  1. Analiz butonuna tıklayın
  2. Analizin tamamlanmasını bekleyin (genellikle 1-3 saniye)
  3. Sonuçlar panelinde tespit edilen varlıkları gözden geçirin

Sonuçları Anlamak

Analizden sonra, her tespit edilen varlık şunları gösterir:

PERSONJohn Doegüven

Pozisyon: karakterler

Sonuç Alanları

  • Varlık Türü - Tespit edilen PII'nin kategorisi (KİŞİ, E-POSTA, vb.) - The category of PII detected (PERSON, EMAIL, etc.)
  • Metin - PII olarak tanımlanan gerçek metin - The actual text that was identified as PII
  • Güven Skoru - Sistem ne kadar emin (0-100%) - How certain the system is (0-100%)
  • Pozisyon - Başlangıç ve bitiş karakter pozisyonları - Start and end character positions

Güven Eşiği

Hassasiyeti kontrol etmek için güven eşiğini ayarlayın:

EşikEtkisiEn İyi Kullanım
DüşükDaha fazla varlık tespit edilir, daha fazla yanlış pozitifMaksimum kapsama, manuel inceleme
VarsayılanDengeli tespit ve doğrulukGenel kullanım
YüksekDaha az varlık, daha yüksek güvenOtomatik işleme
Çok YüksekSadece çok emin eşleşmelerMinimal müdahale

Sonuçları Seçme

Analizden sonra, hangi varlıkları anonimleştireceğinizi daraltabilirsiniz:

Tümünü Seç / Seçimi Kaldır

  • Tüm sonuçları seçmek veya seçimden çıkarmak için başlıktaki onay kutusunu kullanın
  • Sadece seçilen varlıklar anonimleştirilecektir

Bireysel Seçim

  • Belirli varlıkları dahil etmekten/çıkarmaktan için bireysel onay kutularına tıklayın
  • Analyzer yanlış pozitifleri tespit ettiğinde faydalıdır
  • Belirli bilgilerin görünür kalmasını istediğinizde faydalıdır

Türe Göre Filtrele

  • Sonuçları o türle filtrelemek için bir varlık türü rozetine tıklayın
  • Belirli bir türdeki tüm varlıkları hızlıca seçin/seçimden çıkarın

Anonimleştirmeden önce sonuçları gözden geçirin. Analyzer, özellikle yaygın kelimeler olan isimler için zaman zaman yanlış pozitifler tespit edebilir.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.


Token Maliyetleri

Analiz işlemleri, aşağıdakilere göre token tüketir:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

  • text_k = Metin Uzunluğu
  • entities_enabled = Varlıklar
  • entities_found = number of entities detected

Tipik Maliyet

Metin UzunluğuVarlıklarTipik Maliyet
100 characters3 types, 2 found2 tokens
1,000 characters5 types, 5 found3 tokens
5,000 characters10 types, 15 found6 tokens
10,000 characters15 types, 30 found10 tokens

Token Sistemi belgeleri Token System documentation for complete pricing details.


En İyi Uygulamalar

Sadece ihtiyaç duyduğunuz varlık türlerini seçin - maliyetleri ve yanlış pozitifleri azaltır
İngilizce olmayan metinlerde daha iyi doğruluk için dil özelinde preset'ler kullanın
Özellikle isimler ve yerler için anonimleştirmeden önce sonuçları gözden geçirin
Otomatik işleme için daha yüksek güven eşiği kullanın
En iyi performans için metni makul parçalara (10.000 karakterin altında) işleyin

Sorun Giderme

Varlık tespit edilmedi mi?

  • Varlık türünün seçiminizde etkin olduğundan emin olun
  • Güven eşiğini düşürmeyi deneyin
  • Doğru dilin seçildiğini kontrol edin
  • Metin formatının beklenen desenlerle eşleştiğini doğrulayın

Çok fazla yanlış pozitif mi?

  • Güven eşiğini artırın
  • LOKASYON gibi geniş varlık türlerini seçimden çıkarın
  • Tümünü seçmek yerine varlık türüne özel preset'ler kullanın

Analiz çok mu uzun sürüyor?

  • Büyük metinleri daha küçük parçalara ayırın
  • Seçilen varlık türlerinin sayısını azaltın
  • Kullanılmayan tespit modellerini yüklemekten kaçınmak için preset'leri kullanın

Next Steps

Son Güncelleme: Mart 2026