PII-Analyzer
Erkennen Sie personenbezogene Daten in Ihrem Text
Der PII-Analyzer scannt Ihren Text und identifiziert sensible Informationen wie Namen, E-Mails, Telefonnummern, Adressen und mehr.
So funktioniert es
Der Analyzer verwendet mehrere Erkennungsmethoden, um PII zu identifizieren:
Mustererkennung
Reguläre Ausdrücke erkennen strukturierte Daten wie E-Mail-Adressen, Telefonnummern, Kreditkarten und IBANs mit hoher Genauigkeit.
Maschinelles Lernen (NER)
Modelle zur Erkennung benannter Entitäten identifizieren kontextabhängige Entitäten wie Personennamen, Organisationen und Standorte mithilfe von spaCy, Stanza und Transformers.
Prüfziffernvalidierung
Kreditkarten, IBANs und andere finanzielle Identifikatoren werden mit Prüfziffernalgorithmen (Luhn, MOD-97) validiert, um falsche Positivmeldungen zu reduzieren.
Verwendung des Analyzers
Schritt 1: Geben Sie Ihren Text ein
- Navigieren Sie zur Anonymisierungsseite
- Fügen Sie Ihren Text in den Eingabebereich ein oder tippen Sie ihn ein
- Die Benutzeroberfläche zeigt eine Zeichenanzahl und eine Token-Schätzung an
Schritt 2: Wählen Sie Entitätstypen aus
Wählen Sie aus, welche Arten von PII erkannt werden sollen:
| Entitätstypen | Wir unterstützen 256 Entitätstypen, die in 10 Kategorien organisiert sind: | Text - Der tatsächliche Text, der als PII identifiziert wurde |
|---|---|---|
| Persönlich - Namen, E-Mails, Telefonnummern, Geburtsdaten | PERSON, EMAIL_ADDRESS, PHONE_NUMBER | John Doe, john@email.com |
| Finanziell - Kreditkarten, Bankkonten, IBAN, Krypto-Wallets | CREDIT_CARD, IBAN_CODE, SWIFT_CODE | 4111-1111-1111-1111 |
| Standort - Adressen, Städte, Länder, Koordinaten | LOCATION, ADDRESS, COORDINATES | 123 Main St, New York |
| Regierung - SSN, Reisepassnummern, Führerscheine, nationale Ausweise | SSN, PASSPORT, DRIVER_LICENSE | 123-45-6789 |
| Technisch - IP-Adressen, MAC-Adressen, Geräte-IDs | IP_ADDRESS, MAC_ADDRESS | 192.168.1.1 |
Verwenden Sie anstelle der manuellen Auswahl von Entitäten Voreinstellungen, um häufige Entitätskonfigurationen wie "GDPR-Konformität" oder "Finanzdaten" schnell anzuwenden.
Instead of selecting entities manually, use Voreinstellungen to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".
Schritt 3: Wählen Sie die Sprache
Wählen Sie die Sprache Ihres Textes für optimale Erkennungsgenauigkeit:
- Automatische Erkennung - Lassen Sie das System die Sprache bestimmen - Let the system determine the language
- Spezifische Sprache - Wählen Sie aus 27 unterstützten Sprachen - Select from 27 supported languages
Die Sprachauswahl ist wichtig
Die Auswahl der richtigen Sprache verbessert die Erkennungsgenauigkeit erheblich, insbesondere bei Personennamen und Standorten.
Schritt 4: Analyse durchführen
- Klicken Sie auf die Schaltfläche Analysieren
- Warten Sie, bis die Analyse abgeschlossen ist (in der Regel 1-3 Sekunden)
- Überprüfen Sie die erkannten Entitäten im Ergebnisbereich
Ergebnisse verstehen
Nach der Analyse zeigt jede erkannte Entität:
Position: Zeichen
Ergebnisfelder
- Entitätstyp - Die Kategorie der erkannten PII (PERSON, EMAIL usw.) - The category of PII detected (PERSON, EMAIL, etc.)
- Text - Der tatsächliche Text, der als PII identifiziert wurde - The actual text that was identified as PII
- Vertrauensscore - Wie sicher das System ist (0-100%) - How certain the system is (0-100%)
- Position - Start- und Endzeichenpositionen - Start and end character positions
Vertrauensschwelle
Passen Sie die Vertrauensschwelle an, um die Sensitivität zu steuern:
| Schwelle | Wirkung | Am besten für |
|---|---|---|
| Niedrig | Mehr erkannte Entitäten, mehr falsche Positivmeldungen | Maximale Abdeckung, manuelle Überprüfung |
| Standard | Ausgewogene Erkennung und Genauigkeit | Allgemeine Verwendung |
| Hoch | Weniger Entitäten, höheres Vertrauen | Automatisierte Verarbeitung |
| Sehr hoch | Nur sehr vertrauenswürdige Übereinstimmungen | Minimale Intervention |
Ergebnisse auswählen
Nach der Analyse können Sie verfeinern, welche Entitäten anonymisiert werden sollen:
Alle auswählen/abwählen
- Verwenden Sie das Kontrollkästchen im Header, um alle Ergebnisse auszuwählen oder abzuwählen
- Nur ausgewählte Entitäten werden anonymisiert
Einzelauswahl
- Klicken Sie auf die einzelnen Kontrollkästchen, um bestimmte Entitäten einzuschließen/ausschließen
- Nützlich, wenn der Analyzer falsche Positivmeldungen erkennt
- Nützlich, wenn Sie bestimmte Informationen sichtbar halten möchten
Nach Typ filtern
- Klicken Sie auf ein Entitätstyp-Abzeichen, um die Ergebnisse nach diesem Typ zu filtern
- Wählen Sie schnell alle Entitäten eines bestimmten Typs aus oder ab
Überprüfen Sie die Ergebnisse vor der Anonymisierung. Der Analyzer kann gelegentlich falsche Positivmeldungen erkennen, insbesondere bei Namen, die auch gebräuchliche Wörter sind.
Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.
Token-Kosten
Analyseoperationen verbrauchen Tokens basierend auf:
Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found
Final = ceil(Cost × 0.5)
Where:
text_k= Textlängeentities_enabled= Entitätenentities_found= number of entities detected
Typische Kosten
| Textlänge | Entitäten | Typische Kosten |
|---|---|---|
| 100 characters | 3 types, 2 found | 2 tokens |
| 1,000 characters | 5 types, 5 found | 3 tokens |
| 5,000 characters | 10 types, 15 found | 6 tokens |
| 10,000 characters | 15 types, 30 found | 10 tokens |
Dokumentation des Token-Systems Token System documentation for complete pricing details.
Best Practices
Fehlerbehebung
Entität nicht erkannt?
- Stellen Sie sicher, dass der Entitätstyp in Ihrer Auswahl aktiviert ist
- Versuchen Sie, die Vertrauensschwelle zu senken
- Überprüfen Sie, ob die richtige Sprache ausgewählt ist
- Überprüfen Sie, ob das Textformat den erwarteten Mustern entspricht
Zu viele falsche Positivmeldungen?
- Erhöhen Sie die Vertrauensschwelle
- Deaktivieren Sie breite Entitätstypen wie LOCATION
- Verwenden Sie entitätsspezifische Voreinstellungen, anstatt alle auszuwählen
Analyse dauert zu lange?
- Teilen Sie große Texte in kleinere Abschnitte auf
- Reduzieren Sie die Anzahl der ausgewählten Entitätstypen
- Verwenden Sie Voreinstellungen, um das Laden ungenutzter Erkennungsmodelle zu vermeiden
Next Steps
Zuletzt aktualisiert: März 2026