PII-Analyzer

Erkennen Sie personenbezogene Daten in Ihrem Text

Der PII-Analyzer scannt Ihren Text und identifiziert sensible Informationen wie Namen, E-Mails, Telefonnummern, Adressen und mehr.

So funktioniert es

Der Analyzer verwendet mehrere Erkennungsmethoden, um PII zu identifizieren:

Mustererkennung

Reguläre Ausdrücke erkennen strukturierte Daten wie E-Mail-Adressen, Telefonnummern, Kreditkarten und IBANs mit hoher Genauigkeit.

Maschinelles Lernen (NER)

Modelle zur Erkennung benannter Entitäten identifizieren kontextabhängige Entitäten wie Personennamen, Organisationen und Standorte mithilfe von spaCy, Stanza und Transformers.

Prüfziffernvalidierung

Kreditkarten, IBANs und andere finanzielle Identifikatoren werden mit Prüfziffernalgorithmen (Luhn, MOD-97) validiert, um falsche Positivmeldungen zu reduzieren.

Verwendung des Analyzers

Schritt 1: Geben Sie Ihren Text ein

Navigieren Sie zur Anonymisierungsseite
Fügen Sie Ihren Text in den Eingabebereich ein oder tippen Sie ihn ein
Die Benutzeroberfläche zeigt eine Zeichenanzahl und eine Token-Schätzung an

Schritt 2: Wählen Sie Entitätstypen aus

Wählen Sie aus, welche Arten von PII erkannt werden sollen:

Entitätstypen	Wir unterstützen 256 Entitätstypen, die in 10 Kategorien organisiert sind:	Text - Der tatsächliche Text, der als PII identifiziert wurde
Persönlich - Namen, E-Mails, Telefonnummern, Geburtsdaten	PERSON, EMAIL_ADDRESS, PHONE_NUMBER	John Doe, john@email.com
Finanziell - Kreditkarten, Bankkonten, IBAN, Krypto-Wallets	CREDIT_CARD, IBAN_CODE, SWIFT_CODE	4111-1111-1111-1111
Standort - Adressen, Städte, Länder, Koordinaten	LOCATION, ADDRESS, COORDINATES	123 Main St, New York
Regierung - SSN, Reisepassnummern, Führerscheine, nationale Ausweise	SSN, PASSPORT, DRIVER_LICENSE	123-45-6789
Technisch - IP-Adressen, MAC-Adressen, Geräte-IDs	IP_ADDRESS, MAC_ADDRESS	192.168.1.1

Verwenden Sie anstelle der manuellen Auswahl von Entitäten Voreinstellungen, um häufige Entitätskonfigurationen wie "GDPR-Konformität" oder "Finanzdaten" schnell anzuwenden.

Instead of selecting entities manually, use Voreinstellungen to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Schritt 3: Wählen Sie die Sprache

Wählen Sie die Sprache Ihres Textes für optimale Erkennungsgenauigkeit:

Automatische Erkennung - Lassen Sie das System die Sprache bestimmen - Let the system determine the language
Spezifische Sprache - Wählen Sie aus 27 unterstützten Sprachen - Select from 27 supported languages

Die Sprachauswahl ist wichtig

Die Auswahl der richtigen Sprache verbessert die Erkennungsgenauigkeit erheblich, insbesondere bei Personennamen und Standorten.

Schritt 4: Analyse durchführen

Klicken Sie auf die Schaltfläche Analysieren
Warten Sie, bis die Analyse abgeschlossen ist (in der Regel 1-3 Sekunden)
Überprüfen Sie die erkannten Entitäten im Ergebnisbereich

Ergebnisse verstehen

Nach der Analyse zeigt jede erkannte Entität:

PERSONJohn DoeVertrauen

Position: Zeichen

Ergebnisfelder

Entitätstyp - Die Kategorie der erkannten PII (PERSON, EMAIL usw.) - The category of PII detected (PERSON, EMAIL, etc.)
Text - Der tatsächliche Text, der als PII identifiziert wurde - The actual text that was identified as PII
Vertrauensscore - Wie sicher das System ist (0-100%) - How certain the system is (0-100%)
Position - Start- und Endzeichenpositionen - Start and end character positions

Vertrauensschwelle

Passen Sie die Vertrauensschwelle an, um die Sensitivität zu steuern:

Schwelle	Wirkung	Am besten für
Niedrig	Mehr erkannte Entitäten, mehr falsche Positivmeldungen	Maximale Abdeckung, manuelle Überprüfung
Standard	Ausgewogene Erkennung und Genauigkeit	Allgemeine Verwendung
Hoch	Weniger Entitäten, höheres Vertrauen	Automatisierte Verarbeitung
Sehr hoch	Nur sehr vertrauenswürdige Übereinstimmungen	Minimale Intervention

Ergebnisse auswählen

Nach der Analyse können Sie verfeinern, welche Entitäten anonymisiert werden sollen:

Alle auswählen/abwählen

Verwenden Sie das Kontrollkästchen im Header, um alle Ergebnisse auszuwählen oder abzuwählen
Nur ausgewählte Entitäten werden anonymisiert

Einzelauswahl

Klicken Sie auf die einzelnen Kontrollkästchen, um bestimmte Entitäten einzuschließen/ausschließen
Nützlich, wenn der Analyzer falsche Positivmeldungen erkennt
Nützlich, wenn Sie bestimmte Informationen sichtbar halten möchten

Nach Typ filtern

Klicken Sie auf ein Entitätstyp-Abzeichen, um die Ergebnisse nach diesem Typ zu filtern
Wählen Sie schnell alle Entitäten eines bestimmten Typs aus oder ab

Überprüfen Sie die Ergebnisse vor der Anonymisierung. Der Analyzer kann gelegentlich falsche Positivmeldungen erkennen, insbesondere bei Namen, die auch gebräuchliche Wörter sind.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.

Token-Kosten

Analyseoperationen verbrauchen Tokens basierend auf:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

text_k = Textlänge
entities_enabled = Entitäten
entities_found = number of entities detected

Typische Kosten

Textlänge	Entitäten	Typische Kosten
100 characters	3 types, 2 found	2 tokens
1,000 characters	5 types, 5 found	3 tokens
5,000 characters	10 types, 15 found	6 tokens
10,000 characters	15 types, 30 found	10 tokens

Dokumentation des Token-Systems Token System documentation for complete pricing details.

Best Practices

✅Wählen Sie nur die Entitätstypen aus, die Sie benötigen - reduziert Kosten und falsche Positivmeldungen

✅Verwenden Sie sprachspezifische Voreinstellungen für bessere Genauigkeit bei nicht-englischem Text

✅Überprüfen Sie die Ergebnisse vor der Anonymisierung, insbesondere bei Namen und Standorten

✅Verwenden Sie höhere Vertrauensschwellen für automatisierte Verarbeitung

✅Verarbeiten Sie Texte in angemessenen Abschnitten (unter 10.000 Zeichen) für die beste Leistung

Fehlerbehebung

Entität nicht erkannt?

Stellen Sie sicher, dass der Entitätstyp in Ihrer Auswahl aktiviert ist
Versuchen Sie, die Vertrauensschwelle zu senken
Überprüfen Sie, ob die richtige Sprache ausgewählt ist
Überprüfen Sie, ob das Textformat den erwarteten Mustern entspricht

Zu viele falsche Positivmeldungen?

Erhöhen Sie die Vertrauensschwelle
Deaktivieren Sie breite Entitätstypen wie LOCATION
Verwenden Sie entitätsspezifische Voreinstellungen, anstatt alle auszuwählen

Analyse dauert zu lange?

Teilen Sie große Texte in kleinere Abschnitte auf
Reduzieren Sie die Anzahl der ausgewählten Entitätstypen
Verwenden Sie Voreinstellungen, um das Laden ungenutzter Erkennungsmodelle zu vermeiden

Next Steps

Anonymizer-Leitfaden

Erfahren Sie, wie Sie erkannte Entitäten anonymisieren

Voreinstellungen

Speichern und Wiederverwenden von Entitätskonfigurationen

Zuletzt aktualisiert: März 2026