common.skipToContent

PII-Analyzer

Erkennen Sie personenbezogene Daten in Ihrem Text

Der PII-Analyzer scannt Ihren Text und identifiziert sensible Informationen wie Namen, E-Mails, Telefonnummern, Adressen und mehr.


So funktioniert es

Der Analyzer verwendet mehrere Erkennungsmethoden, um PII zu identifizieren:

Mustererkennung

Reguläre Ausdrücke erkennen strukturierte Daten wie E-Mail-Adressen, Telefonnummern, Kreditkarten und IBANs mit hoher Genauigkeit.

Maschinelles Lernen (NER)

Modelle zur Erkennung benannter Entitäten identifizieren kontextabhängige Entitäten wie Personennamen, Organisationen und Standorte mithilfe von spaCy, Stanza und Transformers.

Prüfziffernvalidierung

Kreditkarten, IBANs und andere finanzielle Identifikatoren werden mit Prüfziffernalgorithmen (Luhn, MOD-97) validiert, um falsche Positivmeldungen zu reduzieren.


Verwendung des Analyzers

Schritt 1: Geben Sie Ihren Text ein

  1. Navigieren Sie zur Anonymisierungsseite
  2. Fügen Sie Ihren Text in den Eingabebereich ein oder tippen Sie ihn ein
  3. Die Benutzeroberfläche zeigt eine Zeichenanzahl und eine Token-Schätzung an

Schritt 2: Wählen Sie Entitätstypen aus

Wählen Sie aus, welche Arten von PII erkannt werden sollen:

EntitätstypenWir unterstützen 256 Entitätstypen, die in 10 Kategorien organisiert sind:Text - Der tatsächliche Text, der als PII identifiziert wurde
Persönlich - Namen, E-Mails, Telefonnummern, GeburtsdatenPERSON, EMAIL_ADDRESS, PHONE_NUMBERJohn Doe, john@email.com
Finanziell - Kreditkarten, Bankkonten, IBAN, Krypto-WalletsCREDIT_CARD, IBAN_CODE, SWIFT_CODE4111-1111-1111-1111
Standort - Adressen, Städte, Länder, KoordinatenLOCATION, ADDRESS, COORDINATES123 Main St, New York
Regierung - SSN, Reisepassnummern, Führerscheine, nationale AusweiseSSN, PASSPORT, DRIVER_LICENSE123-45-6789
Technisch - IP-Adressen, MAC-Adressen, Geräte-IDsIP_ADDRESS, MAC_ADDRESS192.168.1.1

Verwenden Sie anstelle der manuellen Auswahl von Entitäten Voreinstellungen, um häufige Entitätskonfigurationen wie "GDPR-Konformität" oder "Finanzdaten" schnell anzuwenden.

Instead of selecting entities manually, use Voreinstellungen to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Schritt 3: Wählen Sie die Sprache

Wählen Sie die Sprache Ihres Textes für optimale Erkennungsgenauigkeit:

  • Automatische Erkennung - Lassen Sie das System die Sprache bestimmen - Let the system determine the language
  • Spezifische Sprache - Wählen Sie aus 27 unterstützten Sprachen - Select from 27 supported languages

Die Sprachauswahl ist wichtig

Die Auswahl der richtigen Sprache verbessert die Erkennungsgenauigkeit erheblich, insbesondere bei Personennamen und Standorten.

Schritt 4: Analyse durchführen

  1. Klicken Sie auf die Schaltfläche Analysieren
  2. Warten Sie, bis die Analyse abgeschlossen ist (in der Regel 1-3 Sekunden)
  3. Überprüfen Sie die erkannten Entitäten im Ergebnisbereich

Ergebnisse verstehen

Nach der Analyse zeigt jede erkannte Entität:

PERSONJohn DoeVertrauen

Position: Zeichen

Ergebnisfelder

  • Entitätstyp - Die Kategorie der erkannten PII (PERSON, EMAIL usw.) - The category of PII detected (PERSON, EMAIL, etc.)
  • Text - Der tatsächliche Text, der als PII identifiziert wurde - The actual text that was identified as PII
  • Vertrauensscore - Wie sicher das System ist (0-100%) - How certain the system is (0-100%)
  • Position - Start- und Endzeichenpositionen - Start and end character positions

Vertrauensschwelle

Passen Sie die Vertrauensschwelle an, um die Sensitivität zu steuern:

SchwelleWirkungAm besten für
NiedrigMehr erkannte Entitäten, mehr falsche PositivmeldungenMaximale Abdeckung, manuelle Überprüfung
StandardAusgewogene Erkennung und GenauigkeitAllgemeine Verwendung
HochWeniger Entitäten, höheres VertrauenAutomatisierte Verarbeitung
Sehr hochNur sehr vertrauenswürdige ÜbereinstimmungenMinimale Intervention

Ergebnisse auswählen

Nach der Analyse können Sie verfeinern, welche Entitäten anonymisiert werden sollen:

Alle auswählen/abwählen

  • Verwenden Sie das Kontrollkästchen im Header, um alle Ergebnisse auszuwählen oder abzuwählen
  • Nur ausgewählte Entitäten werden anonymisiert

Einzelauswahl

  • Klicken Sie auf die einzelnen Kontrollkästchen, um bestimmte Entitäten einzuschließen/ausschließen
  • Nützlich, wenn der Analyzer falsche Positivmeldungen erkennt
  • Nützlich, wenn Sie bestimmte Informationen sichtbar halten möchten

Nach Typ filtern

  • Klicken Sie auf ein Entitätstyp-Abzeichen, um die Ergebnisse nach diesem Typ zu filtern
  • Wählen Sie schnell alle Entitäten eines bestimmten Typs aus oder ab

Überprüfen Sie die Ergebnisse vor der Anonymisierung. Der Analyzer kann gelegentlich falsche Positivmeldungen erkennen, insbesondere bei Namen, die auch gebräuchliche Wörter sind.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.


Token-Kosten

Analyseoperationen verbrauchen Tokens basierend auf:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

  • text_k = Textlänge
  • entities_enabled = Entitäten
  • entities_found = number of entities detected

Typische Kosten

TextlängeEntitätenTypische Kosten
100 characters3 types, 2 found2 tokens
1,000 characters5 types, 5 found3 tokens
5,000 characters10 types, 15 found6 tokens
10,000 characters15 types, 30 found10 tokens

Dokumentation des Token-Systems Token System documentation for complete pricing details.


Best Practices

Wählen Sie nur die Entitätstypen aus, die Sie benötigen - reduziert Kosten und falsche Positivmeldungen
Verwenden Sie sprachspezifische Voreinstellungen für bessere Genauigkeit bei nicht-englischem Text
Überprüfen Sie die Ergebnisse vor der Anonymisierung, insbesondere bei Namen und Standorten
Verwenden Sie höhere Vertrauensschwellen für automatisierte Verarbeitung
Verarbeiten Sie Texte in angemessenen Abschnitten (unter 10.000 Zeichen) für die beste Leistung

Fehlerbehebung

Entität nicht erkannt?

  • Stellen Sie sicher, dass der Entitätstyp in Ihrer Auswahl aktiviert ist
  • Versuchen Sie, die Vertrauensschwelle zu senken
  • Überprüfen Sie, ob die richtige Sprache ausgewählt ist
  • Überprüfen Sie, ob das Textformat den erwarteten Mustern entspricht

Zu viele falsche Positivmeldungen?

  • Erhöhen Sie die Vertrauensschwelle
  • Deaktivieren Sie breite Entitätstypen wie LOCATION
  • Verwenden Sie entitätsspezifische Voreinstellungen, anstatt alle auszuwählen

Analyse dauert zu lange?

  • Teilen Sie große Texte in kleinere Abschnitte auf
  • Reduzieren Sie die Anzahl der ausgewählten Entitätstypen
  • Verwenden Sie Voreinstellungen, um das Laden ungenutzter Erkennungsmodelle zu vermeiden

Next Steps

Zuletzt aktualisiert: März 2026