common.skipToContent

Αναλυτής PII

Ανιχνεύστε προσωπικά αναγνωρίσιμες πληροφορίες στο κείμενό σας

Ο Αναλυτής PII σαρώνει το κείμενό σας και εντοπίζει ευαίσθητες πληροφορίες όπως ονόματα, emails, αριθμούς τηλεφώνων, διευθύνσεις και άλλα.


Πώς Λειτουργεί

Ο Αναλυτής χρησιμοποιεί πολλές μεθόδους ανίχνευσης για να εντοπίσει PII:

Αντιστοίχιση Προτύπων

Οι κανονικές εκφράσεις ανιχνεύουν δομημένα δεδομένα όπως διευθύνσεις email, αριθμούς τηλεφώνου, πιστωτικές κάρτες και IBAN με υψηλή ακρίβεια.

Μηχανική Μάθηση (NER)

Τα μοντέλα Αναγνώρισης Ονομάτων Οντοτήτων εντοπίζουν εξαρτώμενες από το πλαίσιο οντότητες όπως ονόματα ατόμων, οργανισμούς και τοποθεσίες χρησιμοποιώντας spaCy, Stanza και Transformers.

Επικύρωση Ελέγχου

Οι πιστωτικές κάρτες, οι IBAN και άλλοι χρηματοοικονομικοί αναγνωριστές επικυρώνονται χρησιμοποιώντας αλγορίθμους ελέγχου (Luhn, MOD-97) για μειωμένα ψευδώς θετικά αποτελέσματα.


Χρήση του Αναλυτή

Βήμα 1: Εισάγετε το Κείμενό σας

  1. Μεταβείτε στη σελίδα Ανωνυμοποίησης
  2. Επικολλήστε ή πληκτρολογήστε το κείμενό σας στην περιοχή εισόδου
  3. Η διεπαφή εμφανίζει τον αριθμό χαρακτήρων και την εκτίμηση των tokens

Βήμα 2: Επιλέξτε Τύπους Οντοτήτων

Επιλέξτε ποιους τύπους PII να ανιχνεύσετε:

Τύποι ΟντοτήτωνΥποστηρίζουμε 256 τύπους οντοτήτων οργανωμένους σε 10 κατηγορίες:Κείμενο - Το πραγματικό κείμενο που αναγνωρίστηκε ως PII
Προσωπικές - Ονόματα, emails, αριθμοί τηλεφώνων, ημερομηνίες γέννησηςPERSON, EMAIL_ADDRESS, PHONE_NUMBERJohn Doe, john@email.com
Οικονομικές - Πιστωτικές κάρτες, τραπεζικοί λογαριασμοί, IBAN, κρυπτονομίσματαCREDIT_CARD, IBAN_CODE, SWIFT_CODE4111-1111-1111-1111
Τοποθεσία - Διευθύνσεις, πόλεις, χώρες, συντεταγμένεςLOCATION, ADDRESS, COORDINATES123 Main St, New York
Κυβερνητικές - Αριθμοί κοινωνικής ασφάλισης, αριθμοί διαβατηρίων, άδειες οδήγησης, εθνικές ταυτότητεςSSN, PASSPORT, DRIVER_LICENSE123-45-6789
Τεχνικές - Διευθύνσεις IP, διευθύνσεις MAC, IDs συσκευώνIP_ADDRESS, MAC_ADDRESS192.168.1.1

Αντί να επιλέγετε οντότητες χειροκίνητα, χρησιμοποιήστε Προκαθορισμένες Ρυθμίσεις για να εφαρμόσετε γρήγορα κοινές ρυθμίσεις οντοτήτων όπως "Συμμόρφωση με GDPR" ή "Χρηματοοικονομικά Δεδομένα".

Instead of selecting entities manually, use Προκαθορισμένες Ρυθμίσεις to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

Βήμα 3: Επιλέξτε Γλώσσα

Επιλέξτε τη γλώσσα του κειμένου σας για βέλτιστη ακρίβεια ανίχνευσης:

  • Αυτόματη ανίχνευση - Αφήστε το σύστημα να προσδιορίσει τη γλώσσα - Let the system determine the language
  • Συγκεκριμένη γλώσσα - Επιλέξτε από 27 υποστηριζόμενες γλώσσες - Select from 27 supported languages

Η Επιλογή Γλώσσας Έχει Σημασία

Η επιλογή της σωστής γλώσσας βελτιώνει σημαντικά την ακρίβεια ανίχνευσης, ειδικά για ονόματα ατόμων και τοποθεσίες.

Βήμα 4: Εκτελέστε την Ανάλυση

  1. Κάντε κλικ στο κουμπί Ανάλυσης
  2. Περιμένετε να ολοκληρωθεί η ανάλυση (συνήθως 1-3 δευτερόλεπτα)
  3. Ελέγξτε τις ανιχνευμένες οντότητες στον πίνακα αποτελεσμάτων

Κατανόηση Αποτελεσμάτων

Μετά την ανάλυση, κάθε ανιχνευμένη οντότητα δείχνει:

PERSONJohn Doeεμπιστοσύνη

Θέση: χαρακτήρες

Πεδία Αποτελεσμάτων

  • Τύπος Οντότητας - Η κατηγορία του ανιχνευμένου PII (ΠΡΟΣΩΠΟ, EMAIL κ.λπ.) - The category of PII detected (PERSON, EMAIL, etc.)
  • Κείμενο - Το πραγματικό κείμενο που αναγνωρίστηκε ως PII - The actual text that was identified as PII
  • Βαθμός Εμπιστοσύνης - Πόσο σίγουρο είναι το σύστημα (0-100%) - How certain the system is (0-100%)
  • Θέση - Θέσεις αρχής και τέλους χαρακτήρων - Start and end character positions

Όριο Εμπιστοσύνης

Ρυθμίστε το όριο εμπιστοσύνης για να ελέγξετε την ευαισθησία:

ΌριοΕπίδρασηΚαλύτερο Για
ΧαμηλόΠερισσότερες οντότητες ανιχνεύονται, περισσότερα ψευδώς θετικάΜέγιστη κάλυψη, χειροκίνητη ανασκόπηση
ΠροεπιλογήΙσορροπημένη ανίχνευση και ακρίβειαΓενική χρήση
ΥψηλόΛιγότερες οντότητες, υψηλότερη εμπιστοσύνηΑυτοματοποιημένη επεξεργασία
Πολύ ΥψηλόΜόνο πολύ σίγουρες αντιστοιχίεςΕλάχιστη παρέμβαση

Επιλογή Αποτελεσμάτων

Μετά την ανάλυση, μπορείτε να διευκρινίσετε ποιες οντότητες να ανωνυμοποιήσετε:

Επιλογή/Αποεπιλογή Όλων

  • Χρησιμοποιήστε το πλαίσιο ελέγχου στην κεφαλίδα για να επιλέξετε ή να αποεπιλέξετε όλα τα αποτελέσματα
  • Μόνο οι επιλεγμένες οντότητες θα ανωνυμοποιηθούν

Ατομική Επιλογή

  • Κάντε κλικ σε ατομικά πλαίσια ελέγχου για να συμπεριλάβετε/εξαιρέσετε συγκεκριμένες οντότητες
  • Χρήσιμο όταν ο αναλυτής ανιχνεύει ψευδώς θετικά
  • Χρήσιμο όταν θέλετε να διατηρήσετε ορισμένες πληροφορίες ορατές

Φιλτράρισμα κατά Τύπο

  • Κάντε κλικ σε μια ετικέτα τύπου οντότητας για να φιλτράρετε τα αποτελέσματα κατά αυτού του τύπου
  • Επιλέξτε/αποεπιλέξτε γρήγορα όλες τις οντότητες ενός συγκεκριμένου τύπου

Ελέγξτε τα αποτελέσματα πριν την ανωνυμοποίηση. Ο αναλυτής μπορεί περιστασιακά να ανιχνεύει ψευδώς θετικά, ειδικά για ονόματα που είναι και κοινές λέξεις.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.


Κόστη Tokens

Οι λειτουργίες ανάλυσης καταναλώνουν tokens με βάση:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

  • text_k = Μήκος Κειμένου
  • entities_enabled = Οντότητες
  • entities_found = number of entities detected

Τυπικό Κόστος

Μήκος ΚειμένουΟντότητεςΤυπικό Κόστος
100 characters3 types, 2 found2 tokens
1,000 characters5 types, 5 found3 tokens
5,000 characters10 types, 15 found6 tokens
10,000 characters15 types, 30 found10 tokens

Τεκμηρίωση Συστήματος Tokens Token System documentation for complete pricing details.


Καλές Πρακτικές

Επιλέξτε μόνο τους τύπους οντοτήτων που χρειάζεστε - μειώνει τα κόστη και τα ψευδώς θετικά
Χρησιμοποιήστε γλώσσα-ειδικές προκαθορισμένες ρυθμίσεις για καλύτερη ακρίβεια σε κείμενα που δεν είναι στα Αγγλικά
Ελέγξτε τα αποτελέσματα πριν την ανωνυμοποίηση, ειδικά για ονόματα και τοποθεσίες
Χρησιμοποιήστε υψηλότερα όρια εμπιστοσύνης για αυτοματοποιημένη επεξεργασία
Επεξεργαστείτε το κείμενο σε λογικά κομμάτια (κάτω από 10,000 χαρακτήρες) για καλύτερη απόδοση

Επίλυση Προβλημάτων

Η οντότητα δεν ανιχνεύθηκε;

  • Βεβαιωθείτε ότι ο τύπος οντότητας είναι ενεργοποιημένος στην επιλογή σας
  • Δοκιμάστε να μειώσετε το όριο εμπιστοσύνης
  • Ελέγξτε ότι έχει επιλεγεί η σωστή γλώσσα
  • Επαληθεύστε ότι η μορφή κειμένου ταιριάζει με τα αναμενόμενα πρότυπα

Πάρα πολλά ψευδώς θετικά;

  • Αυξήστε το όριο εμπιστοσύνης
  • Αποεπιλέξτε ευρείς τύπους οντοτήτων όπως ΤΟΠΟΘΕΣΙΑ
  • Χρησιμοποιήστε προκαθορισμένες ρυθμίσεις συγκεκριμένων οντοτήτων αντί να επιλέξετε όλες

Η ανάλυση διαρκεί πολύ;

  • Σπάστε μεγάλα κείμενα σε μικρότερα κομμάτια
  • Μειώστε τον αριθμό των επιλεγμένων τύπων οντοτήτων
  • Χρησιμοποιήστε προκαθορισμένες ρυθμίσεις για να αποφύγετε τη φόρτωση μη χρησιμοποιούμενων μοντέλων ανίχνευσης

Next Steps

Τελευταία Ενημέρωση: Μάρτιος 2026