Αναλυτής PII
Ανιχνεύστε προσωπικά αναγνωρίσιμες πληροφορίες στο κείμενό σας
Ο Αναλυτής PII σαρώνει το κείμενό σας και εντοπίζει ευαίσθητες πληροφορίες όπως ονόματα, emails, αριθμούς τηλεφώνων, διευθύνσεις και άλλα.
Πώς Λειτουργεί
Ο Αναλυτής χρησιμοποιεί πολλές μεθόδους ανίχνευσης για να εντοπίσει PII:
Αντιστοίχιση Προτύπων
Οι κανονικές εκφράσεις ανιχνεύουν δομημένα δεδομένα όπως διευθύνσεις email, αριθμούς τηλεφώνου, πιστωτικές κάρτες και IBAN με υψηλή ακρίβεια.
Μηχανική Μάθηση (NER)
Τα μοντέλα Αναγνώρισης Ονομάτων Οντοτήτων εντοπίζουν εξαρτώμενες από το πλαίσιο οντότητες όπως ονόματα ατόμων, οργανισμούς και τοποθεσίες χρησιμοποιώντας spaCy, Stanza και Transformers.
Επικύρωση Ελέγχου
Οι πιστωτικές κάρτες, οι IBAN και άλλοι χρηματοοικονομικοί αναγνωριστές επικυρώνονται χρησιμοποιώντας αλγορίθμους ελέγχου (Luhn, MOD-97) για μειωμένα ψευδώς θετικά αποτελέσματα.
Χρήση του Αναλυτή
Βήμα 1: Εισάγετε το Κείμενό σας
- Μεταβείτε στη σελίδα Ανωνυμοποίησης
- Επικολλήστε ή πληκτρολογήστε το κείμενό σας στην περιοχή εισόδου
- Η διεπαφή εμφανίζει τον αριθμό χαρακτήρων και την εκτίμηση των tokens
Βήμα 2: Επιλέξτε Τύπους Οντοτήτων
Επιλέξτε ποιους τύπους PII να ανιχνεύσετε:
| Τύποι Οντοτήτων | Υποστηρίζουμε 256 τύπους οντοτήτων οργανωμένους σε 10 κατηγορίες: | Κείμενο - Το πραγματικό κείμενο που αναγνωρίστηκε ως PII |
|---|---|---|
| Προσωπικές - Ονόματα, emails, αριθμοί τηλεφώνων, ημερομηνίες γέννησης | PERSON, EMAIL_ADDRESS, PHONE_NUMBER | John Doe, john@email.com |
| Οικονομικές - Πιστωτικές κάρτες, τραπεζικοί λογαριασμοί, IBAN, κρυπτονομίσματα | CREDIT_CARD, IBAN_CODE, SWIFT_CODE | 4111-1111-1111-1111 |
| Τοποθεσία - Διευθύνσεις, πόλεις, χώρες, συντεταγμένες | LOCATION, ADDRESS, COORDINATES | 123 Main St, New York |
| Κυβερνητικές - Αριθμοί κοινωνικής ασφάλισης, αριθμοί διαβατηρίων, άδειες οδήγησης, εθνικές ταυτότητες | SSN, PASSPORT, DRIVER_LICENSE | 123-45-6789 |
| Τεχνικές - Διευθύνσεις IP, διευθύνσεις MAC, IDs συσκευών | IP_ADDRESS, MAC_ADDRESS | 192.168.1.1 |
Αντί να επιλέγετε οντότητες χειροκίνητα, χρησιμοποιήστε Προκαθορισμένες Ρυθμίσεις για να εφαρμόσετε γρήγορα κοινές ρυθμίσεις οντοτήτων όπως "Συμμόρφωση με GDPR" ή "Χρηματοοικονομικά Δεδομένα".
Instead of selecting entities manually, use Προκαθορισμένες Ρυθμίσεις to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".
Βήμα 3: Επιλέξτε Γλώσσα
Επιλέξτε τη γλώσσα του κειμένου σας για βέλτιστη ακρίβεια ανίχνευσης:
- Αυτόματη ανίχνευση - Αφήστε το σύστημα να προσδιορίσει τη γλώσσα - Let the system determine the language
- Συγκεκριμένη γλώσσα - Επιλέξτε από 27 υποστηριζόμενες γλώσσες - Select from 27 supported languages
Η Επιλογή Γλώσσας Έχει Σημασία
Η επιλογή της σωστής γλώσσας βελτιώνει σημαντικά την ακρίβεια ανίχνευσης, ειδικά για ονόματα ατόμων και τοποθεσίες.
Βήμα 4: Εκτελέστε την Ανάλυση
- Κάντε κλικ στο κουμπί Ανάλυσης
- Περιμένετε να ολοκληρωθεί η ανάλυση (συνήθως 1-3 δευτερόλεπτα)
- Ελέγξτε τις ανιχνευμένες οντότητες στον πίνακα αποτελεσμάτων
Κατανόηση Αποτελεσμάτων
Μετά την ανάλυση, κάθε ανιχνευμένη οντότητα δείχνει:
Θέση: χαρακτήρες
Πεδία Αποτελεσμάτων
- Τύπος Οντότητας - Η κατηγορία του ανιχνευμένου PII (ΠΡΟΣΩΠΟ, EMAIL κ.λπ.) - The category of PII detected (PERSON, EMAIL, etc.)
- Κείμενο - Το πραγματικό κείμενο που αναγνωρίστηκε ως PII - The actual text that was identified as PII
- Βαθμός Εμπιστοσύνης - Πόσο σίγουρο είναι το σύστημα (0-100%) - How certain the system is (0-100%)
- Θέση - Θέσεις αρχής και τέλους χαρακτήρων - Start and end character positions
Όριο Εμπιστοσύνης
Ρυθμίστε το όριο εμπιστοσύνης για να ελέγξετε την ευαισθησία:
| Όριο | Επίδραση | Καλύτερο Για |
|---|---|---|
| Χαμηλό | Περισσότερες οντότητες ανιχνεύονται, περισσότερα ψευδώς θετικά | Μέγιστη κάλυψη, χειροκίνητη ανασκόπηση |
| Προεπιλογή | Ισορροπημένη ανίχνευση και ακρίβεια | Γενική χρήση |
| Υψηλό | Λιγότερες οντότητες, υψηλότερη εμπιστοσύνη | Αυτοματοποιημένη επεξεργασία |
| Πολύ Υψηλό | Μόνο πολύ σίγουρες αντιστοιχίες | Ελάχιστη παρέμβαση |
Επιλογή Αποτελεσμάτων
Μετά την ανάλυση, μπορείτε να διευκρινίσετε ποιες οντότητες να ανωνυμοποιήσετε:
Επιλογή/Αποεπιλογή Όλων
- Χρησιμοποιήστε το πλαίσιο ελέγχου στην κεφαλίδα για να επιλέξετε ή να αποεπιλέξετε όλα τα αποτελέσματα
- Μόνο οι επιλεγμένες οντότητες θα ανωνυμοποιηθούν
Ατομική Επιλογή
- Κάντε κλικ σε ατομικά πλαίσια ελέγχου για να συμπεριλάβετε/εξαιρέσετε συγκεκριμένες οντότητες
- Χρήσιμο όταν ο αναλυτής ανιχνεύει ψευδώς θετικά
- Χρήσιμο όταν θέλετε να διατηρήσετε ορισμένες πληροφορίες ορατές
Φιλτράρισμα κατά Τύπο
- Κάντε κλικ σε μια ετικέτα τύπου οντότητας για να φιλτράρετε τα αποτελέσματα κατά αυτού του τύπου
- Επιλέξτε/αποεπιλέξτε γρήγορα όλες τις οντότητες ενός συγκεκριμένου τύπου
Ελέγξτε τα αποτελέσματα πριν την ανωνυμοποίηση. Ο αναλυτής μπορεί περιστασιακά να ανιχνεύει ψευδώς θετικά, ειδικά για ονόματα που είναι και κοινές λέξεις.
Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.
Κόστη Tokens
Οι λειτουργίες ανάλυσης καταναλώνουν tokens με βάση:
Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found
Final = ceil(Cost × 0.5)
Where:
text_k= Μήκος Κειμένουentities_enabled= Οντότητεςentities_found= number of entities detected
Τυπικό Κόστος
| Μήκος Κειμένου | Οντότητες | Τυπικό Κόστος |
|---|---|---|
| 100 characters | 3 types, 2 found | 2 tokens |
| 1,000 characters | 5 types, 5 found | 3 tokens |
| 5,000 characters | 10 types, 15 found | 6 tokens |
| 10,000 characters | 15 types, 30 found | 10 tokens |
Τεκμηρίωση Συστήματος Tokens Token System documentation for complete pricing details.
Καλές Πρακτικές
Επίλυση Προβλημάτων
Η οντότητα δεν ανιχνεύθηκε;
- Βεβαιωθείτε ότι ο τύπος οντότητας είναι ενεργοποιημένος στην επιλογή σας
- Δοκιμάστε να μειώσετε το όριο εμπιστοσύνης
- Ελέγξτε ότι έχει επιλεγεί η σωστή γλώσσα
- Επαληθεύστε ότι η μορφή κειμένου ταιριάζει με τα αναμενόμενα πρότυπα
Πάρα πολλά ψευδώς θετικά;
- Αυξήστε το όριο εμπιστοσύνης
- Αποεπιλέξτε ευρείς τύπους οντοτήτων όπως ΤΟΠΟΘΕΣΙΑ
- Χρησιμοποιήστε προκαθορισμένες ρυθμίσεις συγκεκριμένων οντοτήτων αντί να επιλέξετε όλες
Η ανάλυση διαρκεί πολύ;
- Σπάστε μεγάλα κείμενα σε μικρότερα κομμάτια
- Μειώστε τον αριθμό των επιλεγμένων τύπων οντοτήτων
- Χρησιμοποιήστε προκαθορισμένες ρυθμίσεις για να αποφύγετε τη φόρτωση μη χρησιμοποιούμενων μοντέλων ανίχνευσης
Next Steps
Τελευταία Ενημέρωση: Μάρτιος 2026