محلل PII
كشف المعلومات الشخصية القابلة للتحديد في نصك
يقوم محلل PII بفحص نصك وتحديد المعلومات الحساسة مثل الأسماء، والبريد الإلكتروني، وأرقام الهواتف، والعناوين، والمزيد.
كيف يعمل
يستخدم المحلل طرق اكتشاف متعددة لتحديد المعلومات الشخصية:
مطابقة الأنماط
تكتشف التعبيرات العادية البيانات المهيكلة مثل عناوين البريد الإلكتروني، وأرقام الهواتف، وبطاقات الائتمان، وأرقام IBAN بدقة عالية.
تعلم الآلة (NER)
تحدد نماذج التعرف على الكيانات المسماة الكيانات المعتمدة على السياق مثل أسماء الأشخاص، والمنظمات، والمواقع باستخدام spaCy وStanza وTransformers.
تحقق من صحة المجموع الاختباري
تتم التحقق من صحة بطاقات الائتمان، وأرقام IBAN، وغيرها من المعرفات المالية باستخدام خوارزميات المجموع الاختباري (Luhn، MOD-97) لتقليل الإيجابيات الكاذبة.
استخدام المحلل
الخطوة 1: أدخل نصك
- انتقل إلى صفحة التمويه
- الصق أو اكتب نصك في منطقة الإدخال
- تظهر الواجهة عدد الأحرف وتقدير الرموز
الخطوة 2: اختر أنواع الكيانات
اختر أنواع المعلومات الشخصية التي ترغب في اكتشافها:
| أنواع الكيانات | ندعم 256 نوعًا من الكيانات منظمة في 10 فئات: | النص - النص الفعلي الذي تم تحديده كمعلومات شخصية |
|---|---|---|
| شخصية - الأسماء، والبريد الإلكتروني، وأرقام الهواتف، وتواريخ الميلاد | PERSON, EMAIL_ADDRESS, PHONE_NUMBER | John Doe, john@email.com |
| مالية - بطاقات الائتمان، وحسابات البنوك، ورقم IBAN، ومحافظ العملات المشفرة | CREDIT_CARD, IBAN_CODE, SWIFT_CODE | 4111-1111-1111-1111 |
| موقع - العناوين، والمدن، والدول، والإحداثيات | LOCATION, ADDRESS, COORDINATES | 123 Main St, New York |
| حكومية - رقم الضمان الاجتماعي، وأرقام جوازات السفر، ورخص القيادة، والهويات الوطنية | SSN, PASSPORT, DRIVER_LICENSE | 123-45-6789 |
| تقني - عناوين IP، وعناوين MAC، ومعرفات الأجهزة | IP_ADDRESS, MAC_ADDRESS | 192.168.1.1 |
بدلاً من اختيار الكيانات يدويًا، استخدم الإعدادات المسبقة لتطبيق تكوينات الكيانات الشائعة بسرعة مثل "الامتثال لـ GDPR" أو "البيانات المالية".
Instead of selecting entities manually, use الإعدادات المسبقة to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".
الخطوة 3: اختر اللغة
اختر لغة نصك للحصول على دقة اكتشاف مثالية:
- الكشف التلقائي - دع النظام يحدد اللغة - Let the system determine the language
- لغة محددة - اختر من 27 لغة مدعومة - Select from 27 supported languages
اختيار اللغة مهم
اختيار اللغة الصحيحة يحسن بشكل كبير من دقة الاكتشاف، خاصة لأسماء الأشخاص والمواقع.
الخطوة 4: تشغيل التحليل
- انقر على زر التحليل
- انتظر حتى يكتمل التحليل (عادةً 1-3 ثواني)
- راجع الكيانات المكتشفة في لوحة النتائج
فهم النتائج
بعد التحليل، تظهر كل كيان مكتشف:
الموقع: الأحرف
حقول النتائج
- نوع الكيان - فئة المعلومات الشخصية المكتشفة (شخص، بريد إلكتروني، إلخ) - The category of PII detected (PERSON, EMAIL, etc.)
- النص - النص الفعلي الذي تم تحديده كمعلومات شخصية - The actual text that was identified as PII
- درجة الثقة - مدى تأكد النظام (0-100%) - How certain the system is (0-100%)
- الموقع - مواقع الأحرف البداية والنهاية - Start and end character positions
عتبة الثقة
قم بضبط عتبة الثقة للتحكم في الحساسية:
| العتبة | التأثير | أفضل للاستخدام |
|---|---|---|
| منخفض | المزيد من الكيانات المكتشفة، المزيد من الإيجابيات الكاذبة | أقصى تغطية، مراجعة يدوية |
| افتراضي | توازن بين الاكتشاف والدقة | الاستخدام العام |
| مرتفع | عدد أقل من الكيانات، ثقة أعلى | معالجة تلقائية |
| مرتفع جدًا | مطابقات موثوقة جدًا فقط | تدخل الحد الأدنى |
اختيار النتائج
بعد التحليل، يمكنك تحسين الكيانات التي ترغب في تمويهها:
تحديد/إلغاء تحديد الكل
- استخدم مربع الاختيار في العنوان لتحديد أو إلغاء تحديد جميع النتائج
- فقط الكيانات المحددة سيتم تمويهها
اختيار فردي
- انقر على مربعات الاختيار الفردية لتضمين/استبعاد كيانات معينة
- مفيد عندما يكتشف المحلل إيجابيات كاذبة
- مفيد عندما تريد الاحتفاظ بمعلومات معينة مرئية
تصفية حسب النوع
- انقر على شارة نوع الكيان لتصفية النتائج حسب ذلك النوع
- حدد/ألغِ تحديد جميع الكيانات من نوع معين بسرعة
راجع النتائج قبل التمويه. قد يكتشف المحلل أحيانًا إيجابيات كاذبة، خاصةً للأسماء التي هي أيضًا كلمات شائعة.
Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.
تكاليف الرموز
تستهلك عمليات التحليل الرموز بناءً على:
Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found
Final = ceil(Cost × 0.5)
Where:
text_k= طول النصentities_enabled= الكياناتentities_found= number of entities detected
التكلفة النموذجية
| طول النص | الكيانات | التكلفة النموذجية |
|---|---|---|
| 100 characters | 3 types, 2 found | 2 tokens |
| 1,000 characters | 5 types, 5 found | 3 tokens |
| 5,000 characters | 10 types, 15 found | 6 tokens |
| 10,000 characters | 15 types, 30 found | 10 tokens |
وثائق نظام الرموز Token System documentation for complete pricing details.
أفضل الممارسات
استكشاف الأخطاء
لم يتم اكتشاف الكيان؟
- تأكد من تمكين نوع الكيان في اختيارك
- حاول خفض عتبة الثقة
- تحقق من أن اللغة الصحيحة قد تم اختيارها
- تحقق من أن تنسيق النص يتوافق مع الأنماط المتوقعة
الكثير من الإيجابيات الكاذبة؟
- زيادة عتبة الثقة
- إلغاء تحديد أنواع الكيانات العامة مثل الموقع
- استخدم الإعدادات المسبقة الخاصة بالكيانات بدلاً من تحديد الكل
التحليل يستغرق وقتًا طويلاً؟
- قم بتقسيم النصوص الكبيرة إلى قطع أصغر
- قلل من عدد أنواع الكيانات المحددة
- استخدم الإعدادات المسبقة لتجنب تحميل نماذج الكشف غير المستخدمة
Next Steps
آخر تحديث: مارس 2026