common.skipToContent

محلل PII

كشف المعلومات الشخصية القابلة للتحديد في نصك

يقوم محلل PII بفحص نصك وتحديد المعلومات الحساسة مثل الأسماء، والبريد الإلكتروني، وأرقام الهواتف، والعناوين، والمزيد.


كيف يعمل

يستخدم المحلل طرق اكتشاف متعددة لتحديد المعلومات الشخصية:

مطابقة الأنماط

تكتشف التعبيرات العادية البيانات المهيكلة مثل عناوين البريد الإلكتروني، وأرقام الهواتف، وبطاقات الائتمان، وأرقام IBAN بدقة عالية.

تعلم الآلة (NER)

تحدد نماذج التعرف على الكيانات المسماة الكيانات المعتمدة على السياق مثل أسماء الأشخاص، والمنظمات، والمواقع باستخدام spaCy وStanza وTransformers.

تحقق من صحة المجموع الاختباري

تتم التحقق من صحة بطاقات الائتمان، وأرقام IBAN، وغيرها من المعرفات المالية باستخدام خوارزميات المجموع الاختباري (Luhn، MOD-97) لتقليل الإيجابيات الكاذبة.


استخدام المحلل

الخطوة 1: أدخل نصك

  1. انتقل إلى صفحة التمويه
  2. الصق أو اكتب نصك في منطقة الإدخال
  3. تظهر الواجهة عدد الأحرف وتقدير الرموز

الخطوة 2: اختر أنواع الكيانات

اختر أنواع المعلومات الشخصية التي ترغب في اكتشافها:

أنواع الكياناتندعم 256 نوعًا من الكيانات منظمة في 10 فئات:النص - النص الفعلي الذي تم تحديده كمعلومات شخصية
شخصية - الأسماء، والبريد الإلكتروني، وأرقام الهواتف، وتواريخ الميلادPERSON, EMAIL_ADDRESS, PHONE_NUMBERJohn Doe, john@email.com
مالية - بطاقات الائتمان، وحسابات البنوك، ورقم IBAN، ومحافظ العملات المشفرةCREDIT_CARD, IBAN_CODE, SWIFT_CODE4111-1111-1111-1111
موقع - العناوين، والمدن، والدول، والإحداثياتLOCATION, ADDRESS, COORDINATES123 Main St, New York
حكومية - رقم الضمان الاجتماعي، وأرقام جوازات السفر، ورخص القيادة، والهويات الوطنيةSSN, PASSPORT, DRIVER_LICENSE123-45-6789
تقني - عناوين IP، وعناوين MAC، ومعرفات الأجهزةIP_ADDRESS, MAC_ADDRESS192.168.1.1

بدلاً من اختيار الكيانات يدويًا، استخدم الإعدادات المسبقة لتطبيق تكوينات الكيانات الشائعة بسرعة مثل "الامتثال لـ GDPR" أو "البيانات المالية".

Instead of selecting entities manually, use الإعدادات المسبقة to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

الخطوة 3: اختر اللغة

اختر لغة نصك للحصول على دقة اكتشاف مثالية:

  • الكشف التلقائي - دع النظام يحدد اللغة - Let the system determine the language
  • لغة محددة - اختر من 27 لغة مدعومة - Select from 27 supported languages

اختيار اللغة مهم

اختيار اللغة الصحيحة يحسن بشكل كبير من دقة الاكتشاف، خاصة لأسماء الأشخاص والمواقع.

الخطوة 4: تشغيل التحليل

  1. انقر على زر التحليل
  2. انتظر حتى يكتمل التحليل (عادةً 1-3 ثواني)
  3. راجع الكيانات المكتشفة في لوحة النتائج

فهم النتائج

بعد التحليل، تظهر كل كيان مكتشف:

PERSONJohn Doeالثقة

الموقع: الأحرف

حقول النتائج

  • نوع الكيان - فئة المعلومات الشخصية المكتشفة (شخص، بريد إلكتروني، إلخ) - The category of PII detected (PERSON, EMAIL, etc.)
  • النص - النص الفعلي الذي تم تحديده كمعلومات شخصية - The actual text that was identified as PII
  • درجة الثقة - مدى تأكد النظام (0-100%) - How certain the system is (0-100%)
  • الموقع - مواقع الأحرف البداية والنهاية - Start and end character positions

عتبة الثقة

قم بضبط عتبة الثقة للتحكم في الحساسية:

العتبةالتأثيرأفضل للاستخدام
منخفضالمزيد من الكيانات المكتشفة، المزيد من الإيجابيات الكاذبةأقصى تغطية، مراجعة يدوية
افتراضيتوازن بين الاكتشاف والدقةالاستخدام العام
مرتفععدد أقل من الكيانات، ثقة أعلىمعالجة تلقائية
مرتفع جدًامطابقات موثوقة جدًا فقطتدخل الحد الأدنى

اختيار النتائج

بعد التحليل، يمكنك تحسين الكيانات التي ترغب في تمويهها:

تحديد/إلغاء تحديد الكل

  • استخدم مربع الاختيار في العنوان لتحديد أو إلغاء تحديد جميع النتائج
  • فقط الكيانات المحددة سيتم تمويهها

اختيار فردي

  • انقر على مربعات الاختيار الفردية لتضمين/استبعاد كيانات معينة
  • مفيد عندما يكتشف المحلل إيجابيات كاذبة
  • مفيد عندما تريد الاحتفاظ بمعلومات معينة مرئية

تصفية حسب النوع

  • انقر على شارة نوع الكيان لتصفية النتائج حسب ذلك النوع
  • حدد/ألغِ تحديد جميع الكيانات من نوع معين بسرعة

راجع النتائج قبل التمويه. قد يكتشف المحلل أحيانًا إيجابيات كاذبة، خاصةً للأسماء التي هي أيضًا كلمات شائعة.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.


تكاليف الرموز

تستهلك عمليات التحليل الرموز بناءً على:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

  • text_k = طول النص
  • entities_enabled = الكيانات
  • entities_found = number of entities detected

التكلفة النموذجية

طول النصالكياناتالتكلفة النموذجية
100 characters3 types, 2 found2 tokens
1,000 characters5 types, 5 found3 tokens
5,000 characters10 types, 15 found6 tokens
10,000 characters15 types, 30 found10 tokens

وثائق نظام الرموز Token System documentation for complete pricing details.


أفضل الممارسات

اختر فقط أنواع الكيانات التي تحتاجها - يقلل التكاليف والإيجابيات الكاذبة
استخدم الإعدادات المسبقة الخاصة باللغة للحصول على دقة أفضل في النصوص غير الإنجليزية
راجع النتائج قبل التمويه، خاصةً للأسماء والمواقع
استخدم عتبات ثقة أعلى للمعالجة التلقائية
قم بمعالجة النص في قطع معقولة (أقل من 10,000 حرف) للحصول على أفضل أداء

استكشاف الأخطاء

لم يتم اكتشاف الكيان؟

  • تأكد من تمكين نوع الكيان في اختيارك
  • حاول خفض عتبة الثقة
  • تحقق من أن اللغة الصحيحة قد تم اختيارها
  • تحقق من أن تنسيق النص يتوافق مع الأنماط المتوقعة

الكثير من الإيجابيات الكاذبة؟

  • زيادة عتبة الثقة
  • إلغاء تحديد أنواع الكيانات العامة مثل الموقع
  • استخدم الإعدادات المسبقة الخاصة بالكيانات بدلاً من تحديد الكل

التحليل يستغرق وقتًا طويلاً؟

  • قم بتقسيم النصوص الكبيرة إلى قطع أصغر
  • قلل من عدد أنواع الكيانات المحددة
  • استخدم الإعدادات المسبقة لتجنب تحميل نماذج الكشف غير المستخدمة

Next Steps

آخر تحديث: مارس 2026