محلل PII

كشف المعلومات الشخصية القابلة للتحديد في نصك

يقوم محلل PII بفحص نصك وتحديد المعلومات الحساسة مثل الأسماء، والبريد الإلكتروني، وأرقام الهواتف، والعناوين، والمزيد.

كيف يعمل

يستخدم المحلل طرق اكتشاف متعددة لتحديد المعلومات الشخصية:

مطابقة الأنماط

تكتشف التعبيرات العادية البيانات المهيكلة مثل عناوين البريد الإلكتروني، وأرقام الهواتف، وبطاقات الائتمان، وأرقام IBAN بدقة عالية.

تعلم الآلة (NER)

تحدد نماذج التعرف على الكيانات المسماة الكيانات المعتمدة على السياق مثل أسماء الأشخاص، والمنظمات، والمواقع باستخدام spaCy وStanza وTransformers.

تحقق من صحة المجموع الاختباري

تتم التحقق من صحة بطاقات الائتمان، وأرقام IBAN، وغيرها من المعرفات المالية باستخدام خوارزميات المجموع الاختباري (Luhn، MOD-97) لتقليل الإيجابيات الكاذبة.

استخدام المحلل

الخطوة 1: أدخل نصك

انتقل إلى صفحة التمويه
الصق أو اكتب نصك في منطقة الإدخال
تظهر الواجهة عدد الأحرف وتقدير الرموز

الخطوة 2: اختر أنواع الكيانات

اختر أنواع المعلومات الشخصية التي ترغب في اكتشافها:

أنواع الكيانات	ندعم 256 نوعًا من الكيانات منظمة في 10 فئات:	النص - النص الفعلي الذي تم تحديده كمعلومات شخصية
شخصية - الأسماء، والبريد الإلكتروني، وأرقام الهواتف، وتواريخ الميلاد	PERSON, EMAIL_ADDRESS, PHONE_NUMBER	John Doe, john@email.com
مالية - بطاقات الائتمان، وحسابات البنوك، ورقم IBAN، ومحافظ العملات المشفرة	CREDIT_CARD, IBAN_CODE, SWIFT_CODE	4111-1111-1111-1111
موقع - العناوين، والمدن، والدول، والإحداثيات	LOCATION, ADDRESS, COORDINATES	123 Main St, New York
حكومية - رقم الضمان الاجتماعي، وأرقام جوازات السفر، ورخص القيادة، والهويات الوطنية	SSN, PASSPORT, DRIVER_LICENSE	123-45-6789
تقني - عناوين IP، وعناوين MAC، ومعرفات الأجهزة	IP_ADDRESS, MAC_ADDRESS	192.168.1.1

بدلاً من اختيار الكيانات يدويًا، استخدم الإعدادات المسبقة لتطبيق تكوينات الكيانات الشائعة بسرعة مثل "الامتثال لـ GDPR" أو "البيانات المالية".

Instead of selecting entities manually, use الإعدادات المسبقة to quickly apply common entity configurations like "GDPR Compliance" or "Financial Data".

الخطوة 3: اختر اللغة

اختر لغة نصك للحصول على دقة اكتشاف مثالية:

الكشف التلقائي - دع النظام يحدد اللغة - Let the system determine the language
لغة محددة - اختر من 27 لغة مدعومة - Select from 27 supported languages

اختيار اللغة مهم

اختيار اللغة الصحيحة يحسن بشكل كبير من دقة الاكتشاف، خاصة لأسماء الأشخاص والمواقع.

الخطوة 4: تشغيل التحليل

انقر على زر التحليل
انتظر حتى يكتمل التحليل (عادةً 1-3 ثواني)
راجع الكيانات المكتشفة في لوحة النتائج

فهم النتائج

بعد التحليل، تظهر كل كيان مكتشف:

PERSONJohn Doeالثقة

الموقع: الأحرف

حقول النتائج

نوع الكيان - فئة المعلومات الشخصية المكتشفة (شخص، بريد إلكتروني، إلخ) - The category of PII detected (PERSON, EMAIL, etc.)
النص - النص الفعلي الذي تم تحديده كمعلومات شخصية - The actual text that was identified as PII
درجة الثقة - مدى تأكد النظام (0-100%) - How certain the system is (0-100%)
الموقع - مواقع الأحرف البداية والنهاية - Start and end character positions

عتبة الثقة

قم بضبط عتبة الثقة للتحكم في الحساسية:

العتبة	التأثير	أفضل للاستخدام
منخفض	المزيد من الكيانات المكتشفة، المزيد من الإيجابيات الكاذبة	أقصى تغطية، مراجعة يدوية
افتراضي	توازن بين الاكتشاف والدقة	الاستخدام العام
مرتفع	عدد أقل من الكيانات، ثقة أعلى	معالجة تلقائية
مرتفع جدًا	مطابقات موثوقة جدًا فقط	تدخل الحد الأدنى

اختيار النتائج

بعد التحليل، يمكنك تحسين الكيانات التي ترغب في تمويهها:

تحديد/إلغاء تحديد الكل

استخدم مربع الاختيار في العنوان لتحديد أو إلغاء تحديد جميع النتائج
فقط الكيانات المحددة سيتم تمويهها

اختيار فردي

انقر على مربعات الاختيار الفردية لتضمين/استبعاد كيانات معينة
مفيد عندما يكتشف المحلل إيجابيات كاذبة
مفيد عندما تريد الاحتفاظ بمعلومات معينة مرئية

تصفية حسب النوع

انقر على شارة نوع الكيان لتصفية النتائج حسب ذلك النوع
حدد/ألغِ تحديد جميع الكيانات من نوع معين بسرعة

راجع النتائج قبل التمويه. قد يكتشف المحلل أحيانًا إيجابيات كاذبة، خاصةً للأسماء التي هي أيضًا كلمات شائعة.

Review results before anonymizing. The analyzer may occasionally detect false positives, especially for names that are also common words.

تكاليف الرموز

تستهلك عمليات التحليل الرموز بناءً على:

Cost = 2 + 1.0 × text_k + 0.2 × entities_enabled + 0.1 × entities_found

Final = ceil(Cost × 0.5)

Where:

text_k = طول النص
entities_enabled = الكيانات
entities_found = number of entities detected

التكلفة النموذجية

طول النص	الكيانات	التكلفة النموذجية
100 characters	3 types, 2 found	2 tokens
1,000 characters	5 types, 5 found	3 tokens
5,000 characters	10 types, 15 found	6 tokens
10,000 characters	15 types, 30 found	10 tokens

وثائق نظام الرموز Token System documentation for complete pricing details.

أفضل الممارسات

✅اختر فقط أنواع الكيانات التي تحتاجها - يقلل التكاليف والإيجابيات الكاذبة

✅استخدم الإعدادات المسبقة الخاصة باللغة للحصول على دقة أفضل في النصوص غير الإنجليزية

✅راجع النتائج قبل التمويه، خاصةً للأسماء والمواقع

✅استخدم عتبات ثقة أعلى للمعالجة التلقائية

✅قم بمعالجة النص في قطع معقولة (أقل من 10,000 حرف) للحصول على أفضل أداء

استكشاف الأخطاء

لم يتم اكتشاف الكيان؟

تأكد من تمكين نوع الكيان في اختيارك
حاول خفض عتبة الثقة
تحقق من أن اللغة الصحيحة قد تم اختيارها
تحقق من أن تنسيق النص يتوافق مع الأنماط المتوقعة

الكثير من الإيجابيات الكاذبة؟

زيادة عتبة الثقة
إلغاء تحديد أنواع الكيانات العامة مثل الموقع
استخدم الإعدادات المسبقة الخاصة بالكيانات بدلاً من تحديد الكل

التحليل يستغرق وقتًا طويلاً؟

قم بتقسيم النصوص الكبيرة إلى قطع أصغر
قلل من عدد أنواع الكيانات المحددة
استخدم الإعدادات المسبقة لتجنب تحميل نماذج الكشف غير المستخدمة

Next Steps

دليل التمويه

تعلم كيفية تمويه الكيانات المكتشفة

الإعدادات المسبقة

احفظ وأعد استخدام تكوينات الكيانات

آخر تحديث: مارس 2026