कैसे anonymize.today काम करता है

निश्चित, regex-आधारित PII पहचान जो 100% पुनरुत्पादनीय परिणाम देती है। वही इनपुट, वही आउटपुट—हर बार। कोई AI नहीं, कोई अनुमान नहीं, केवल पारदर्शी पैटर्न मिलान।

क्यों Regex, AI नहीं?

हमारा दृष्टिकोण

  • 100% पुनरुत्पादनीय परिणाम
  • अनुपालन के लिए पूरी तरह से ऑडिट करने योग्य
  • कोई प्रशिक्षण डेटा आवश्यक नहीं
  • पारदर्शी निर्णय लेना
  • तेज़, पूर्वानुमानित प्रदर्शन
  • समय के साथ कोई मॉडल ड्रिफ्ट नहीं

AI/ML दृष्टिकोण

  • परिणाम रन के बीच भिन्न होते हैं
  • ब्लैक बॉक्स निर्णय लेना
  • प्रशिक्षण डेटा की आवश्यकता होती है
  • ऑडिट करना कठिन
  • उच्च कंप्यूट लागत
  • समय के साथ मॉडल ड्रिफ्ट

10-चरणीय प्रक्रिया

इनपुट से आउटपुट तक, यहाँ आपके दस्तावेज़ के साथ क्या होता है

1

इनपुट पाठ

अपने दस्तावेज़ को वेब इंटरफ़ेस, API, या Word ऐड-इन के माध्यम से सबमिट करें

2

भाषा पहचान

सिस्टम दस्तावेज़ की भाषा की पहचान करता है ताकि अनुकूल प्रसंस्करण हो सके

3

टोकनाइजेशन

पाठ को पैटर्न मिलान के लिए टोकनों में तोड़ा जाता है

4

पैटर्न मिलान

Regex पैटर्न 256 एंटिटी प्रकारों के लिए स्कैन करते हैं

5

संदर्भ विश्लेषण

आसपास के पाठ से पहचान सटीकता में सुधार होता है

6

विश्वास स्कोरिंग

प्रत्येक पहचान को एक विश्वास स्कोर मिलता है

7

एंटिटी वर्गीकरण

पहचाने गए आइटमों को प्रकार के अनुसार वर्गीकृत किया जाता है

8

परिणामों की समीक्षा करें

सभी पहचान को स्थिति और स्कोर के साथ देखें

9

अनामकरण लागू करें

अपनी विधि चुनें: प्रतिस्थापित करें, संपादित करें, हैश करें, एन्क्रिप्ट करें, या मास्क करें

10

आउटपुट दस्तावेज़

अपने अनामित दस्तावेज़ को डाउनलोड करें

अक्सर पूछे जाने वाले प्रश्न

anonymize.today PII पहचान के लिए AI के बजाय regex का उपयोग क्यों करता है?
Regex-आधारित पहचान 100% पुनरुत्पादनीय परिणाम देती है — वही इनपुट हमेशा वही आउटपुट उत्पन्न करता है। AI और मशीन लर्निंग मॉडल विभिन्न रन के बीच विभिन्न परिणाम उत्पन्न कर सकते हैं, समय के साथ मॉडल ड्रिफ्ट से प्रभावित होते हैं, और ऐसे ब्लैक बॉक्स के रूप में कार्य करते हैं जिन्हें ऑडिट करना कठिन होता है। GDPR और ISO 27001 के तहत नियामक अनुपालन के लिए, संगठनों को समझने योग्य, पुनरावृत्त प्रक्रियाओं की आवश्यकता होती है, जो कि regex-आधारित पैटर्न मिलान प्रदान करता है।
PII पहचान कितनी सटीक है?
anonymize.today प्रत्येक पहचान के लिए 0.0 से 1.0 के बीच विश्वास स्कोर प्रदान करता है। उपयोगकर्ता संवेदनशीलता को नियंत्रित करने के लिए न्यूनतम विश्वास थ्रेशोल्ड सेट कर सकते हैं। पैटर्न-आधारित संस्थाएँ जैसे क्रेडिट कार्ड नंबर और SSN 95-99% सटीकता प्राप्त करते हैं, जबकि NLP-आधारित संस्थाएँ जैसे नाम और स्थान 85-95% सटीकता प्राप्त करती हैं। प्लेटफ़ॉर्म प्रत्येक के लिए सावधानीपूर्वक तैयार किए गए पैटर्न के साथ 256 संस्थाओं के प्रकारों का समर्थन करता है।
क्या मैं ऑडिट कर सकता हूँ कि anonymize.today मेरे डेटा को कैसे प्रोसेस करता है?
हाँ, anonymize.today में प्रत्येक पहचान सटीक पैटर्न, विश्वास स्कोर, और पहचानी गई संस्थाओं के प्रकार को दिखाती है। एनालाइज़र श्रेणी-विशिष्ट रंगों और पाठ के भीतर स्थितियों के साथ पहचानी गई संस्थाओं को उजागर करता है। यह पूर्ण पारदर्शिता ऑडिटर्स, अनुपालन अधिकारियों, या डेटा संरक्षण प्राधिकरणों को पहचान निर्णयों को स्पष्ट करने में आसान बनाती है।
प्रोसेसिंग के दौरान मेरे डेटा के साथ क्या होता है?
anonymize.today पर प्रस्तुत पाठ को TLS 1.3 एन्क्रिप्टेड कनेक्शनों के माध्यम से जर्मनी में ISO 27001-प्रमाणित सर्वरों पर भेजा जाता है। पाठ को Microsoft Presidio का उपयोग करके मेमोरी में प्रोसेस किया जाता है, और परिणाम तुरंत लौटाए जाते हैं। प्रोसेसिंग के बाद सर्वरों पर कोई उपयोगकर्ता सामग्री संग्रहीत नहीं की जाती है। डेटा कभी भी यूरोपीय संघ से बाहर नहीं जाता।
anonymize.today एक पाठ में कई भाषाओं को कैसे संभालता है?
anonymize.today स्वचालित भाषा पहचान का समर्थन करता है ताकि दस्तावेज़ की प्राथमिक भाषा की पहचान की जा सके। बहुभाषी पाठों के लिए, उपयोगकर्ता भाषा सीमाओं के पार संस्थाओं के प्रकारों को संयोजित करने के लिए कस्टम प्रीसेट बना सकते हैं। प्लेटफ़ॉर्म 27 PII पहचान भाषाओं का समर्थन करता है, जिसमें spaCy, Stanza, और Transformer मॉडल शामिल हैं, जो एक ही दस्तावेज़ के भीतर जर्मन कर आईडी, फ्रेंच NIR नंबर, या जापानी My Number आईडी जैसी देश-विशिष्ट संस्थाओं की पहचान करने में सक्षम बनाता है।

इसे क्रियान्वित होते देखें

300 टोकन प्रति माह के साथ हमारी PII पहचान और अनामकरण को मुफ्त में आजमाएँ।