왜 AI가 아닌 정규 표현식인가요?
규제 준수를 위해 설명하고 재현할 수 있는 결과가 필요합니다. 우리의 결정론적 접근 방식이 바로 그것을 제공합니다—블랙 박스 없이, 놀라움 없이.
상세 비교
| Aspect | 정규 표현식 기반 (우리) | AI/ML 기반 |
|---|---|---|
| 재현성 | 100% 동일한 결과 | 결과가 다를 수 있음 |
| 감사 가능성 | 완전한 설명 가능 | 블랙 박스 |
| 훈련 데이터 | 필요 없음 | 대규모 데이터 세트 필요 |
| 모델 드리프트 | 없음—패턴이 고정됨 | 시간에 따라 저하 |
| 성능 | 빠르고 예측 가능 | 변동성, GPU 의존 |
| 컴퓨팅 비용 | 낮음 (CPU 전용) | 높음 (GPU 필요할 수 있음) |
| 규제 준수 | 입증하기 쉬움 | 입증하기 어려움 |
패턴 매칭 작동 방식
각 엔터티 유형은 특정 형식에 맞는 정교하게 제작된 정규 표현식 패턴을 가지고 있습니다.
이메일 주소
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}표준 이메일 형식과 일치: local-part@domain.tld
신용 카드 번호
\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\bVisa, Mastercard, Amex 및 Luhn 검증이 포함된 기타 카드 형식과 일치
독일 IBAN
DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}선택적 공백이 있는 독일 IBAN 형식과 일치
준수를 위해 구축됨
감사자가 "왜 이게 탐지되었나요?"라고 물을 때, 명확한 답변이 필요합니다. 우리의 정규 표현식 기반 접근 방식이 바로 그것을 제공합니다.
- GDPR 제25조: 설명 가능한 처리로 설계된 프라이버시
- ISO 27001: 문서화된, 반복 가능한 프로세스
- 감사 추적: 모든 탐지는 특정 패턴에 추적 가능
예시 감사 응답
Q: "john.smith@company.com"이 왜 플래그가 되었나요?
A: 신뢰도 0.95로 위치 45-68에서 이메일 패턴과 일치했습니다. 패턴: 표준 이메일 형식 검증.
오픈 소스 기반
전 세계 수천 개의 조직이 신뢰하는 업계 최고의 오픈 소스 기술로 구축되었습니다.
Microsoft Presidio
Microsoft에서 개발한 기업 수준의 PII 탐지 및 익명화 엔진으로, 여러 언어에서 민감한 데이터의 정확한 식별을 제공합니다.
github.com/microsoft/presidio모든 상표는 해당 소유자의 재산입니다. 우리의 서비스 약관 에 대한 전체 저작권을 참조하세요.