PII 익명화기
텍스트 구조를 유지하면서 민감한 데이터를 보호합니다.
PII 익명화기는 탐지된 엔티티를 다양한 방법으로 변환하여 민감한 정보를 보호합니다.
익명화 연산자
필요에 따라 적절한 연산자를 선택하세요:
대체
PII를 [PERSON] 또는 [EMAIL]과 같은 자리 표시자 텍스트로 대체합니다. 텍스트 가독성을 유지합니다.
최적의 사용: 사람이 읽을 수 있는 익명화된 텍스트
마스킹
PII를 부분적으로 숨깁니다. 예: ****@email.com 또는 John D***. 값을 숨기면서 형식을 보여줍니다.
최적의 사용: 부분적인 가독성 유지
삭제
텍스트에서 PII를 완전히 제거합니다. 가장 공격적인 옵션입니다.
최적의 사용: 민감한 데이터의 완전한 제거
해시
PII를 SHA-256 해시로 변환합니다. 동일한 입력은 항상 동일한 해시를 생성하며, 데이터 분석에 유용합니다.
최적의 사용: 고유성을 유지하면서 데이터 분석
암호화복원 가능
PII를 AES-256-GCM으로 암호화합니다. 나중에 암호화 키로 복호화할 수 있습니다.
최적의 사용: 나중에 복원할 수 있는 임시 익명화
연산자 비교
| 연산자 | 복원 가능 | 형식 유지 | 일관된 출력 | 사용 사례 |
|---|---|---|---|---|
| Replace | 아니오 | 아니오 | 예 | 익명화된 문서 공유 |
| Mask | 아니오 | 부분적 | 예 | 고객 지원, 로그 |
| Redact | 아니오 | 아니오 | 예 | 법적 문서, FOIA |
| Hash | 아니오 | 아니오 | 예* | 데이터 분석, 중복 제거 |
| Encrypt | 예 | 아니오 | 키별 | 임시 익명화 |
* 해시는 동일한 입력 값에 대해 일관된 출력을 생성합니다.
익명화기 사용하기
1단계: 먼저 분석하기
익명화하기 전에 텍스트를 분석하여 PII 개체를 탐지해야 합니다. 익명화기는 분석기의 결과에서 작동합니다.
2단계: 개체 선택
탐지된 개체 중 익명화할 개체를 검토하고 선택합니다:
- 체크박스를 사용하여 개별 개체를 선택/선택 해제합니다.
- 선택 해제된 개체는 출력에서 변경되지 않습니다.
- 개체 유형 배지를 클릭하여 유형별로 대량 선택/선택 해제합니다.
3단계: 연산자 선택
익명화 방법을 선택합니다:
- 전역 연산자: 선택된 모든 개체에 동일한 방법을 적용합니다. Applies the same method to all selected entities
- 개체별 연산자: 서로 다른 개체 유형에 대해 서로 다른 방법을 설정합니다. Set different methods for different entity types
4단계: 옵션 구성
각 연산자는 구성 옵션이 있습니다:
대체 옵션
new_value- The replacement text (default:[ENTITY_TYPE])
마스크 옵션
masking_char- Character to use for masking (default:*)chars_to_mask- Number of characters to maskfrom_end- Mask from end instead of beginning
해시 옵션
hash_type- Algorithm to use (default:sha256)
암호화 옵션
- Requires an encryption key configured in Settings
- Uses AES-256-GCM encryption
5단계: 익명화 실행
- 익명화 버튼을 클릭합니다.
- 익명화된 출력을 검토합니다.
- 결과를 복사하거나 다운로드합니다.
암호화 및 복원
암호화 연산자는 복원 가능한 익명화를 가능하게 합니다. 동일한 암호화 키를 사용하여 원래 값을 복원할 수 있습니다.
암호화 키 설정
- Go to Settings → Security
- Under "Encryption Keys," click Add Key
- Enter a name and your secret key (32+ characters recommended)
- Save the key securely - it's required for deanonymization
키 보안
귀하의 암호화 키는 귀하의 계정에 암호화되어 저장됩니다. 키를 잃어버리면 암호화된 데이터를 복구할 수 없습니다.
텍스트 복원하기
- Go to the Deanonymize tab
- Paste text containing encrypted entities (e.g.,
[ENC:a3f2b1c4...]) - Select the encryption key used during anonymization
- Click Deanonymize
- The original values are restored
토큰 비용
익명화 작업은 다음을 기반으로 토큰을 소모합니다:
Cost = 1 + 0.2 × ops_count + 0.8 × encrypt_count + 0.1 × entities + 0.2 × text_k
Final = ceil(Cost × 0.5)
Where:
ops_count= number of anonymization operationsencrypt_count= number of encryption operations (higher cost)entities= number of entities processedtext_k= text length in thousands of characters
| 작업 | 일반적인 비용 |
|---|---|
| Anonymize (apply only) | 1-5 tokens |
| Anonymize (full) | 2-15 tokens |
| Deanonymize | 1-4 tokens |
모범 사례
Related Documentation
마지막 업데이트: 2026년 3월