common.skipToContent

PII 익명화기

텍스트 구조를 유지하면서 민감한 데이터를 보호합니다.

PII 익명화기는 탐지된 엔티티를 다양한 방법으로 변환하여 민감한 정보를 보호합니다.


익명화 연산자

필요에 따라 적절한 연산자를 선택하세요:

대체

PII를 [PERSON] 또는 [EMAIL]과 같은 자리 표시자 텍스트로 대체합니다. 텍스트 가독성을 유지합니다.

John Doe → [PERSON]

최적의 사용: 사람이 읽을 수 있는 익명화된 텍스트

마스킹

PII를 부분적으로 숨깁니다. 예: ****@email.com 또는 John D***. 값을 숨기면서 형식을 보여줍니다.

john@email.com → j***@email.com

최적의 사용: 부분적인 가독성 유지

삭제

텍스트에서 PII를 완전히 제거합니다. 가장 공격적인 옵션입니다.

Contact John Doe at → Contact at

최적의 사용: 민감한 데이터의 완전한 제거

해시

PII를 SHA-256 해시로 변환합니다. 동일한 입력은 항상 동일한 해시를 생성하며, 데이터 분석에 유용합니다.

John Doe → a3f2b1c4d5...

최적의 사용: 고유성을 유지하면서 데이터 분석

암호화복원 가능

PII를 AES-256-GCM으로 암호화합니다. 나중에 암호화 키로 복호화할 수 있습니다.

John Doe → [ENC:a3f2b1c4...]

최적의 사용: 나중에 복원할 수 있는 임시 익명화


연산자 비교

연산자복원 가능형식 유지일관된 출력사용 사례
Replace아니오아니오익명화된 문서 공유
Mask아니오부분적고객 지원, 로그
Redact아니오아니오법적 문서, FOIA
Hash아니오아니오*데이터 분석, 중복 제거
Encrypt아니오키별임시 익명화

* 해시는 동일한 입력 값에 대해 일관된 출력을 생성합니다.


익명화기 사용하기

1단계: 먼저 분석하기

익명화하기 전에 텍스트를 분석하여 PII 개체를 탐지해야 합니다. 익명화기는 분석기의 결과에서 작동합니다.

2단계: 개체 선택

탐지된 개체 중 익명화할 개체를 검토하고 선택합니다:

  • 체크박스를 사용하여 개별 개체를 선택/선택 해제합니다.
  • 선택 해제된 개체는 출력에서 변경되지 않습니다.
  • 개체 유형 배지를 클릭하여 유형별로 대량 선택/선택 해제합니다.

3단계: 연산자 선택

익명화 방법을 선택합니다:

  • 전역 연산자: 선택된 모든 개체에 동일한 방법을 적용합니다. Applies the same method to all selected entities
  • 개체별 연산자: 서로 다른 개체 유형에 대해 서로 다른 방법을 설정합니다. Set different methods for different entity types

4단계: 옵션 구성

각 연산자는 구성 옵션이 있습니다:

대체 옵션
  • new_value - The replacement text (default: [ENTITY_TYPE])
마스크 옵션
  • masking_char - Character to use for masking (default: *)
  • chars_to_mask - Number of characters to mask
  • from_end - Mask from end instead of beginning
해시 옵션
  • hash_type - Algorithm to use (default: sha256)
암호화 옵션
  • Requires an encryption key configured in Settings
  • Uses AES-256-GCM encryption

5단계: 익명화 실행

  1. 익명화 버튼을 클릭합니다.
  2. 익명화된 출력을 검토합니다.
  3. 결과를 복사하거나 다운로드합니다.

암호화 및 복원

암호화 연산자는 복원 가능한 익명화를 가능하게 합니다. 동일한 암호화 키를 사용하여 원래 값을 복원할 수 있습니다.

암호화 키 설정

  1. Go to Settings → Security
  2. Under "Encryption Keys," click Add Key
  3. Enter a name and your secret key (32+ characters recommended)
  4. Save the key securely - it's required for deanonymization

키 보안

귀하의 암호화 키는 귀하의 계정에 암호화되어 저장됩니다. 키를 잃어버리면 암호화된 데이터를 복구할 수 없습니다.

텍스트 복원하기

  1. Go to the Deanonymize tab
  2. Paste text containing encrypted entities (e.g., [ENC:a3f2b1c4...])
  3. Select the encryption key used during anonymization
  4. Click Deanonymize
  5. The original values are restored

토큰 비용

익명화 작업은 다음을 기반으로 토큰을 소모합니다:

Cost = 1 + 0.2 × ops_count + 0.8 × encrypt_count + 0.1 × entities + 0.2 × text_k

Final = ceil(Cost × 0.5)

Where:

  • ops_count = number of anonymization operations
  • encrypt_count = number of encryption operations (higher cost)
  • entities = number of entities processed
  • text_k = text length in thousands of characters
작업일반적인 비용
Anonymize (apply only)1-5 tokens
Anonymize (full)2-15 tokens
Deanonymize1-4 tokens

모범 사례

공개적으로 공유될 문서에는 대체를 사용하세요.
부분적인 가독성을 유지해야 할 때 마스크를 사용하세요.
개체의 고유성을 유지하면서 데이터를 분석할 때 해시를 사용하세요.
나중에 원래 값을 복원해야 할 때만 암호화를 사용하세요.
암호화 키를 안전하게 보관하세요 - 키를 잃어버리면 암호화된 데이터에 대한 접근을 잃게 됩니다.
대규모 데이터 세트를 처리하기 전에 작은 샘플에서 익명화를 테스트하세요.

Related Documentation

마지막 업데이트: 2026년 3월