common.skipToContent

PII 匿名化ツール

テキスト構造を保持しながら機密データを保護

PII 匿名化ツールは、検出されたエンティティをさまざまな方法で変換して機密情報を保護します。


匿名化オペレーター

ニーズに基づいて適切なオペレーターを選択します:

置換

PIIを[PERSON]や[EMAIL]のようなプレースホルダーテキストに置き換えます。テキストの可読性を維持します。

John Doe → [PERSON]

最適な用途:人間が読める匿名化テキスト

マスク

PIIを部分的に隠します(例:****@email.comやJohn D***)。値を隠しながらフォーマットを表示します。

john@email.com → j***@email.com

最適な用途:部分的な可読性を維持

削除

テキストからPIIを完全に削除します。最も攻撃的なオプションです。

Contact John Doe at → Contact at

最適な用途:機密データの完全な削除

ハッシュ

PIIをSHA-256ハッシュに変換します。同じ入力は常に同じハッシュを生成し、データ分析に便利です。

John Doe → a3f2b1c4d5...

最適な用途:ユニーク性を保持しながらデータ分析

暗号化可逆

PIIをAES-256-GCMで暗号化します。後で暗号化キーで復号化できます。

John Doe → [ENC:a3f2b1c4...]

最適な用途:将来の復元を伴う一時的な匿名化


オペレーター比較

オペレーター可逆フォーマットを保持一貫した出力使用ケース
Replaceいいえいいえはい匿名化された文書の共有
Maskいいえ部分的はいカスタマーサポート、ログ
Redactいいえいいえはい法的文書、FOIA
Hashいいえいいえはい*データ分析、重複排除
Encryptはいいいえキーごと一時的な匿名化

* ハッシュは同じ入力値に対して一貫した出力を生成します


匿名化ツールの使用

ステップ 1: まず分析

匿名化する前に、テキストを分析してPIIエンティティを検出する必要があります。匿名化ツールはアナライザーの結果に基づいて動作します。

ステップ 2: エンティティを選択

検出されたエンティティの中から匿名化したいものを確認して選択します:

  • チェックボックスを使用して個別のエンティティを選択/選択解除します
  • 選択されていないエンティティは出力に変更されません
  • エンティティタイプバッジをクリックして、タイプごとに一括選択/選択解除します

ステップ 3: オペレーターを選択

匿名化方法を選択します:

  • グローバルオペレーター:選択されたすべてのエンティティに同じ方法を適用 Applies the same method to all selected entities
  • エンティティごとのオペレーター:異なるエンティティタイプに異なる方法を設定 Set different methods for different entity types

ステップ 4: オプションを設定

各オペレーターには設定オプションがあります:

置換オプション
  • new_value - The replacement text (default: [ENTITY_TYPE])
マスクオプション
  • masking_char - Character to use for masking (default: *)
  • chars_to_mask - Number of characters to mask
  • from_end - Mask from end instead of beginning
ハッシュオプション
  • hash_type - Algorithm to use (default: sha256)
暗号化オプション
  • Requires an encryption key configured in Settings
  • Uses AES-256-GCM encryption

ステップ 5: 匿名化を実行

  1. 匿名化ボタンをクリックします
  2. 匿名化された出力を確認します
  3. 結果をコピーまたはダウンロードします

暗号化と非匿名化

暗号化オペレーターは可逆的な匿名化を可能にします。同じ暗号化キーを使用して元の値を復元できます。

暗号化キーの設定

  1. Go to Settings → Security
  2. Under "Encryption Keys," click Add Key
  3. Enter a name and your secret key (32+ characters recommended)
  4. Save the key securely - it's required for deanonymization

キーのセキュリティ

あなたの暗号化キーは、アカウントに暗号化された状態で保存されます。キーを失うと、暗号化されたデータは回復できません。

テキストの非匿名化

  1. Go to the Deanonymize tab
  2. Paste text containing encrypted entities (e.g., [ENC:a3f2b1c4...])
  3. Select the encryption key used during anonymization
  4. Click Deanonymize
  5. The original values are restored

トークンコスト

匿名化操作は、次の基準に基づいてトークンを消費します:

Cost = 1 + 0.2 × ops_count + 0.8 × encrypt_count + 0.1 × entities + 0.2 × text_k

Final = ceil(Cost × 0.5)

Where:

  • ops_count = number of anonymization operations
  • encrypt_count = number of encryption operations (higher cost)
  • entities = number of entities processed
  • text_k = text length in thousands of characters
操作典型的なコスト
Anonymize (apply only)1-5 tokens
Anonymize (full)2-15 tokens
Deanonymize1-4 tokens

ベストプラクティス

公開される文書には置換を使用します
部分的な可読性を維持する必要がある場合はマスクを使用します
エンティティのユニーク性を保持しながらデータを分析する場合はハッシュを使用します
後で元の値を復元する必要がある場合のみ暗号化を使用します
暗号化キーを安全に保管してください - 失うと暗号化されたデータへのアクセスを失います
大規模なデータセットを処理する前に、小さなサンプルで匿名化をテストします

Related Documentation

最終更新日: 2026年3月