myhasher ハッシュ化仕様
myhasher は、CSV / TXT などのテキストデータに含まれるメールアドレスや電話番号を正規化し、
SHA-256 でハッシュ化するローカルアプリケーションです。
広告プラットフォーム連携や CRM データの匿名化では、
単にハッシュ化するだけでなく、ハッシュ化前のデータを適切に整えることが重要です。
myhasher では、同一データから安定して同一ハッシュ値を生成しやすくするため、
ハッシュ化前に正規化処理を行います。
基本仕様
- 対応ハッシュ方式: SHA-256
- 処理方式: ローカルPC上で実行
- 外部送信: なし(通常利用時)
- 対象データ例: メールアドレス、電話番号
元データと処理結果の一致率は、入力データの品質や正規化ルールに影響されます。
連携先のプラットフォーム仕様もあわせてご確認ください。
メールアドレスの正規化
メールアドレスは、表記ゆれを減らすため、以下のような処理を行ったうえでハッシュ化します。
- 前後の空白を削除
- 英字を小文字化
- 不要な空白を除去
- 正規化後の文字列を SHA-256 でハッシュ化
例
TEST@EXAMPLE.COM
↓
test@example.com
↓
SHA-256 でハッシュ化
電話番号の正規化
myhasher では電話番号の正規化モードを2種類用意しています。
利用用途に応じて選択できます。
JP_DIGITS
日本国内の電話番号を数字のみの形式に正規化します。
- ハイフンなどの記号を除去
- 数字のみの形式に変換
- 正規化後の文字列を SHA-256 でハッシュ化
090-1234-5678
↓
09012345678
↓
SHA-256
E164_JP
日本の電話番号を E.164 形式に変換してからハッシュ化します。
- 国内番号の先頭の
0 を除去
- 国番号
+81 を付加
- 正規化後の文字列を SHA-256 でハッシュ化
090-1234-5678
↓
+819012345678
↓
SHA-256
E.164 形式は広告プラットフォームやデータ連携で広く使用される電話番号表記形式です。
ハッシュ化について
myhasher では、不可逆ハッシュである SHA-256 を使用しています。
- 同じ入力値からは同じハッシュ値が生成されます
- 元データをハッシュ値から復元することはできません
- 匿名化や照合用途に利用できます
ローカル処理とデータの安全性
myhasher はローカルPC上で動作し、通常利用時に処理対象データを外部サーバーへ送信しません。
- CSV / TXT の内容を外部送信しません
- ハッシュ化前データをクラウド保存しません
- 処理はユーザーのPC上で完結します
ご注意
- 連携先サービスによって、推奨される正規化方法や形式が異なる場合があります
- 入力データに不要文字や形式ゆれが多い場合、期待した照合結果にならないことがあります
- 実運用前に少量データで確認することをおすすめします
関連ページ