HubSpotには標準でデータクレンジングの機能がそろっています。検索で「HubSpot データクレンジング」「HubSpot 重複 削除」を調べているチームがまず確認したいのは、標準機能でどこまでできて、どこから手作業や別の仕組みが必要になるかです。この記事では、HubSpot標準のデータ品質機能を紹介し、足りなくなりやすい範囲とSankaでの補い方まで整理します。
HubSpot標準のデータクレンジング機能
HubSpotは、主にData Hub(旧Operations Hub)で次のデータ品質機能を提供しています。
| 機能 | 内容 |
|---|---|
| 重複管理ツール | 重複の可能性がある企業・取引先を検出し、レビューしてマージできる |
| データ品質コマンドセンター | 重複、書式の問題、欠落・エンリッチメント不足、プロパティの異常を1か所で監視 |
| 書式の自動修正 | 氏名の大文字小文字など、プロパティの書式ゆれをワークフローで整える |
| プロパティ検証ルール | 入力時の形式や必須を検証し、汚れたデータの流入を抑える |
重複管理ツールは、次のプロパティをもとに重複候補をフラグします。
- 取引先(コンタクト):姓、名、メールアドレス、IPの国、電話番号、郵便番号、会社名
- 企業:会社のドメイン名、会社名、国・地域、電話番号、業界
できる範囲と上限
HubSpot標準でも、次のような運用なら十分に回ります。
| 向いているケース | 補足 |
|---|---|
| 企業・取引先の重複レビュー | AIが重複候補を提示し、画面でマージできる |
| 書式の統一 | 氏名や表記の書式ゆれをワークフローで整える |
| データ品質の可視化 | コマンドセンターで重複・欠落・異常を俯瞰できる |
ただし、いくつかの上限があります。
- 重複管理ツールやコマンドセンターは、Data Hub(Professional以上)の機能
- 重複候補の表示には日次上限がある(Professionalは1日あたり最大5,000件、Enterpriseは最大10,000件)
- 検出・マージの対象は基本的に企業・取引先のみ
足りなくなりやすいケース
クレンジングを継続運用したり、CRMをまたいで整えたりすると、次の制約に当たります。
| ケース | 起きやすい課題 | Sankaで整理すること |
|---|---|---|
| 取引・チケット・カスタムオブジェクトの重複 | 標準の重複検出は企業・取引先が中心 | CRM全体の重複・不整合を1つのキューに集約します |
| 関連付けのリンク切れ | 重複管理は関連付けの破綻までは追わない | 企業・取引先・取引の関連付けの欠落・破綻を検知します |
| CRM横断の不一致 | HubSpot単体では他システムの値と突き合わせできない | HubSpot・Salesforce・バックオフィスを横断してスキャンします |
| 信頼すべき情報源の競合 | 項目ごとにどちらを優先するか標準では決めにくい | 項目ごとに情報源ポリシーを定義し、競合はキューへ送ります |
| ルールでの一括修正 | 手動マージ中心で、チーム横断の一貫ルールにしづらい | 正規化・マージ・再割当てをルール化し、個別/一括で実行します |
| 監査証跡 | 誰が何を・なぜ変えたかの記録が残りにくい | 各変更を理由・レビュー担当・タイムスタンプ付きで記録します |
判断基準
次の質問に2つ以上当てはまるなら、HubSpot標準に加えてクレンジングの仕組みを設計した方がよいです。
- 取引・チケット・カスタムオブジェクトにも重複が溜まっている
- 関連付けのリンク切れが見つかっている
- HubSpotとSalesforce、またはバックオフィスで同じ会社の値が食い違う
- マージや再割当てが属人化していて、一貫したルールにできていない
- 誰が何を変えたかの監査証跡を残したい
SankaでHubSpotクレンジングを拡張する
Sankaは、ClaudeやCodexからHubSpotのデータをスキャンし、重複・欠落・不整合・リンク切れを1つのキューに集約します。承認した修正だけを、監査証跡付きでHubSpotへ書き戻します。Salesforceを含むCRM横断のクレンジングや、取引・チケット・カスタムオブジェクトまで対象にできます。
具体的な進め方はHubSpotのデータをSankaでクレンジングする、MCP経由での操作範囲はHubSpotのMCPでできること【2026年最新】をご確認ください。