ログインログイン

ご相談・お見積り依頼 ご相談
お見積り依頼

資料DL 資料DL

検索 検索

ディシジョンツリー分析とは

  • ディシジョンツリー分析はデータマイニング手法の代表的手法です。
  • 複雑で多岐に渡る生活者行動・意識から商品やサービスの購入・利用に影響の強い要因を分類して影響の強いものから「樹形図」と呼ばれるツリー構造の枝として分析結果が表現されます。

 ゲーム理論の「ゲーム木(game tree)」が原形と言われているディシジョンツリーは、1950年代に統計学者のエイブラハム・ワルドが統計学自体を「統計家」と「不確実性」のゲームとして捉え、統計的決定理論の体系化に取り組んだ際にゲーム理論とベイズ統計学の統合的アプローチを試みたところから導入され、意思決定の「決定」や命題判定の「選択」、事象の「分類」などを多段階で繰り返し行う際、その分岐の判定ごとに階層化して樹形図(tree diagram)として描き表すグラフ表現、構造モデルとして広く用いられています。

 決定理論におけるディシジョンツリーは、意思決定者が取り得る選択行動と相手(不確実性)の発生確率(主観確率)の分岐が多段にわたる際、これら分岐点を階層化して描き起こり得るすべての結論とそれぞれの期待値を算出し、期待効用が最大となる選択の経路(戦略)を求めるもので、データマイニングにおけるディシジョンツリーと表現のモデル構造は同じですが、分析の目的や意味は異なります。

 ここでは、生活者の購買行動に強い影響力をもつ要因を探索するデータマイニング手法としてのディシジョンツリー分析についてご紹介します。データマイニング手法としてのディシジョンツリー分析の活用範囲は広く、さまざまな業種、業態で利用されています。例えば、顧客別の購買履歴から自社の製品を購入している顧客の特徴を分析したり、金融機関の取引履歴から顧客属性別の貸し倒れリスクを測ったり、機械の動作ログから故障につながる指標を見つけ出したりといったことに有効的に活用されています。具体的には「樹形図」と呼ばれる樹木状のモデルを使って何らかの結果が記録されたデータセットを分類することで、目的となる結果に影響を与えた説明要因(原因)を分析し、そのモデル結果を利用して将来予測や今後取るべき戦略施策の検討を行います。

 ディシジョンツリー分析の分析対象は、ビジネス上の結果や購買履歴、ユーザー評価などの何らかの結果が記録されたデータとなります。そのようなデータセットには、分析の対象となる結果(ex.ある商品の購入有無等)とその原因となっていると予測される属性(ex.性別、年代、職業等)や行動・意識(ex.来店頻度、満足度評価等)が対になって記録されている必要があります。

 ディシジョンツリー分析では、このようなデータセットを結果とその属性、行動・意識に着目して逐次分割することで分析モデルを作成していきます。このデータセットの分割は、分割後のそれぞれのデータセットにおける結果の適合度が高くなるようなアルゴリズムで行われます。この分割時の結果の適合度の判定については、分析のアルゴリズムによって異なった基準が定められていますが、基本的な考え方は同じ結果のデータはできるだけ同じノード(枝分かれ)に行くように分割することです。

 例えば、ある商品の購買有無が分析対象の結果であれば、分割後のデータセットの一方には購入者のデータがより多く集まり、もう一方には非購入者のデータが多く集まるような属性と値を見つけ、その値でデータセットの分割を行います。

ディシジョンツリー分析アウトプット事例

 ディシジョンツリー分析によって導出された分析モデルを具体的に見てみましょう。下図は、ある商品の分析結果を示した樹形図です。「商品の購入有無」をメーカーや商品評価など多岐に渡る質問項目から影響の強さを分析しています。

 この結果から判断すると、この商品の購入決定には「安心感」を持ち「品質の良さ」へ満足することが強い影響力を持つようです。また、「安心感」が持てなくても「立地条件」が良ければ購入率を高める要素となり得ることも分かりました。今後のターゲット設定や訴求ポイントにこの2つの要素をどう絡めていくが重要と思われます。

ディシジョンツリー分析応用事例

 ディシジョンツリー分析が活用される代表的なビジネスシーンは、以下のようなものが挙げられます。

1.流通業、外食産業、金融サービス、EC・デジタルコンテンツ産業等リテール向け
 ①優良顧客の判別(顧客セグメンテーション)
 ②商品/サービス購入要因の把握(ロイヤリティの向上策)
 ③商品/サービス離脱要因の把握(離脱防止策)
 ④顧客の嗜好/選択基準の把握(ターゲティング)
 ⑤来店客予測/供給量調整(人員計画・在庫管理)

2.通信サービス業、工業製品製造業
 ①通信障害/機器故障原因の把握(サービス・生産効率の向上)
 ②不良品発生要因の把握(不良品コストの低減)
 ③不良品発生率の予測(生産計画の精度向上)

Related Column/ 関連コラム

Cross Marketing ホーム

統計・分析手法

ディシジョンツリー分析