マーケティングリサーチ用語

ディシジョンツリー分析とは

ディシジョンツリー分析とは

ディシジョンツリー分析はデータマイニング手法の代表的手法です。
複雑で多岐に渡る生活者行動・意識から商品やサービスの購入・利用に影響の強い要因を分類して影響の強いものから「樹形図」と呼ばれるツリー構造の枝として分析結果が表現されます。

 ゲーム理論の「ゲーム木(game tree)」が原形と言われているディシジョンツリーは、1950年代に統計学者のエイブラハム・ワルドが統計学自体を「統計家」と「不確実性」のゲームとして捉え、統計的決定理論の体系化に取り組んだ際にゲーム理論とベイズ統計学の統合的アプローチを試みたところから導入され、意思決定の「決定」や命題判定の「選択」、事象の「分類」などを多段階で繰り返し行う際、その分岐の判定ごとに階層化して樹形図(tree diagram)として描き表すグラフ表現、構造モデルとして広く用いられています。

 決定理論におけるディシジョンツリーは、意思決定者が取り得る選択行動と相手(不確実性)の発生確率(主観確率)の分岐が多段にわたる際、これら分岐点を階層化して描き起こり得るすべての結論とそれぞれの期待値を算出し、期待効用が最大となる選択の経路(戦略)を求めるもので、データマイニングにおけるディシジョンツリーと表現のモデル構造は同じですが、分析の目的や意味は異なります。

 ここでは、生活者の購買行動に強い影響力をもつ要因を探索するデータマイニング手法としてのディシジョンツリー分析についてご紹介します。データマイニング手法としてのディシジョンツリー分析の活用範囲は広く、さまざまな業種、業態で利用されています。例えば、顧客別の購買履歴から自社の製品を購入している顧客の特徴を分析したり、金融機関の取引履歴から顧客属性別の貸し倒れリスクを測ったり、機械の動作ログから故障につながる指標を見つけ出したりといったことに有効的に活用されています。具体的には「樹形図」と呼ばれる樹木状のモデルを使って何らかの結果が記録されたデータセットを分類することで、目的となる結果に影響を与えた説明要因(原因)を分析し、そのモデル結果を利用して将来予測や今後取るべき戦略施策の検討を行います。

 ディシジョンツリー分析の分析対象は、ビジネス上の結果や購買履歴、ユーザー評価などの何らかの結果が記録されたデータとなります。そのようなデータセットには、分析の対象となる結果(ex.ある商品の購入有無等)とその原因となっていると予測される属性(ex.性別、年代、職業等)や行動・意識(ex.来店頻度、満足度評価等)が対になって記録されている必要があります。

 ディシジョンツリー分析では、このようなデータセットを結果とその属性、行動・意識に着目して逐次分割することで分析モデルを作成していきます。このデータセットの分割は、分割後のそれぞれのデータセットにおける結果の適合度が高くなるようなアルゴリズムで行われます。この分割時の結果の適合度の判定については、分析のアルゴリズムによって異なった基準が定められていますが、基本的な考え方は同じ結果のデータはできるだけ同じノード(枝分かれ)に行くように分割することです。

 例えば、ある商品の購買有無が分析対象の結果であれば、分割後のデータセットの一方には購入者のデータがより多く集まり、もう一方には非購入者のデータが多く集まるような属性と値を見つけ、その値でデータセットの分割を行います。

ディシジョンツリー分析アウトプット事例

 ディシジョンツリー分析によって導出された分析モデルを具体的に見てみましょう。下図は、ある商品の分析結果を示した樹形図です。「商品の購入有無」をメーカーや商品評価など多岐に渡る質問項目から影響の強さを分析しています。

 この結果から判断すると、この商品の購入決定には「安心感」を持ち「品質の良さ」へ満足することが強い影響力を持つようです。また、「安心感」が持てなくても「立地条件」が良ければ購入率を高める要素となり得ることも分かりました。今後のターゲット設定や訴求ポイントにこの2つの要素をどう絡めていくが重要と思われます。

ディシジョンツリー分析応用事例

 ディシジョンツリー分析が活用される代表的なビジネスシーンは、以下のようなものが挙げられます。

1.流通業、外食産業、金融サービス、EC・デジタルコンテンツ産業等リテール向け
 ①優良顧客の判別(顧客セグメンテーション)
 ②商品/サービス購入要因の把握(ロイヤリティの向上策)
 ③商品/サービス離脱要因の把握(離脱防止策)
 ④顧客の嗜好/選択基準の把握(ターゲティング)
 ⑤来店客予測/供給量調整(人員計画・在庫管理)

2.通信サービス業、工業製品製造業
 ①通信障害/機器故障原因の把握(サービス・生産効率の向上)
 ②不良品発生要因の把握(不良品コストの低減)
 ③不良品発生率の予測(生産計画の精度向上)

おすすめのコラム

マーケティングコラム

ディシジョンツリー分析の手順とビジネスへの適用処理

ビジネスでは、顧客の動向や商品の購買データなどを分析して、今後のビジネス活動に有効な情報を採掘するデータマイニングが頻繁に使われます
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
データマーケティングコラム

データマイニングの目的とおすすめな分析手法

年々ITが発展し、文字や映像、音声など膨大なデータが企業に集まっています。
# データマーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
デジタルマーケティングコラム

SNSで疲れるのはなぜか?データから読み解く利用実態と企業が考えるべき情報発信

SNSは日常的な情報収集やコミュニケーションの手段として定着しましたが、その一方で、利用に伴う心理的負担、いわゆる「SNS疲れ」を感じる人も少なくありません。こうした疲弊の背景には、単なる情報量の過多だけでなく、常にネットワークと接続されている環境そのものが利用者に負荷を与えていると考えられます。
# デジタルマーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム

アーリーアダプターとは?意味や特徴、イノベーターとの違いを解説

アーリーアダプターとは、新しい商品やサービスを比較的早い段階で受け入れる「初期採用者」を指す言葉です。マーケティングで用いられるイノベーター理論では、市場全体の13.5%を占め、製品普及の成否を左右する重要な層です。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム

平均値・中央値・最頻値の違いとは?データ分析での使い分けと注意点を解説

データ分析において、平均値や中央値といった指標は、数値の傾向を把握するうえで欠かせません。特にマーケティングでは、データの分布を踏まえてこれらを使い分けることが、意思決定の精度を左右します。本記事では、平均値・中央値・最頻値の違いと計算方法、数値の使い分け、注意点までを体系的に整理します。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
デジタルマーケティングコラム

キュレーションサイトとは?具体例やメリットをわかりやすく解説!

インターネット上の膨大な情報を効率的に整理し、ユーザーにとって有益なコンテンツを提供する「キュレーションサイト」。これらのサイトは、特定のテーマに基づいて情報を収集し、編集し、再構築することにより、新たな価値を生み出します。
# デジタルマーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム

AI翻訳の進化が「言葉の壁」を崩壊させた?これから必須になるマーケティング戦略も解説

AIの急速な進化により、異なる言語を話す人々の間に長く立ちふさがってきた「言葉の壁」は、いま急速に崩壊しつつあります。こうした変化は、マーケティングの世界にも大きな変革をもたらしています。言葉の壁が低くなることで、これまで手が届かなかった海外市場へのアプローチが、より現実的になってきているからです。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム

クラスター分析をわかりやすく解説!メリット、活用シーンから注意点まで

膨大なマーケティングデータを前に「どこから手を付ければいいかわからない」と感じることはありませんか。クラスター分析を使えば、隠れた傾向やセグメントを直感的に理解できます。今回は、クラスター分析の基本からメリット、活用シーン、注意点までをわかりやすく解説します。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
デジタルマーケティングコラム

アナログ回帰とは?Z世代がハマる要因と流行るコンテンツを紹介

アナログ回帰とは、デジタルが当たり前になった現代で、あえて手間や不完全さのあるアナログな体験に価値を見出す動きです。
# デジタルマーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
ご相談・お見積もり依頼
【法人・個人様】
フリーダイヤルでのお問い合わせ
0120-198-022
※ モニター様からのお電話でのお問い合わせは受け付けておりません。
資料ダウンロード