クラスター分析 | リサーチ・市場調査・マーケティング

クラスター分析

クラスター分析のポイント

  • クラスター分析は類似した質問項目(カテゴリー)や回答者をグルーピングする分析手法です。

  • 対象者の意識や行動から、アンケート調査の直接的な質問項目だけでは分けきれない潜在的な変数を類似性の中から発見し分類する「多変量解析」の手法のひとつです。

  • 新たに分類されたグループごとのクロス集計分析などから意識や行動面の特徴をさらに深掘りすることで、自社のターゲットを再設定し、より効果的なターゲットアプローチ手法を探ることが可能になります。

 

 マーケティングミックス(戦略)においてターゲット戦略は重要な課題です。顧客データベースを整備し購買履歴や様々なアンケートデータも駆使して、重点ターゲットの設定と有効なアプローチの施策の立案に日々頭を悩ませておられる企業様も多いことかと思います。特にライフスタイルが多様化した現在、従来のような切り口ではターゲットの姿が見えないとお考えの方も多いのではないでしょうか。
 そのようなターゲット戦略を考える上で、クラスター分析は性・年代、収入、職業、家族構成などのデモグラフィック属性ではなく、生活者の意識や行動特性でグループ分けを行う分析手法です。新たに抽出されたグルーピングの基準により、自社の商品やサービスへの購入率や購入意向率の高さ等とのクロス集計分析から、見込みユーザーとして可能性の高い重点ターゲットが発見できます。さらには重点ターゲットグループの情報感度やメディア接触状況、関心領域などを深掘りすることで、今後の有効なアプローチ展開につながるポイントが発見できます。
 クラスター分析とは「多変量解析」の一手法です。多変量解析は、目的変数(外的基準)と説明変数(内的基準)の因果関係を明らかにする手法と、質問項目や回答した対象者を整理、分類したり、類似度を明らかにする手法に大別され、前者を「目的変数(外的基準)のある手法」、後者を「目的変数(外的基準)をもたない手法」と言います。クラスター分析は、後者の「目的変数(外的基準)をもたない手法」であり、質問項目(カテゴリー)や回答者の類似性により分類・グルーピングする手法です。

【代表的な多変量解析の手法】

代表的な多変量解析の手法は、解析するデータによって以下のように分類されます。

【代表的な多変量解析の手法】

クラスター分析事例

 クラスター分析は、アンケート調査の質問項目(カテゴリー)や回答者を回答の類似性から分類しグルーピングする手法です。回答のされ方が類似している質問項目(カテゴリー)をグルーピングする方法を「変数クラスター分析」、回答の仕方が類似している回答者をグルーピングする方法を「サンプルクラスター分析」と呼びます。分析に際しては、回答サンプルごとのアンケートの回答データ(ロウデータ)から質問項目間、回答者間の距離を計算し、距離が近い(短い)ものを集めてグルーピングします。
 以下は、ファッションに対する志向を10人の人にアンケートにより回答してもらった回答データです。

 

【ファッションに対する志向(回答データ)】

【ファッションに対する志向(回答データ)】

 このデータから回答者をグルーピングする「サンプルクラスター分析」の手順をみてみましょう。
 クラスター分析は回答者間の距離を計算し、距離が近い(短い)もの同士を集めてグループ化する分析手法ですので、まずは距離の計算を行います。
 距離を算出する方法はいくつかありますが、最も一般的なものが「ユークリッド距離」の測定で、以下のような公式で求められます。

 下記のような回答データから「No.①と②の回答者間の距離(d)」の2乗をd²とする。
 d²=(x₁-y₁)²+(x₂-y₂)²+(x₃-y₃)²+(x₄-y₄)²+(x₅-y₅)²
 ここから、距離d=√d²

【回答データ】

【回答データ】

 前掲の回答データを用いて10人の回答者間の距離を計算すると以下のような結果になります。

【回答者間の距離】

【回答者間の距離】

 上記のサンプル間の距離からみると一番距離が近いのは「①と②」及び「⑥と⑦」です。まずは、この組み合わせをそれぞれ1つのグループと考えて[①,②]、[⑥,⑦]とします。近いとは言ってもグループ[①,②]及び[⑥,⑦]には、それぞれ2つの点が存在するので、このグループを代表する点(値)を1つ定めます。これを「合併後の距離計算」と言い、最短距離法、最長距離法、群平均法、重心法、ウォード法などいくつかの方法があります。これによって定められた新たなサンプルグループ[①,②]及び[⑥,⑦]の数値により他のサンプルとの距離を再計算し、最も近いサンプル同士のグループ化を繰り返し行っていきます。

 クラスター分析では、グループ化された結果を樹形図(デンドログラム)として表します。樹形図は距離の近いサンプル同士を矩形で結んでいきます。再計算を繰り返して合併されていくグループ同士も距離の近いものの順に並べられ矩形で結んでいき、樹の根から幹が形作られるように上方に向かって一つの幹になるまで計算を繰り返していきます。矩形の高さは結ばれたサンプル(グループ)間の距離の近さに比例して示します。前掲のファッション志向によるサンプルクラスター分析の結果は以下のような樹形図となります。

 この結果からサンプル全体を3つのグループに分けたいと思えば、3つの交点ができるよう横に分割線を引きます。この分割線の交点より下にあるサンプルが、そのグループに属するサンプルとなります。グループ数については、それぞれのグループの特徴が出るように分析者が決めます。一度3つのグループと見当をつけて各グループの特徴をみた結果により、再度4つに分けて分析を行うなど分析の精度を高めるための試行錯誤が必要になる場合もあります。
 クラスター分析によって分けられたグループを「クラスター(グループ)」と呼びます。今回の分析で得られた3つのクラスターの特徴をみるためにクラスターを表側としたクロス集計分析を改めて行い、クラスターに名前をつけます。各クラスターと分析の元となったファッション志向の結果をクロス集計したら下表のようになりました。本来は他の意識や行動に関する質問項目、属性項目等ともクロスして特徴を細かくみて、ネーミングやクラスター分析の精度を確認します。

【クラスタークロス集計表】

【クラスタークロス集計表】

 3つのクラスターをA,B,Cとすると、クラスターAは「モード」で「シック」なファッションに対する志向が強いので「モード・シック派」としました。同様にBは「トラッド派」、Cは「スポカジ派」と名づけました。

 変数クラスター分析については、変数間の距離の算出方法がサンプルクラスター分析とは異なり、変数間の相関係数( r )によって求められます。「変数間の距離d=1-r」の公式から、相関係数が大きく(関係性が強い)なればdは小さく(距離が近く)なります。変数間の距離が算出されれば、解析の手順はサンプルクラスター分析と同様です。

 

クラスター分析応用事例

 ある商品のターゲット層を「美容に対する意識」と「ワークライフバランス意識」でクラスター分析を行いました。分析の結果、「“ストイック”に仕事タイプ」「“何でも欲しがる”欲張りタイプ」「プライベート“のびのび充実”タイプ」「無関心“マイペース”タイプ」の4つのクラスターに分けられました。以下のようなポジショニングマップで表すと、各クラスターのボリュームとグルーピングの軸に対する位置関係が一目でみてとれます。

 クラスターのボリュームからすると「仕事タイプ」が狙い目のように思われますが、下記のようなクロス集計分析を行うことで、対象商品に対する購入意向が強い「欲張りタイプ」が注目すべきターゲットであることがわかります。また、接触媒体への傾向から媒体Dによるアプローチが有効であることも明らかになりました。

調査のご相談や見積りのお問い合せ、資料請求がございましたらお気軽にご連絡ください。