相関分析とは?Excelでのやり方と結果の見方を解説
公開日:
相関分析とは:2つのデータの「関係性の強さ」を数値化する手法
相関分析とは、2つの変数(データ)の間にある関係性の有無や、その結びつきの強さを数値として可視化する統計的な手法です。
具体的には、「広告費と売上」や「気温とアイスの販売数」といった2つの要素にどのような関連があるかを調べる際に用いられます。相関分析の主な目的は、一方のデータが変化したときに、もう一方がどのように変化するのかを客観的に把握することです。
この関係の強さは「相関係数」という-1.0から+1.0までの指標で示されます。相関係数は、将来予測や施策の根拠として活用されるため、データ活用を推進するビジネスの現場では重要な意味を持ちます。データ分析を実務に活かすためにも、まずは相関関係の基本的な捉え方を整理しておく必要があります。
相関分析でわかる3つの関係パターン
相関分析を実施すると、2つのデータの関係性は主に「正の相関」「負の相関」「無相関」の3つのパターンに分けられます。
| パターン | 特徴 | 散布図の形状 | 相関係数の値 |
|---|---|---|---|
| 正の相関 | 片方が増えるともう片方も増える | 右肩上がり | 0より大きい(+1に近いほど強い) |
| 負の相関 | 片方が増えるともう片方は減る | 右肩下がり | 0より小さい(-1に近いほど強い) |
| 無相関 |
2つのデータに関連が見られない | バラバラ | 0に近い |
特徴
散布図の形状
相関係数の値
特徴
散布図の形状
相関係数の値
特徴
散布図の形状
相関係数の値
単に相関の有無を見るだけでなく、データがどのような関係性を持っているのかを具体的に把握することが重要です。この3つのパターンを理解しておけば、散布図を見た瞬間にデータの傾向を直感的に捉え、算出された相関係数の意味を正しく解釈できるようになります。

正の相関:一方が増えるともう一方も増える関係
正の相関とは、2つの変数のうち片方が増加した際に、もう片方も増加する傾向にある関係を指します。
・ビジネスにおける具体例
企業の広告費と商品の売上高の関係などが代表的です。広告の露出を増やすほど商品の認知が高まり、結果として売上も伸びる、といったケースが該当します。
・散布図と数値の特徴
散布図では、点の分布が「右肩上がり」の直線に近い形になります。相関係数は0より大きい正の値(最大+1.0)で示され、数値が+1.0に近いほど強い結びつきがあることを意味します。
負の相関:一方が増えるともう一方は減少する関係
負の相関とは、片方の変数が増加した際に、もう片方は減少する傾向にある関係のことです。
・ビジネスにおける具体例
気温と暖房器具の販売台数の関係が挙げられます。気温が高くなるにつれて、暖房器具の需要が低下し、販売台数は減少していきます。また、マーケティングにおいては商品価格と販売数量の関係も、一般的には負の相関(価格が上がると需要が下がる)を示します。
・散布図と数値の特徴
散布図では、点が「右肩下がり」に分布します。相関係数は-1.0から0の間の負の値で表現され、-1.0に近いほど負の結びつきが強いと判断します。
無相関:2つのデータ間に明確な関係がない状態
無相関とは、片方の変数が変化しても、もう片方の増減に一定の法則性が認められない状態を指します。つまり、2つのデータ間にはっきりとした統計的な関係性がないことを意味します。
・ビジネスにおける具体例
個人の身長と年収のように、論理的に直接の関連性がないと考えられる組み合わせが該当します。
・散布図と数値の特徴
散布図は特定の方向に偏らず、全体にランダムに散らばって分布します。この場合、相関係数は0に近い値となり、統計的な関連性はないと結論づけられます。
ビジネスにおける相関分析の主な活用シーン
相関分析は、ビジネスにおける様々な場面で、客観的な根拠に基づいた意思決定をするために活用されています。売上データやWebサイトのアクセスログ、顧客アンケートの結果など、膨大な情報をマーケティング施策に活かす上で、相関分析による現状把握は欠かせない工程の一つです。
具体的にビジネスの現場でどのように役立つのか、主な2つの活用シーンをご紹介します。
成果に直結する変数を発見する
日々の業務で蓄積される売上、顧客情報、広告費、Webサイトのアクセスログなどの中から、どの要素がKPI(重要業績評価指標)に最も影響を与えているかを特定できます。
例えば、アンケートの各質問項目と総合満足度の関係を網羅的に分析すれば、どのポイントを改善すれば効率的に満足度を高められるか、優先順位をつけるための示唆が得られます。
仮説を客観的なデータで裏付ける
「Webサイトの滞在時間が長い顧客ほど、購入率が高いのではないか」といった仮説に対し、統計的な裏付けを与えます。相関分析は、個人の経験則や思い込みを「数値という共通言語」に置き換えるツールです。
強い相関が示されれば、施策の説得力が増し、社内やクライアントとの合意形成もスムーズに進むはずです。
Excelを使った相関分析の具体的な手順
Excelを活用することで、専門的な統計ソフトがなくても「視覚的確認(散布図)」と「数値的評価(相関係数)」の2つのステップで簡単に分析ができます。ここでは、その具体的な手順を確認していきます。
【Step1】散布図で全体像を把握する
まずはグラフ機能を使って、散布図を作成します。散布図は、2つの変数の関係性を視覚的に把握するためのグラフです。
・手順:データ範囲を選択し、「挿入」タブから散布図を選択。
・目的:相関係数を算出する前に、データ全体のばらつきや傾向を確認します。
これにより、データが右肩上がり(正の相関)か、右肩下がり(負の相関)か、といった大まかな関係性を直感的に把握できます。また、外れ値の有無、直線的ではない非線形な関係性にも気づくきっかけとなります。
【Step2】CORREL関数で相関係数を数値化する
散布図でデータの大まかな傾向を掴んだ後、その関係性の強さを数値で算出します。
・手法:CORREL(コーレル)関数を使用。
・操作:数式バーに「=CORREL(配列1, 配列2)」と入力し、比較したい2つのデータ範囲を指定。
これにより、2変数間の直線的な関係の強さを示す「ピアソンの積率相関係数」が算出されます。また、より多くの項目を同時に分析したい場合は、Excelのアドインツールの「データ分析」を用いることで、多数の変数間の相関を一覧化した「相関行列」を出力することも可能です。

分析結果を正しく解釈するための判断基準
算出された相関係数は、-1.0から+1.0までの値を取ります。その絶対値の大きさによって、相関の程度は一般的に以下の基準で判断されます。
- 0.7 ~ 1.0:強い相関
- 0.4 ~ 0.7:中程度の相関
- 0.2 ~ 0.4:弱い相関
- 0.0 ~ 0.2:ほとんど相関なし
解釈する上での留意点
ただし、これらの基準は絶対的なものではありません。分析対象の分野やデータの性質によって解釈は異なります。例えば、高い精度が求められる自然科学の実験データでは0.9以上の数値が重視されますが、マーケティングデータでは0.4程度の相関であっても有益な示唆が得られるケースもあります。
統計的有意性の確認
相関係数の算出において忘れてはならないのが、「p値(有意確率)」の確認です。たとえ相関係数が高くても、サンプルサイズ(データ数)が極端に少ない場合、その結果は偶然によるものである可能性があります。p値が有意水準(一般的には0.05)を下回っていることを確認し、統計的に意味のある相関であるかを判断する視点をもっておくとよいでしょう。
相関分析を行う際の注意点
相関分析はデータ間の関係性を把握する上で便利な手法ですが、結果の解釈を誤ると判断を読み違えるリスクもあります。分析結果を有効に活用するためには、特に以下の3点に注意が必要です。
1.相関関係と因果関係を混同しない
「相関関係がある=因果関係がある」とは必ずしも限りません。相関関係はあくまで2つの数値が共通の傾向があることを示したに過ぎません。
例えば、アイスの売上と熱中症の搬送者数には強い正の相関が見られますが、「アイスを食べたことが原因で熱中症が増えた」という因果関係は成立しません。この場合、気温の上昇という共通の原因が、両方の数値を同時に押し上げていると考えられます。
データ上に相関が認められたとしても、それが「原因と結果」の関係にあるのか、あるいは単に外部要因によって同じタイミングで変化しているだけなのかを判断するには、さらなる分析や専門的な知見による考察が欠かせません。
2.外れ値の影響を考慮する
分析対象の中に、他のデータから極端に乖離した「外れ値」が含まれている場合は注意が必要です。相関係数は特定のデータに強く影響を受ける性質があるため、たった一つの外れ値が存在するだけで、本来は無相関に近いデータであっても強い相関があるかのように錯覚してしまうリスクがあります。
そのため、算出された数値だけで判断せず、事前に散布図を作成して異常値の有無を確認することが重要です。それが入力ミスなのか、特殊な要因によるものなのかなどを精査した上で、そのデータ分析から除外するかどうかを慎重に検討しなければなりません。また、サンプル数(調査人数など)が極端に少ない場合も、偶然による影響が大きくなるため、結果の信頼性が低下する点にも留意が必要です。
3.疑似相関(見せかけの相関)を疑う
2つの変数の間に直接的な関係がないにもかかわらず、第3の因子の影響で相関があるように見える「疑似相関」にも注意が必要です。
例えば、「小学生の学力」と「身長」を比較すると、正の相関が見られることがあります。しかし、これは「学年(年齢)」が上がるという共通の要因によって双方が高くなっているに過ぎず、身長が学力を高めているわけではありません。
表面的な相関関係だけで結論を急ぐと、実態とは乖離した施策にリソースを投じることになりかねません。数値の背後にある構造を多角的に捉え、他に影響を及ぼしている要因がないかを探る視点が、精度の高い分析には不可欠です。
まとめ
相関分析は、2つのデータの関係性を客観的な数値で示す統計手法です。Excelを活用することで容易に分析でき、成果に直結する要因の特定や、仮説を検証するプロセスで広く活用されています。
分析結果を活用する際は、因果関係との混同や外れ値、疑似相関といった注意点を正しく理解しておく必要があります。算出された数値だけで判断するのではなく、データの分布や背景を多角的に考察することが、精度の高い分析を行うためには欠かせません。
関連ページ
