算出方法が誤解されやすいウエイトバック集計の正しいやり方 | リサーチ・市場調査・マーケティング

マーケティングコラム
2017/8/24

算出方法が誤解されやすいウエイトバック集計の正しいやり方

算出方法が誤解されやすいウエイトバック集計の正しいやり方

ウエイトバック集計とは

 ウエイトバック集計とは、アンケート回収時などに用いられる集計方法です。別名「ウエイト付き集計」とも呼ばれます。ウエイトとは「重み」を意味する「Weight」のことで、要約すると「サンプル(回答)に重みを加えて集計する方法」のことを言います。

 ウエイトバック集計では、アンケートを行った集団の母体の属性構成比率に合わせて、アンケート回答数を調整します。例えば、男子生徒100人、女子生徒100人の学校を対象にしたアンケートを行ったとしましょう。男子生徒の回答数が80、女子生徒の回答数が50だった場合、このまま集計してしまうと、回答数の多い男子生徒の意見がより色濃く反映されてしまいます。この矛盾を解消するために、あらかじめ「男子生徒数:女子生徒数=男子回答数:女子回答数」になるように、アンケートの回答数を調整して集計します。このような集計方法を、ウエイトバック集計と呼んでいます。

 

間違えやすい値の算出方法

 前述の「ウエイトバック集計」の紹介文を読んで、どのような構成比の調整を思いついたでしょうか?「男子生徒の回答を30破棄して、女子と同じ回答数にすればいいんじゃないの?」と思ったかもしれません。しかしそれでは、切り捨てた票数の中に意見が偏っていた場合に、正当な集計が行われたとは言えなくなってしまいます。また、構成比だけを改めても、サンプル数が合わなくなってしまうことがあります。
 

 「母集団数」とは、調査対象の全体数は何人か、ということです。上記の例で言えば、男子生徒・女子生徒のそれぞれの総数(100人)に該当します。「回収数」は属性別のアンケート回収の数(男子80、女子50)に、「総回収数」はアンケートの全体の数(130票)となります。ウエイトバック集計では、このウエイト値(重み)を回収数にかけ合わせ、算出された補正後の値を集計結果とします。
よって、

80(補正前の値)×0.8125(ウエイト値)=65(補正後の値)
50(補正前の値)×1.3(ウエイト値)=65(補正後の値)

このように計算することで、男女比を全体の構成比と同じ1:1にして計上します。
 ウエイトバック集計で最も間違いやすいのは、このウエイト値の算出を「数」からではなく「構成比」から算出してしまうミスです。この方法では、構成比は同じ値となるものの、総数が元の値のままとなってしまい、まったく違った集計結果となってしまうので、注意が必要です。

 

クロス集計との関係性

 クロス集計では、あらゆる属性によって分析軸が分けられており、「どの年代で男女どちらのに人気があるか」など、細やかな調査結果をつまびらかにできます。このようなクロス集計では、分析軸(属性)によって、ウエイト値が変わってきます。そのため、このウエイトバック集計を用いることで、各分析軸の重みを集計結果に加え、比較することに役立ちます。
 しかし、クロス集計の全てにこのウエイトバック集計を行うことが適切だとは限りません。ウエイトバック集計を用いるべきでない統計は、以下の場合です。

・そもそもウエイト付けができない
マーケティングにおいて、母体数が明確に判明しているシーンというのは、意外と少ないものです。あらかじめ人数を決めてモニターを募集した調査などであれば、母体数を求めるのは容易です。しかし、「商品のユーザー数」や「傍目にはわかりにくい(または当人も自覚していない)症状を持つ人数」など、総人口が不明な場合は、母体数が不明であるためウエイト値を出すことができません。

 

まとめ

 ウエイトバック集計は、母体数と呼ばれる全体のうち、回答数がどの程度の割合を占めるか、という「重み」を定義することによって、母集団の出現比率に合わせることができる集計方法です。しかし、すべてのクロス集計に利用できるとは限らず、適切な使用場面、算出方法に則って使用することが望ましいのです。
 

参考サイト:
・ https://www.macromill.com/research_words/r009.html
・ http://blog.naga-agg.net/20120613.shtml
・ http://elsur.jpn.org/mt/2014/03/001891.html

 

このコラムを見た方へのオススメ