「正確な予測を可能にしたRDITの方法論」【新しい時代のリサーチ】

新しい時代のリサーチ
2017/1/6

【新しい時代のリサーチ 第2回】
「正確な選挙予測を可能にしたRDITの方法論」

【新しい時代のリサーチ 第2回】<br>「正確な選挙予測を可能にしたRDITの方法論」

RDITの調査が正確な理由 「ランダム性」

前回のコラムで、2016年11月の米国大統領選挙を正確に予測した調査RDIT(アールディット:Random Domain Intercept Technology)とその特長についてご紹介しました。今回はこのRDITがなぜ正確なのか、またその仕組みについてもう少し詳しくご紹介したいと思います。

インターネット上には無数のドメインがありますが、RDITを開発したRIWI社は自由に使えるドメインを100万近く保有しています。RDITでは、その中から回収に必要な数と国に合わせランダムにURLをすばやくローテーションさせながら調査の導入画面を表出させて調査を実施します。その完全なランダム性がRDITの持つ最大の特長です。

RDITの回答者は従来のインターネット調査と異なり、アンケートに回答しようと思った人ではなく、偶然にそのページにアクセスした人となります。調査の導入ページは、通常性別と年代の質問です。そこで回答を続けるかどうかは、対象者の自由意志に任されます。調査を拒否する自由がある点では他の手法と変わりはないですが、調査協力の対象範囲は関心がある人だけに限定されず大きく広がったことは確かでしょう。

また、ドメインが固定されたWebサイトではないため、意図してこの調査ページを見つけることはほぼ不可能です。この調査を妨害することは全インターネットを遮断しない限りできません。そのため、たとえ言論を封殺するような権力下にある国であっても、その国の一般市民の声を正確に集めることができるのです。

 

(図1) 調査の導入画面の例(日本の場合)

RDITを開発したRIWI社のCEO ニール・シーマン博士は、調査サンプルのランダム性の重要性を強調しています。

「対象とする個人の集団からのランダム性は、調査パネルや他のデジタル手段では得られない最も必要不可欠な要素です。ほとんどの選挙予測は、今回の私たちの予測に近づくことすらできませんでした。人々が完全にランダムに抽出されるという私たちのテクノロジーの事実が、私たちの示すデータが細部まで正確である理由であり、従来の世論調査が普段意見を言わない人々の声を計測することに失敗し続けている理由です。今までの主要な世論調査のデータ収集のメカニズムにランダム性に欠けていることはもっと重視されるべき問題です。」

 

RDITによるアメリカ大統領選の予測はどのように行われたのか

今回のアメリカ大統領選挙での事前予測では、ほとんどのメディアや世論調査会社は民主党クリントン氏の勝利がほぼ確実であると伝えていました。結果的には、これらの予想に反して周知のように共和党トランプ氏の勝利となり、多くの事前予測は外れた格好となりました。では、なぜ他の世論調査が正確な予測ができなかった中で、RDITは正確な予測が可能だったのでしょうか。実際にRDITではどのように調査を実施し、予測を行ったのかについて、もう少し具体的ご紹介したいと思います。

今回は、毎日継続的に実施するデイリー・トラッキング調査が行われました。RDITには、回収データがすぐに反映されるオリジナルのダッシュボードがあり、回収データと性別・年令別のウエイト付きのデータがすぐに確認できるようになっています。日次のデータはやや変動しやすいため、7日間の移動平均が用いられました。 投票日の1か月前から調査を開始し、分析には、両候補の差が最も開いた日である10月19日から分析日11月4日までの計17日間のデータが用いられました。 調査の結果を示した下記のグラフをみると、10月19日時点でのクリントン氏の得票数の予測は253票とトランプ氏よりも優勢でしたが、分析日直前に両候補の勝敗が逆転したことがわかります。(図2)

11月8日に投票が行われた今回の米国大統領選挙に向けて、実際にどのように予測したのかをRIWI社のCEO ニール・シーマン博士に質問しました。 以下はその回答です。

「今回の調査は、州レベルで適切なタイミングで予測をするために、選挙人投票に最も影響を与える州に焦点をあてることが課題でした。 予測を行う適切なタイミングは、選挙の機運が明らかにトランプ候補に有利になった11月4日でした。11月4日時点で、トランプ候補が少なくとも193票の選挙人投票を確保する一方、クリントン国務長官が138票であると推計し、トランプ氏側の勢いと確実な勝利を予測しました。クリントン氏の支持は、州レベルで数週間にわたって継続的に急激に下降していました。 11月2日時点では、選挙結果に重要な意味をもつノースカロライナ州ではトランプ氏支持、フロリダ州とミシガン州では両候補が統計的に同レベルでした。ノースカロライナ州は極めて重要な州ですが、トランプ氏がますます上昇に向かっていました。そして11月4日金曜日、東部標準時間の正午に私たちはクライアントに対し予測結果を伝えました。 最も重要なのは、私たちは、フロリダ州、ノースカロライナ州、オハイオ州、ペンシルバニア州における選挙の機運と勝利予測が明らかにトランプ氏支持であったことから、トランプ氏が勝利に向かっていることを知っていたということです。 11月8日火曜日の投票日の夜(東部標準時の午後9時半頃)、私たちが予測した通りにCNNが極めて重要な州であるフロリダ州においてトランプ氏が選挙人投票の勝利を確実にしたことをテレビで伝えました。」

※フロリダ州のトランプ氏の正式な当確の報道はテレビのネットワークによって異なるが上記よりも遅く、CNNのフロリダ州でのトランプ氏の正式な当確は2時間遅い午後11時34分であった。

【分析結果】

  • ・10月19日から11月4日までの各候補の相関を求めた。(相関係数、標準誤差はグラフ内に記載)
  • ・11月4日時点で トランプ氏174票 クリントン氏162票を確保。予測では、トランプ氏193票、クリントン氏138票で、トランプ氏の勝利。
  • ・総得票率では、クリントン氏51%、トランプ氏49%と予測。

(図2) RIWI社による分析結果

(図3) アメリカ大統領選の調査で用いた予測の質問

予測による質問

今回の米国大統領選挙に向けたRDITの調査では、本人の投票意向を問う形ではなく、「あなたの州では、どちらの候補が勝つと思いますか」という予測の質問となっています。(図2) 以下は、予測による質問の重要性についてのシーマン博士からの回答です。

「対象者に本人の投票意向ではなく予測の質問をしたのは、米国が直接投票ではないことも理由の一つではありますが、個人の投票意向の質問はさまざまなバイアス(偏り)を生じます。常にバイアス(偏り)があるがゆえに真のランダム性が重要なのです。予測による質問は、社会的望ましさ(Social desirability)によるバイアス(偏り)を取り除くためですが、特に今回のように注目を集めるメディア、ジャーナリスト、世論調査会社、学術団体の大多数が強く反対していたトランプ氏の選挙においては大きな懸念点でした。
従来の世論調査では、予測の質問を含むことはほぼありません。けれども住民による集合的な予測による回答は、選挙予測において可能な最も正確な方法であることを調査結果は示しています。
多くの場合、バイアスを減らすために質問を『パーソナライズ(個人化)させない』ことは極めて重要です。私たちは、世界のさまざまな地域の援助開発や企業の非常にセンシティブな事柄を数多く扱っています。例えば、誰かが『賄賂を受け取ったか』と質問するよりも、誰かが『賄賂を受け取った近隣の親しい友人や職場の同僚を知っているか』と質問するほうがよいのです。」

 

従来の世論調査による予測の難しさ

従来の世論調査による予測が外れてしまった背景には、調査の協力率の低下、有権者が本音を言っているのかが不明なこと、いつもは投票しない人が投票する可能性、どちらに投票するかを決めていない有権者の多さなどの回答者に起因する問題があります。また携帯端末の急増、電話調査とインターネット調査のどちらが良いのか、またはそれをどのような配分にすればよいのかという調査手法に起因する問題もあり、従来の世論調査で有権者の動向を正確に捉えることの難しさが指摘されています。特に若年層は、固定電話を持たない人が増加し、インターネット調査の協力パネルへの登録者の増加も難しく、調査で一般層の意見を吸い上げることが徐々に困難になってきています。


正しく予測できることの価値

RDITがアメリカ大統領選の結果を正確に予測できたのは、インターネット上からランダムに回答を集める先進的なテクノロジーや毎日計測し続けることで日々の変化を見誤らないという点、予測を問う質問を用いた点、匿名性により「社会的な望ましさ(Social Desirability)」に左右されにくいといった点などの要素が考えられます。 RDITでは、調査主体の呈示もバイアスを与えるものとして基本的に掲載しませんし、謝礼がないので、謝礼目当てというバイアスもありません。また、誰でも簡単に答えられるようなシンプルな質問にすることによって、より幅広く一般の人の意見を偏りなく吸い上げることが可能になっています。徹底してバイアスを排除し、より正確な計測をしようとしています。このような新しい考え方とテクノロジーが、RDITが「リサーチのイノベーション」と言われる理由です。
よく考えなければ回答できないような質問や回答するのが嫌になるような質問をして、得られた回答を「いいかげんな回答」と呼ぶ人もありますが、それはある意味で幅広い人々の意見を吸い上げることをあきらめているのと同じかもしれません。

以上のように今回はRDITがアメリカ大統領選を正確に予測できた理由と従来の調査手法との違いや考え方について簡単にご説明してきましたが、興味をもっていただけたでしょうか。今回のアメリカ大統領選挙がきっかけとなり、正しく予測できることの価値の大きさに改めて気づかされます。このようなRDITの調査結果の精度を生かし、新しい指標を作ることも可能ですので、ぜひご活用いただければと思います。

 

参考


*オリジナル・ダッシュボードは、長期やトラッキング案件のみ利用可能です。

(株)クロス・マーケティンググループ クロスラボ 研究員 岸田 典子 (きしだ のりこ)

このコラムを見た方へのオススメ