Yahoo! JAPAN による「ビッグデータ参院選議席予測を振り返る」
一昨日に軽く予告をしておいたんですが、Yahoo! JAPAN から「ビッグデータ参院選議席予測を振り返る」と題するリポートが発表されています。もともと、ビッグデータには私は強い関心があり、何らかの予測に役立つ可能性が十分にあると考えていましたが、国政選挙における予測について検証した結果であり、大いに興味をそそられています。
実は参議院選挙前の昨年12月の衆議院選挙でも「衆議院議員選挙とYahoo!検索の驚くべき関係」と題したリポートが公表されていたところ、イマイチ評価のしにくい総括となっていましたが、今回の参議院選挙では政党別の当選者数についての結果を全面に押し出し、しかも、都道府県選挙区別にも結果を明らかにして、とても分かりやすくリポートされています。簡単に方法論から始めて紹介したいと思います。
まず、上の概念図は、直前予想の「ビッグデータが導き出した参議院選挙の議席予測」からの引用で、2種類の予測方法である相関モデルと投影モデルの簡単な考え方を示しています。まず、相関モデルでは、昨年12月の衆議院選挙レポート「衆議院議員選挙とYahoo!検索の驚くべき関係」の結果を元にして分析を行い、各政党ごとの検索量と得票への関係を補正した上で、特定期間における検索量から得票数を推定しており、次の投影法では、過去の選挙事例を基に公示日前後における検索量の変化を増加率としてスコア化し、今回の公示前の検索数を用いて得票数を推定しています。相関モデルでは補正はあるものの、時間軸に対してかなりリニアな関係が想定されているのに対して、投影法では一定のモメンタムも考慮されていると受け止めています。
そして、今回のリポートから 2013.7 参院選全体の予測と結果比較 のグラフを引用すると上の通りです。グラフに見られる通り、与党数76議席、野党数45議席と与野党でみると議席数は完全に一致しましたが、個別政党で見ると当然ながら予測数値から少しハズレがあり、全121議席中の一致数とその比率は、相関モデルでは105議席(87%)、投影モデルでは111議席(92%)となりました。一定の評価が出来る予測だと私は考えています。
さらに、今回のリポートから 2013.7 参院選選挙区予測と結果比較 のグラフを引用すると上の通りです。見れば分かるでしょうが、上が相関モデル、下が投影モデルの結果です。大ハズレしたのは岩手県と沖縄県です。岩手では小沢代議士の影響力について議論があったのは記憶に新しいところかもしれません。また、首都圏の東京都と埼玉県、さらに愛知県でやや成績が悪くなっています。しかし、全体として、今回の参議院選挙のうちの選挙区選挙については、かなりいい成績のように見えます。また、グラフは省略しましたが、比例代表結果についても与野党で1議席の予測誤差しかなく、これも十分な精度といえます。
最後のグラフは、今回のリポートから 相関モデルの検証 - 2 を引用しています。右のパネルで政党別の補正率が示されていますが、特に、公明党については補正率が小さ過ぎたとの結果が得られています。すなわち、公明党に投票した人達は、ネットで検索などせずにまっしぐらに公明党に投票した、ということですから、かなりあり得るんではないかと私は受け止めています。また、予測に用いた補正率が昨年の衆議院選挙から弾き出されているとすれば、今回、実線の必要補正率が破線を上回った各党は一定のブームに乗ったといえるのかもしれません。
最後に、リポートでは、今後の課題として3点上げており、第1に、諸派や無所属の織り込みが困難であり、第2に、低投票率の影響が組織政党に有利に働き、それが公明党の大きな補正率の乖離につながった可能性を指摘し、第3に、政党や候補者ごとの検索量と得票の関係が、特に、都議会選挙と重なったために見極めにくかった、となっています。Yahoo! JAPAN では、選挙のほかにも「Yahoo!検索から見えた今年のインフルの猛威」なども発表しており、ビッグデータの今後の活用の方向が示されているともいえ、私も静かに注目しています。
| 固定リンク
コメント
IT業界に居りながら、BIG.....などとまた流行り言葉を生み出したなと思っておりましたが、今回の選挙結果はある程度正確な予測に使えるようですね。ITを使えない世代が徐々に逝くと、もっと精度が上がるのかもしれません。
投稿: kincyan | 2013年8月 4日 (日) 18時44分
そうなんですよね。
実は、私もまだガラケーで電話とメールしか使っていないんですが、スマホでネットを使い出すとビッグ・データの精度がますます高まるような気がします。まずは、マーケティングなどのビジネス・シーンで活用されることと予想しています。
投稿: ポケモンおとうさん | 2013年8月 4日 (日) 22時54分