示されたデータの信憑性を疑う

新商品を開発するにあたって、一般消費者を集めて「あなたはこの商品がいくらだったら買いたいと思いますか」という質問をすることがあります。消費者の回答平均値は、新商品にゴーサインを出すかどうか、実際にいくらで販売するかを決めるにあたって重要なデータとなります。

新商品の担当者がプレゼンテーションの場において「消費者は平均して2,689円ならこの商品を買ってもいいと答えました」と発表したとき、聴衆は「思ったより高い」あるいは「意外と安い」など、様々な感想をもちます。しかし「そのデータは本当なの?」と疑いをもつ人はほとんどいないでしょう。

担当者にはデータを偽装する動機があります。例えば実際に消費者が答えた価格の平均が1,432円だったとします。この商品の原価やその他諸々を考えると、正直にこの数字を発表したら企画が通らない可能性があります。そうなると、担当者は新商品の企画を通し、自分が理想としている価格で販売するために数字の操作に手を染めるかもしれません。

データの信憑性を確かめるために、元データ、ここでは個々の消費者が回答した価格を見せてもらうことが有効です。元データの平均値が、発表された平均値から乖離していたらデータ偽装の証拠となります。

また、発表された平均値に合わせて元データの数字が改ざんされていても、不正を見抜くことは可能です。そのために次の質問について考えてみてください。

運動不足を感じているあなたは、ジムに通うことを検討しています。あなたはジムの月会費にいくら出せますか?

20代から50代の男女から無作為に選んだ500人にこの質問をした結果、平均で8,936円だったとしましょう(これは私が適当に思いついた数字で、実際に調査が行われたわけではありません)。

平均が約8,900円だったとしても、個々の回答を見れば「3,000円しか出せない」という人もいれば「2万円出してもいい」という人もいるでしょう。あなただったらどう回答するでしょうか。その数字がいくらにせよ、それは千円刻み、あるいは5百円刻みではないでしょうか。「8,864円までなら出せる」などと、細かく刻んだ回答をする人はまれでしょう。

心理学者のダーク・スミースタースはある研究において、被験者に抽象的なデザインのTシャツの写真を見せて、いくらなら買うか質問しました。その金額は平均すると10ドルでした。

2013年、スミースタースの同僚である行動経済学者のウリ・サイモンソンは元データに書かれている個々の被験者の払いたい額を見ていて、「5の倍数」や「10の倍数」といったキリのいい数字が少ないことに気が付きました。

価格をランダムに答えると、1の位の数字はそれぞれ均等な割合で現れます。5の倍数であれば、登場する確率は5分の1になります。スミースタースの元データもそのようになっていました。

しかし、本当に人間に対して質問したのであれば、5の倍数や10の倍数などキリのいい数字で答える割合が多くなるはずなのです。サイモンソンがスミースタースの実験を再現したところ、5の倍数の回答は50%以上にものぼりました。こうした調査をきっかけに、スミースタースの不正が明らかになり、教授の職を解かれることになりました。

人は「調査の結果、このようになりました」とデータを示されると、無条件でそれが正しいものであると考えてしまいがちです。しかし、その数字が不正に操作されたものである可能性もあります。データを鵜呑みにせず、可能であれば元データや、データを取得した経緯を確認してみましょう。毎回そんなことをすると嫌われるかもしれません。しかし、そのデータの信憑性が自分にとって重要なものであるならば、やってみる価値はあるでしょう。

コメントを残す