「分かりやすさ」と「正しさ」のジレンマ

今の仕事に変わって約1年、ようやくR(統計ソフト)を使った作業を進められる段階にまでたどり着きました。予算編成やら情報発信やらは、それはそれで楽しいんですけど、久しぶりに本業に戻ってきた感じがします。来月には、小さい学会で発表する機会も貰えることになりそうです(月末締め切りのペーパー、まだ一文字も書けてないけど笑)なので、最近仕事のウェイトが重くなっていて、ブログ記事の更新が一ヶ月振りとなってしまいました笑

で、統計個票の集計分析を進めているんですが、たとえば満足度の高い人の特徴を知りたい場合、マーケティングの専門家としては多変量解析を行うわけですよ。

(満足度)= α ✕(訪問経験)+ β ✕(滞在日数)+ γ ✕(消費額)

みたいな式をつくって、どの要素が影響力が強いかを評価して、そこを重点的に見直していきましょう、みたいな話をするイメージ。

でも、地方自治体とか観光協会の職員のなかに統計解析の知識のある人なんて、ガチャゲーのウルトラレアくらいの出現確率なわけで、せっかくモデル推定したところでなかなか理解してもらえず、説明にかかる労力が莫大になってしまうんです。

なので、訪問経験別の満足度クロス集計をして、経験の多い人のほうが満足度が高い、みたいな分析になる。でも、下表のような結果からだけで、そういう結論は出したらダメなんです。なぜなら、リピーターは滞在日数や消費額が多い傾向があるかもしれず、満足度を上げている要因がむしろそちら側にあるかもしれないことを読み取れないから。

  満足度 小 満足度 中 満足度 大
ビギナー 30 30 40
リピーター 10 30 60

そうすると、ありとあらゆるクロス集計の組み合わせを試して、どれが決定的な要因なのかを総合的に検証しなければならなくなります。やろうと思えばできるけど、一度に処理しなければならない情報量が多くなって、脳内メモリが悲鳴をあげそうになる笑

そういうことしないで済むように、同時に複数の要素を評価するのが、まさに多変量解析であって、結局はもとに戻ってくることになるんです。まぁ、先に多変量解析の結果を確かめておいたうえで、意味のあるクロス集計のみを行うのが最短ルートということでしょうか。

誰に伝えたいデータなのか

しかしながら、行政が実施した統計データを分析した結果をプレスリリースするとなると、一般市民にも理解できる内容にする必要があるということになり、専門家からしてみればツッコミどころ満載なクロス集計の寄せ集めが採用されてしまうことになります。

そういうデータが世に広まって、それをもとに市場の実態を踏まえきれずに意思決定が行われてしまって、果たして良いのでしょうか。まぁ、何もデータが無くて決断が出来ずに機会を逃すよりも、外れてもいいから事業活動や合意形成を促すことを狙うのであれば良いのかもしれません。

でも個人的には、ちゃんとデータを理解したうえで事業や施策を強力に展開してくれるような、大企業や外資系、ベンチャー系のマーケターのもとに、しかるべき分析結果が届くことのほうが大事なんじゃないかと思います。

もちろん、それがプレスリリースというカタチである必要があるわけではないので、学会投稿や専門誌への寄稿へつなげるための布石としての、なんちゃって分析から始めるのが落とし所なのかもしれません。みんながデータに関心を持って、統計解析の知識のあるような世の中になるように、地道に頑張ろうと思います。