データは真実を映す鏡ではないかもしれない
データ分析のやり方には注目が集まるものの「データ選択」もそれ以上に奥が深く、結果に大きな影響を与える要素です。
にも拘わらず、この「データ選択」はないがしろにされがちです。
せっかく正しい分析手法を用いても、それでは正しい姿が見えません。
たとえばこちらの図。多くの人が成功のための「努力」をしていても、実際に夢が実現(成功)するのはほんの一握りの人だとします。
世の中に出てくる情報(データ)の多くは、この「成功した一握りの人」の情報です。
この人たちは皆「努力は裏切らない」や「夢を持ち続ければいつか叶う」といったことを口々に言うでしょう。
それをデータで分析(検証)すると、「やはり成功するには、努力や夢を持ち続けることが重要だ」という結果が出ると思います。
でも、それはごく一部の成功した人のデータで出した答えです。
例えば、残り99.9%の人も努力し、夢を持ち続けたかもしれません。それでも成功しなかったわけです。
ただ、この99.9%の情報は表に出てこないため、分析の範囲から漏れてしまうのです。
これ、至る所で起こっていないでしょうか。