データ活用のための『ストーリー変換』コンセプトとは
プロフェッショナルとして、データやデータ分析の”活用”のスキルをお伝えするには何が本質か、を常に考えています。
グラフや表を作っては睨めっこ。。。を卒業するためのコンセプトの一つがこの『ストーリー変換』です。
「ストーリー変換」というのは、ストーリー”を”変換するのではなく、単なるデータやデータを整理したグラフや表を、ストーリー”へ”変換することを意味します。(ここ、とても大事です)
具体的な例で見てみましょう。
このグラフは、新潟県内の自治体で転入者(移住者)を増やす施策を検討するために、まずは現状把握として全市町村の人口当たりの転入者の比率を高い順に並べたものです。
ここまではやりますよね、大抵の人は。でもここから分かることは、
「移住者の比率を高い順に並べた」
という事実だけです。ここから先に進めません。
ここで「ストーリー変換」のコンセプトが登場です。
この状況を「ストーリー」つまり「物語」や「筋道」「結論」といったものに変換してみます。
このグラフを見ると、比率が高い(左のほうに位置する)自治体は、県外からの転入者が多そうです。
ってことは
「県外からの転入者が多いと全体としての移住者も増えるのかも」
という”ストーリー”の仮説が思い浮かびます。ストーリー変換のSTEP1です。
STEP2ではそれを確かめてみます。
県外からの転入者の転入者全体の中での比率にしたものを横軸に、転入者全体の人口比率を縦軸に取り、その関係性を確認してみました。
この「関係性」が重要です。ストーリーは「関係性」がないと成立しません。その関係性は例えばこの縦軸ー横軸で確認できるのです。
このグラフからどんなストーリーが描けそうでしょうか。右肩上がりに見えるので、やはり県外からの転入者が全体転入者を引っ張っている(転入者を増やすには、県外から引っ張ってくる)というストーリー(結論)で良さそうですか?
一見そう思ってしまいますね。ところが、この右肩上がりの関係が成り立つのは、右上の2つの自治体があるからだけかもしれません。こちらを外して残りのデータで同じことをしてみましょう。
先ほど見えた右肩上がりの関係性は消えてしまいました。
となると、やはり全体的な傾向として一般化できそうにありません。これは失敗ではありません。立派なストーリーが成立しています。すなわち、
「新潟県の市町村全体として、その流入者は、必ずしも県外からか県内からかの影響を受けない」
というストーリーです。これと最初のグラフで分かった
「移住者の比率を高い順に並べた」
とを比べて、得られる情報が圧倒的に変わったことが分かります。これが「ストーリー(への)変換」なのです。
業務の中でも必要な結論や情報とはこのストーリーではないでしょうか。
ちなみに、上記グラフの横軸1.0のところに縦線を入れてみました。その線の左右を比べると左、つまり県内の転入者が多い自治体のほうが(新潟県内では)圧倒的に多い、という事実も確認できますね。
同じことを全国にも広げて見ましょう。
全国の都道府県で同じことをやってみました。
このグラフから分かることは、相変わらず
「人口あたり流入者が多い県を順番に並べた」
でしかありません(=ストーリーは何もありません)。
では皆さんはここから、どのようなストーリーを描きますか?
例えばこれはどうでしょう?
グラフを見ると、左には首都圏など大都市が含まれる都道府県が目に付きます。となると、
「転入は人口が多い(都会)に集まりやすい」
という、恐らく誰でも思いつくけど検証はされたデータはあまり目にしないストーリーが成り立ちそうです。
それを検証したものがこちらです。
横軸に人口を取りました。きれいな右肩上がりの関係性が見えますね。
「やはり」という結果ですが、データで客観的に確認できました。それによって、データがストーリーに変換され、結論が導かれました。