データ活用のための『ストーリー変換』コンセプトとは

プロフェッショナルとして、データやデータ分析の”活用”のスキルをお伝えするには何が本質か、を常に考えています。

グラフや表を作っては睨めっこ。。。を卒業するためのコンセプトの一つがこの『ストーリー変換』です。

「ストーリー変換」というのは、ストーリー”を”変換するのではなく、単なるデータやデータを整理したグラフや表を、ストーリー”へ”変換することを意味します。(ここ、とても大事です)

具体的な例で見てみましょう。

このグラフは、新潟県内の自治体で転入者(移住者)を増やす施策を検討するために、まずは現状把握として全市町村の人口当たりの転入者の比率を高い順に並べたものです。

ここまではやりますよね、大抵の人は。でもここから分かることは、

移住者の比率を高い順に並べた

という事実だけです。ここから先に進めません。

ここで「ストーリー変換」のコンセプトが登場です。

この状況を「ストーリー」つまり「物語」や「筋道」「結論」といったものに変換してみます。

このグラフを見ると、比率が高い(左のほうに位置する)自治体は、県外からの転入者が多そうです。

ってことは

県外からの転入者が多いと全体としての移住者も増えるのかも

という”ストーリー”の仮説が思い浮かびます。ストーリー変換のSTEP1です。

STEP2ではそれを確かめてみます。

県外からの転入者の転入者全体の中での比率にしたものを横軸に、転入者全体の人口比率を縦軸に取り、その関係性を確認してみました。

この「関係性」が重要です。ストーリーは「関係性」がないと成立しません。その関係性は例えばこの縦軸ー横軸で確認できるのです。

このグラフからどんなストーリーが描けそうでしょうか。右肩上がりに見えるので、やはり県外からの転入者が全体転入者を引っ張っている(転入者を増やすには、県外から引っ張ってくる)というストーリー(結論)で良さそうですか?

一見そう思ってしまいますね。ところが、この右肩上がりの関係が成り立つのは、右上の2つの自治体があるからだけかもしれません。こちらを外して残りのデータで同じことをしてみましょう。

先ほど見えた右肩上がりの関係性は消えてしまいました。

となると、やはり全体的な傾向として一般化できそうにありません。これは失敗ではありません。立派なストーリーが成立しています。すなわち、

新潟県の市町村全体として、その流入者は、必ずしも県外からか県内からかの影響を受けない

というストーリーです。これと最初のグラフで分かった

移住者の比率を高い順に並べた

とを比べて、得られる情報が圧倒的に変わったことが分かります。これが「ストーリー(への)変換」なのです。

業務の中でも必要な結論や情報とはこのストーリーではないでしょうか。

ちなみに、上記グラフの横軸1.0のところに縦線を入れてみました。その線の左右を比べると左、つまり県内の転入者が多い自治体のほうが(新潟県内では)圧倒的に多い、という事実も確認できますね。

同じことを全国にも広げて見ましょう。

全国の都道府県で同じことをやってみました。

このグラフから分かることは、相変わらず

人口あたり流入者が多い県を順番に並べた」

でしかありません(=ストーリーは何もありません)。

では皆さんはここから、どのようなストーリーを描きますか?

例えばこれはどうでしょう?

グラフを見ると、左には首都圏など大都市が含まれる都道府県が目に付きます。となると、

転入は人口が多い(都会)に集まりやすい

という、恐らく誰でも思いつくけど検証はされたデータはあまり目にしないストーリーが成り立ちそうです。

それを検証したものがこちらです。

横軸に人口を取りました。きれいな右肩上がりの関係性が見えますね。

「やはり」という結果ですが、データで客観的に確認できました。それによって、データがストーリーに変換され、結論が導かれました。


自治体での行政業務データ活用のプロジェクトの一部をご紹介します!

新潟県燕市役所でのデータ活用研修および実際の行政課題をテーマにした「データ分析活用プロジェクト」も今年で7年目です。

今年度のテーマは『地方移住』。データ(分析)を活用して論理的な成果を出すには、分析する手法や知識よりも正しい”考え方”(考える内容、順番など)が重要です。

第一のステップは、”何を最終的に言いたいか(すなわち結論)”を具体的に決めること。

続く第二のステップは、取り組む問題や現状を適切なデータで確認・評価することです。まずこのステップをやってみました。

(1)そもそも燕市に転入(移住)する人はどのくらいいるのか?それは多いのか少ないのか?

新潟県の市町村について、人口当たり年間転入(移住)する人の人数を多い順に並べてみました。ほとんどが約2%であることが分かりますね。

加えて、県内から移住する人と県外からとの内訳も見てみました。

燕市は、この2%前後の集団の一部ではありますが、相対的には多いグループと言えるでしょう。そして特徴として県内からの移住が多いようです。


(2)燕市に移住する人はどういう目的が多いのか?

ここでも「県内から」と「県外から」を分けて考えました。恐らく県内(地域を大きく跨がずに)移住する人と、そうでない人とでは理由が違うだろうという仮説からです。結果は、その通りでした。

また、本プロジェクトの結論で言いたい「では、どういう行政施策で移住は増えたり減ったりするのか?」に至るためには、この”目的別”が重要になることを確認していました。

実際に行政(第三者)が移住という意思決定に影響を与えられる要素は限られています(例えば転勤などは全くコントロールできないですよね)。

具体的には”戸籍”(結婚などを機に引っ越し先を探す人に対して、何かしらのサポートを行える)と”住宅”(住宅購入などへのサポート)は、「第三者が意思決定に影響を与えられる」要素として重要と考えました。

図を見ると、県外からの移住者はこの2つの理由の割合はかなり限られていることが分かります。


(3)どのような年齢層が動いているのか?

最終的にどのような人を対象にアプローチすべきかという検討にもつながる情報です。

これによると、県内からの移住者は25~34歳で約4割、県外からは20~29歳で約5割を占めることが分かります。年齢層はどちらも若く、県外からのほうが更に低いゾーンにあることが分かりますね。県外からの移住についてはどうも先ほどの「職業」という移住目的と合致しそうです。


(4)移住促進のゴールはどこに設定すべきか?

「できる限り頑張ろう!」ではなく、ゴールを数値で設定するにはどうすべきか?

RESASで燕市の人口増減を見てみました。

これによると、自然増減(死亡と出生)の差が最新値で、約1000人あります。(下の2つの折れ線の右端のギャップ)

一方で社会増減(転入と転出)の差は年により多少ありますが、さほど大きくは変わりません。

仮に、今後移住を促進することで、この自然増減のマイナス1000人をカバーするには、現在の転入者数約2000人の1.5倍、つまり現状の50%増を一つのゴールとして考えることはさほどズレていないと思います。(もちろん今後自然増減の差はもっと増えていくのでしょうから、ゴールのハードルはどんどん上がっていくのですが)。


ここまでは最初のステップです。これらの現状把握・評価に基づいて、更に深掘りをし、結論に結び付けます。


DXは既存業務のデジタル化のことではない

DXとは『かたちが跡形もなくすっかり変わること』であり、『企業、組織のあり方そのものをデジタル化のロジックで問うこと』。

これは先日の朝日新聞に掲載された書評の抜粋です。

ここで言わんとすることは、日産で「ビジネス・トランスフォーメーション(BX)」の部署にいた私にはよくわかります。

そこでは(既存業務の)”改善”と”ブレイクスルー(改革)”とが明確に区別され、後者の実現がタスクでした。前者の改善をやろうとすると、「我々がやるのは”トランスフォーメーション(改革)”であり、それ(改善)は現場でやってもらえばよい」という指摘が入ってストップさせられました。

同様に、既存アナログ業務のデジタル化は”トランスフォーメーション”とは呼べないのでDXではないのですが、残念ながら現実にはそこを目指してDXと呼んでいるケースが多いのかと感じています。

この理屈で言えば、(良し悪しは別として)「自治体DX」という概念は成立しないのかもしれません。行政業務は法律に基づいて行われ、それを跡形もなく変えたり、組織のあり方そのものを問い直すことは、今の法体系では現実的に不可能だからです。

もちろん”行政IT化”は進めるべきだと思いますが、あくまでそれはDXとは別物で、これまでもIT化の必要性はずっと言われ続けていました。

DXとは?という本質が宙に浮いてしまっているまま言葉だけが独り歩きしている状況です。「データサイエンスって何?」という曖昧な(もしくは非現実的な理想論の)まま、言葉だけが色々なところで都合よく使われているのと同じ状況なのかなと思いました。

物事は正しい目的と正しいやり方でやらないと、結果が出ません。


データ分析の「方法の知識」ではなく、「活用の仕方」を学ぶ唯一のセミナー!

多くの企業でデータ活用が進まない理由は、統計知識やデータサイエンスへの理解の不足ではなく、「目的や問題が定まる前に、データに手をつける」ことが主要因と言えます。

その状況を打破するために必要なことは、“更なる知識や方法論の習得”ではありません。

本セミナーでは、「データ分析の手法や統計学の知識」を増やすことを目的とせず、「データを活用するとはどういうことか」を知り、実践するための考え方やプロセスなどについて学び、習得いただきます。

https://event.shoeisha.jp/bza/data-online/

オンラインで実施を開始して既に1年が経ちました。

私自身がこの間、ハーバード大学院ビジネススクールにおける「Data Science for Business」カリキュラムを修了しており、本講座の内容についても私自身がその最新の内容に基づき検証したものになっていますので、是非ご参加ご検討下さい。

皆様とオンライン上で当日お会いできますことを楽しみにしております。


相関分析がうまくできない原因

データとデータの間のつながり(関連性)の強さの度合示す分析が相関分析です。

使った広告宣伝費“と”集客数“のつながりが確認できれば、広告宣伝活動は集客という成果につながっている(=効果がある)ことが分かりますね。

 ところが実践で使おうとすると、この相関関係を見つけることは思ったほど簡単でないことに気づきます。

理由は様々ですが、例えば・・・

 

(1)  使うデータに複数の要素が混在している

「ある製品」ではなく「全製品」の売上データのほうが、ノイズが多いため相関が出にくい傾向があります。

より具体的に絞り込んだデータを使ってみましょう。

 

(2)  2つのデータに距離がある

できるだけ関係性が近いデータのほうが相関が出やすい傾向があります。

広告宣伝費と利益額の相関(この間には集客、売上、コストなど他の要素が介在してノイズとなります)よりも、広告宣伝費と来店者のほうが、両者間のノイズが少ないですね。

 

こういった実践的なコツや目の付け所は、データ分析の本には載っていません。

自ら実践した上での工夫点と言えるでしょうか。

うまく結果がでなくて困る場合には、是非思い出してみてください。

PAGE TOP