クロス集計表と相関分析の関係

 「男vs女」、「値引の実施vs未実施」など、複数の“定性的”な違いを数値で確かめるクロス集計という方法があります(詳細は是非検索を)。

 

例えば、曜日(という定性情報)ごとに売上額をデータで比較し、結果の違いを確認するなどよく実務で行われますね。

 これは、”曜日“という軸と”売上額“という2つの軸の関係性に着目しています。

2軸に着目する他の分析方法として、私が研修でお伝えしている「相関分析」があります。

一般的には、この2つが全く別物として認識されがちです。

 

でももし、曜日を時間、分、秒・・・と更に細かく“連続的”なものに細分化していくと、”曜日“という定性情報が、”時間“という定量情報に変わります。]

こうなれば、“時間”という定量情報と、”売上額“という定量情報の関係性ということになります。

定性的な軸を細かくすることで、それは”定量的“な情報になっていきます。

その時に、「クロス集計」は「相関分析」となるのです。

 

今回はちょっとテクニカルな、でも本質的なお話でした。


何のための「デジタル化」「DX」「データ活用」なのか?

データ活用」「デジタル化」「DX」などのバズワードが飛び交っていますが、これらは”手段"であり、その"目的”を明確にする必要があります。

企業や自治体から研修やワークショップ等のご依頼を頂く際に、「何を実現したいのか」という目的をお伺いするように心がけています。
そのときのたたき台として使えそうな図を作成しました。

データ活用全体図(目的確認のために)

図の上に行くほど「目的」を示します。

「デジタル化」も「(業務での)データ活用」や「DX」の一部でしかありません。

「データ分析」を行う目的の確認も重要です。

私がサポートしているの範囲は、赤い矢印で示された部分です。

そして、「データサイエンス」と呼ばれるものの多くは、緑色の「予測」や「分類」です。

流行言葉に翻弄されることなく、目的思考で進められればと思います。


2023年も組織の「データ活用力」向上に貢献致します

明けましておめでとうございます。

既に多くの企業や組織(自治体)などで、「データ活用」の具体的な成果を出しております。
これらの実績と経験をしっかりベースとし、業務上の課題や目的に対して「ゴール思考」で成果を出すメソッドをご提供致します。

どうぞ本年もよろしくお願い致します。

データ&ストーリーLLC
柏木吉基


【応用・実践編】おすすめの統計学本ランキング10選でNo.1に輝いたロングセラー

【応用・実践編】おすすめの統計学本ランキング10選のNo.1にランクインしていました。

「それ、根拠あるの?と言わせない データ・統計分析ができる本」

【効率よく勉強】大人気の統計学書籍おすすめランキング24選 (rank-king.jp)

高度な分析手法追求から本質的な分析スキルへの回帰を最近感じることが多いです。良いことですね。


Twitterで多くのデータ分析関係者に賛同された記事の紹介

よくある「データ分析研修」はB(つまりどういう手法があってそれで何がわかるか)しか教えません。

そのため受講者は「使える」には至らないケースが多発します。

これはその中身が統計やいわゆるデータサイエンスでも同じです。

下図のAやCが完全に欠落しているのです。

AとCは実務経験がないと教えられない内容なのですが、圧倒的大多数の受講者も教えている人も、それが抜けているが故に使えないという事実を知らないのです。

となると、統計やデータサイエンスなどの知識や方法論が不足していることが「使えない」原因だと考え、いたずらにその数を増やそうとします。
それは図中のBが肥大するだけで、問題の解決には至りません。

「データサイエンス」の範囲として、AやCを含める(正確には”含めて考えたい”)という気持ちも分かりますが、現実的ではありません。
なぜなら、大学などアカデミックな世界で教えている人が実業での経験がなかったり、学んでいる学生自体が具体的な課題認識を持っているわけではないからです。

つまり、個人の能力の問題ではなく、状況的にA~Cを網羅することは難しい状況の中でBだけに注目が集まり過ぎていることにリスクを感じています。

私が提供しているプログラムは、BよりもむしろAやCについて、その考え方やテクニック、重要性をお伝えすることに重きを置いています。
その上で、Bのテクニックをお伝えし、それらを活かそうという発想です。

令和4年度に向けて、ご興味や課題をお持ちの方はご相談頂ければと思います。

PAGE TOP