『ナンバーセンス』を読んだ。『ヤバい統計学』の著者による、統計リテラシーの本。数字に踊らされないための一冊。楽しむのに、統計分析について知らなくても大丈夫。統計分析は主題じゃない。
統計リテラシーの本は昔からあるけれど[1]、「ビッグデータ」というバズワードに乗っかって、「分析」が増えている。その中には問題がある分析も多い[2]から、騙されないようにしよう。そういう話。
騙されないためのポイントの一つが、「反事実」という考え方。ここでは、クーポンを例に使って説明されている。雑に説明するとこんな感じ。
この他にも、大学のランキングを操作するためのあの手この手とか、基準値を巡るいざこざ(でも結局どれも大差がなさそう)とか、数字を巡るドラマを見せてくれる。
そして、エピローグで著者はこう語る。
データの出所も仮説の立てられ方も様々だけれど、好奇心を満たすためだけの分析でなければ、その目的は主張する仮説の補強だ。だから、ほぼ例外なく主張に合わない側面が切り捨てられる。それに、普通は主張に反対する人は、データ収集に積極的に収集したりしない。
そう考えると、大抵の数字は安全率をかけて受け止めておくといいのかもしれない。
統計リテラシーの本は昔からあるけれど[1]、「ビッグデータ」というバズワードに乗っかって、「分析」が増えている。その中には問題がある分析も多い[2]から、騙されないようにしよう。そういう話。
騙されないためのポイントの一つが、「反事実」という考え方。ここでは、クーポンを例に使って説明されている。雑に説明するとこんな感じ。
- クーポン発行業者の主張する世界: クーポンの集客効果で○○○円売り上げが増えた。
- 反事実の世界:クーポンなんか出さなくても売れた分の割引分の利益を失ったうえ、クーポン発行手数料まで取られた。
この他にも、大学のランキングを操作するためのあの手この手とか、基準値を巡るいざこざ(でも結局どれも大差がなさそう)とか、数字を巡るドラマを見せてくれる。
そして、エピローグで著者はこう語る。
ほとんどの場合、あなたが自分でデータを扱う必要は無い。誰もひとりですべてを検証する時間は無い。それでも、その数字の出所を知れば理解が深まる。その仮説がいつどのように立てられたかを知ることも、同じくらい重要だ。
データの出所も仮説の立てられ方も様々だけれど、好奇心を満たすためだけの分析でなければ、その目的は主張する仮説の補強だ。だから、ほぼ例外なく主張に合わない側面が切り捨てられる。それに、普通は主張に反対する人は、データ収集に積極的に収集したりしない。
そう考えると、大抵の数字は安全率をかけて受け止めておくといいのかもしれない。