読書感想文

新刊、休刊、文学、専門書。
あらゆるジャンルの書籍について読書感想を書いていきます。
得意分野: IT関連技術書、ミステリー小説、ベースボール


2008/07/06

統計でウソをつく法

サブタイトルは「数式を使わない統計学入門」。

以前から統計は鵜呑みにできないと思っていたのだが、この本を読んでやっぱりそうかと思った。

統計に関するごまかしは何パターンかある。

1.データの取得方法
偏りなく多数のデータを取得しているか。
例えば国民の所得に関する統計をとる場合、インターネット限定で調査をすればインターネットを利用していない層のデータが取得できず偏りが生じる。
また、わずか数人分のデータしか取得していない場合は、対象が少なすぎてデータとしての正確性に欠ける。
利害関係が絡む場合には、何度も統計を取った上で自分に都合のよいデータのみを採用するケースがある。
また、質問の内容によっては、回答する人が勘違いして間違った情報を提供する可能性もある。

2.結果の見せ方
結果をグラフ化して見せる場合、グラフの描き方によって印象が大きく変わる。たとえばある事象に関して、1年の間に値が10000から10100に変動した場合を考える。グラフの縦軸を0から10010にするとほとんど増加していないように見える。しかし、グラフの縦軸を10000から10100にすると極端に増加しているように見える。
また、たとえば人の平均身長が10年前に160cmだったのが現在は170cmであるとする。この場合に2人の人の絵を描いて、高さの比率を16:17にするグラフを見かけることがある。しかし人の絵は2次元で書かれており、実際には16×16:17×17に見え、実際の身長以上の差を見せる結果になる。もしも絵を3次元ぽく描いている場合には、3乗の差があるように錯覚を引き起こす。

3.結果分析
サンプルは正しくても、結果の分析を間違えることがある。
例えば喫煙の有無と学校の成績に関する統計を取る場合を考える。仮に喫煙する生徒ほど学校の成績が悪いといった結果が出てきた場合、これにより喫煙すると頭が悪くなると結論づけるのは間違いである。なぜなら相関関係があるといっても因果関係ははっきりしないからだ。喫煙したから頭が悪くなったのではなく、頭が悪いから喫煙をしたのではないかという仮説も考えられる。
したがって、因果関係まで勝手に特定することは間違いである。

本書は特に難しい数式を使うことなく説明されているので、文系の人にもお薦めの1冊である。

ラベル: ,