星期三, 11月 07, 2012

統計的用法

最近不管是因為醫學資料上的原因, 或者投資數據上的原因, 都看了一些統計數據.

無意中看到一句很棒的話, 据說是台灣的某大學教授統計學的教授說的:

"統計數據, 必須是拿來顛覆理論用的. 不是證明理論用的"

也就是說, 你先大膽假設一個理論, 然後透過統計來看有沒有反例.
不能說統計都支持這種說法, 這說法就是一種理論.

因為既然是“理論", 就應該有”因果性".

比方, 每次狗吠, 郵差就會走掉. 統計結果能夠證明,郵差走是“因為”狗吠嗎?
不能, 因為你會找到反例: "沒有狗, 郵差也會走. 郵差走是因為他送完信了, 或者剛好經過"

比方, 雄中的升學率高, 所以考上雄中的學生, 就比較容易考上大學?錯了, 這種一言以蔽之的說法, 會誤導. 真正的原因可能是考上雄中的學生確實資質較好, 雄中的環境確實較容易有讀書氣氛, etc.
換句話說, 把一樣的學生, 放到沒有這種讀書氣氛的地方, 或者把資質差的學生, 放到雄中去讀, 升學機率都會改變(這幾乎是大家都不會反對的). 因此, 機率不是拿來讓你做因果論述的, 更不是讓你拿來做重大決策用的.

所以, 以相關性來做重大決策的判斷準則, 是不理性的.ㄢ