サイコロなどと違って、気温などの連続的な値をとるデータは、ある決まった値での確率を出すことができない。
例えば、2.5℃になる確率を求めることはできない。分母は無限にあるし、分子も無限に値をとりうる。
そこで、確率を範囲で考えるという考え方が有効になる。
以下のようなグラフを考える。大事なのは、このグラフの面積が確率なのであって、Y軸は確率密度だということだ。
無限から無限まで積分することは可能。よって、全面積を1とすればいい。
また、ここからもある一点での確率が定まらないことがわかる(線は面積を持たない)
でも10℃から20℃という範囲なら、確率を求めることができる。
そういったときに、確率密度というものを考える。
下のグラフの意味は、「確率変数xがaからbまでのどこかに入る確率が0.2」ということを意味している。