Bài 4. Phương sai và độ lệch chuẩn

I. Phương sai

a) Khi hai dãy có số liệu thống kê có cùng đơn vị đo và có số trung bình cộng bằng nhau hoặc xấp xỉ nhau, nếu phương sai càng nhỏ thì mức độ phân tán (so với số trung bình cộng) của số liệu thống kê càng bé.

b) Có thể tính phương sai theo công thức sau đây:

${s^2} = \frac{1}{n}\left[ {{n_1}{{\left( {{x_1} - \overline x } \right)}^2} + {n_2}{{\left( {{x_2} - \overline x } \right)}^2} + .... + {n_k}{{\left( {{x_k} - \overline x } \right)}^2}} \right] = {f_1}{\left( {{x_1} - \overline x } \right)^2} + {f_2}{\left( {{x_2} - \overline x } \right)^2} + ... + {f_k}{\left( {{x_k} - \overline x } \right)^2}$

trong đó ${n_i},{f_i}$ lần lượt là tần số, tuần suất của giá trị ${x_i}$; n là số các số liệu thống kê ($n = {n_1} + {n_2} + ... + {n_k}$); $\overline x $ là trung bình cộng của các số liệu đã cho.

* Trường  hợp bảng phân bố tần số, tần suất ghép lớp

${s^2} = \frac{1}{n}\left[ {{n_1}{{\left( {{c_1} - \overline x } \right)}^2} + {n_2}{{\left( {{c_2} - \overline x } \right)}^2} + .... + {n_k}{{\left( {{c_k} - \overline x } \right)}^2}} \right] = {f_1}{\left( {{c_1} - \overline x } \right)^2} + {f_2}{\left( {{c_2} - \overline x } \right)^2} + ... + {f_k}{\left( {{c_k} - \overline x } \right)^2}$

trong đó ${c_i},{n_i},{f_i}$ lần lượt là tần số, tuần suất của giá trị $i;n$ là số các số liệu thống kê ($n = {n_1} + {n_2} + ... + {n_k}$); $\overline x $ là trung bình cộng của các số liệu đã cho.

II. Độ lệch chuẩn

Phương sai ${s^2}$ và độ lệch chuẩn s đều được dùng để đánh giá mức độ phân tán của các số liệu thống kê (so với số trung bình cộng). Nhưng khi cần chú ý đến đơn vị đo thì ta dùng s, s có cùng đơn vị đo với dấu hiệu được nghiên cứu.