[toc:ul]
HĐKP 1
Bảng dưới
Kết luận
Mẫu số liệu ghép nhóm thường được trình bày dưới dạng bảng thống kê có dạng
Nhóm | [u$_{1}$;u$_{2}$) | [u$_{2}$;u$_{3}$) | … | [u$_{K}$;u$_{k+1}$) |
Tần số | n$_{1}$ | n$_{2}$ | … | n$_{K}$ |
Trong đó:
+ Bảng trên gồm k nhóm [u$_{j}$;u$_{j}$+1) với 1≤j≤k
+ Cỡ mẫu n=n$_{1}$+n$_{2}$+..+n$_{k}$
+ Giá trị đại diện của nhóm [u$_{j}$;u$_{j+1}$) là $\frac{1}{2}$(u$_{j}$+u$_{j+1}$)
+ Hiệu u$_{j+1}$-u$_{j}$ được gọi là độ dài của nhóm [u$_{j}$;u$_{j+1}$).
Ví dụ 1 (SGK -tr.130)
Một số quy tắc ghép nhóm của mẫu số liệu
- Sử dụng từ k = 5 đến k = 20. Cỡ mẫu càng lớn thì cần càng nhiều nhóm số liệu.
- Các nhóm có cùng độ dài bằng L thỏa mãn R<k.L, trong đó R là khoảng biến thiến, k là số nhóm.
- Giá trị nhỏ nhất của mẫu thuộc vào nhóm [u$_{1}$;u$_{2}$) và càng gần u1càng tốt. Giá trị lớn nhất của mẫu thuộc nhóm [u$_{k}$;u$_{k+1}$) và càng gần u$_{k+1}$ càng tốt.
Ví dụ 2 (SGK -tr.131)
Chú ý
+ Các đầu mút của các nhóm có thể không là giá trị của mẫu số liệu.
+ Để thuận lợi cho việc tính các số đặc trưng, ta có thể hiệu chỉnh về bằng cách thêm và bớt 0,5 đơn vị vào đầu mút bên phải và bên trái của mỗi nhóm số liệu.
Ví dụ
Hiệu chỉnh thành
Thực hành 1
Khoảng biến thiên của mẫu số liệu đã cho là R=29-10=19.
Độ dài mỗi nhóm L>$\frac{19}{5}$=3,8. Ta chọn L=4 và chia dữ liệu thành các nhóm [10;14 ), [14;18),[18;22),[22;26),[26;30). Khi đó ta có bảng tần số ghép nhóm như sau:
Số ba lô | [10;14) | [14;18) | [18;22) | [22;26) | [26;30) |
Giá trị đại diện | 12 | 16 | 20 | 24 | 28 |
Số ngày | 8 | 5 | 8 | 3 | 6 |
Chú ý: Có thể có nhiều cách chia nhóm khác nhau.
HĐKP 2
a) c$_{1}$=18,5;c$_{2}$=23,5;c$_{3}$=28,5;c$_{4}$=33,5;c$_{5}$=38,5.
b) n$_{1}$c$_{1}$+n$_{2}$c$_{2}$+n$_{3}$c$_{3}$+n$_{4}$c$_{4}$+n$_{5}$c$_{5}$
=4.18,5+6.23,5+8⋅28,5+18⋅33,5+4⋅38,5
=1200.
c) $\bar{x}$=$\frac{n_{1}c_{1}+n_{2}c_{2}+n_{3}c_{3}+n_{4}c_{4}+n_{5}c_{5}}{40}$=$\frac{1200}{40}$=30.
Kết luận
Giả sử mẫu số liệu được cho dưới dạng bảng tần số ghép nhóm
Nhóm | Nhóm 1 | Nhóm 2 | … | Nhóm k |
Giá trị đại diện | c$_{1}$ | c$_{2}$ | … | c$_{k}$ |
Tần số | n$_{1}$ | n$_{2}$ | … | n$_{k}$ |
Số trung bình của mẫu số liệu ghép nhóm, kí hiệu là $\bar{x}$.
$\bar{x}$=$\frac{n_{1}c_{1}+...+n_{k}c_{k}}{n}$
trong đó, n=$n_{1}$+...+$n_{k}$
Ví dụ 3 (SGK -tr.132)
*) Ý nghĩa của số trung bình của mẫu số liệu ghép nhóm
- Số trung bình của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho số trung bình của mẫu số liệu gốc. Nó thường dùng để đo xu thế trung tâm của mẫu số liệu.
Thực hành 2
Trung bình số câu trả lời đúng của học sinh lớp 11 A1 xấp xỉ bằng 30 .
Thực hành 3
Cân nặng trung bình của học sinh tính theo mẫu số liệu ghép nhóm là:
$\bar{x}$=$\frac{4.47+5.51+7.55+7.59+5.63}{28}$≈55,57
Cân nặng trung bình của học sinh tính theo mẫu số liệu gốc là: 55,45.
Vậy cân nặng trung bình của học sinh tính theo mẫu số liệu ghép nhóm gần bằng cân nặng trung bình của học sinh tính theo mẫu số liệu gốc.
HĐKP 3
Khách nam ở khoảng tuổi [40;50) mua bảo hiểm nhiều nhất.
Khách nữ ở khoảng tuổi [30; 40) mua bảo hiểm nhiều nhất.
Từ mẫu số liệu ghép nhóm ta không thể tìm được mốt của mẫu số liệu gốc.
Kết luận
Nhóm chứa mốt của mẫu số liệu ghép nhóm là nhóm có tần số lớn nhất.
Giả sử nhóm chứa mốt là [u$_{m}$;u$_{m+1}$), khi đó mốt của mẫu số liệu (kí hiệu Mo
M$_{o}$=u$_{m}$+$\frac{n_{m}-n_{m-1}}{(n_{m}-n_{m-1})+(n_{m}-n_{m+1})}$⋅(u$_{m+1}$-u$_{m}$)
Chú ý:
+ Nếu không có nhóm kề trước của nhóm chứa mốt thì n$_{m-1}$=0. Nếu không có nhóm kề sau của nhóm chứa mốt thì n$_{m+1}$=0
Ví dụ 4 (SGK -tr.133)
Ví dụ 5 (SGK -tr.133)
*) Ý nghĩa của mốt của mẫu số liệu ghép nhóm
+ Mốt của mẫu số liệu không ghép nhóm là giá trị có khả năng xuất hiện cao nhất khi lấy mẫu. Mốt của mẫu số liệu sau khi ghép nhóm M$_{o}$, xấp xỉ với mốt của mẫu số liệu không ghép nhóm. Các giá trị nằm xung quanh M$_{o}$ thường có khả năng xuất hiện cao hơn các giá tị khác.
+ Một mẫu số liệu ghép nhóm có thể có nhiều nhóm chứa mốt và nhiều mốt.
Thực hành 4
Bảng thống kê số lượng khách hàng nữ theo tuôi:
Khoảng tuổi | [20;30) | [30;40) | [40;50) | [50;60) | [60;70) |
Số khách hàng nữ | 3 | 9 | 6 | 4 | 2 |
Nhóm chứa mốt của mẫu số liệu trên là nhóm [30;40).
Do đó u$_{m}$=30;u$_{m+1}$=40;n$_{m}$=9;n$_{m-1}$=3;n$_{m+1}$=6.
Mốt của mẫu số liệu trên là
M$_{0}$=30+$\frac{9-3}{(9-3)+(9-6)}$⋅(40-30)=$\frac{110}{3}$≈36,7
Bảng thống kê số lượng khách hàng nam theo tuổi:
Khoảng tuổi | [20;30) | [30;40) | [40;50) | [50;60) | [60;70) |
Số khách hàng nam | 4 | 6 | 10 | 7 | 3 |
Nhóm chứa mốt của mẫu số liệu là nhóm [40; 50).
Do đó u$_{m}$=40;u$_{m+1}$=50;n$_{m}$=10;n$_{m-1}$=6;n$_{m+1}$=7.
Mốt của mẫu số liệu trên là
M$_{0}$=40+$\frac{10-6}{(10-6)+(10-7)}$=$\frac{320}{7}$≈45,7
Vậy khách hàng nữ từ 36 tuổi đến 37 tuổi và khách hàng nam từ 45 tuổi đến 46 tuổi hay mua bảo hiểm nhất.