[toc:ul]
HĐKP 1
a) Bảng thống kê (Bảng dưới)
b)
Đội Sao La và đội Kim Ngưu đều có 20 thành viên.
Nhóm chứa giá trị trung vị chiều cao thành viên của đội Sao La là [180; 185).
Nhóm chứa giá trị trung vị chiều cao thành viên của đội Kim Ngưu là [185;190).
Kết luận
Công thức xác định trung vị của mẫu số liệu ghép nhóm
Gọi n là cỡ mẫu, giả sử nhóm [u$_{m}$;u$_{m+1}$) chứa trung vị;
n$_{m}$ là tần số của nhóm chứa trung vị,
C=n$_{1}$+n$_{2}$+…+n$_{m-1}$
M$_{e}$=u$_{m}$+$\frac{\frac{n}{2}-C}{n_{m}}$.(u$_{m+1}$-u$_{m}$)
Ví dụ 1 (SGK -tr.136)
Ví dụ 2 (SGK -tr.137)
*) Ý nghĩa:
+ Từ dữ liệu ghép nhóm nói chung không thể xác định chính xác trung vị của mẫu số liệu gốc.
+ Trung vị của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho mẫu số liệu gốc và có thể lấy làm giá trị đại diện cho mẫu số liệu.
Thực hành 1
+ Chiều cao trung bình của các thành viên đội Sao La xấp xỉ
$\frac{172,5.2+177,5.4+182,5.5+187,5.5+192,5.4}{20}$=183,75 (m)
Chiều cao trung bình của thành viên đội Kim Ngưu xấp xỉ
$\frac{172,5.2+177,5.3+182,5.4+187,5.10+192,5.1}{20}$=183,75 (m)
Do đó, nếu so sánh theo số trung bình thì chiều cao của các thành viên hai đội bóng bằng nhau.
+ Đối với đội Sao La:
Nhóm chứa số trung vị của đội Sao La là [180;185)
Ta có: n=20;n$_{m}$=5,C=2+4=6;u$_{m}$=180;u$_{m+1}$=185
Trung vị của mẫu số liệu nhóm Sao La là:
M$_{e}$=180+$\frac{\frac{20}{2}-6}{5}$.(185-180)=184 (m)
+ Đối với đội Kim Ngưu,
Nhóm chứa số trung vị của đội Kim Ngưu là [185;190)
Ta có: n=20;n$_{m}$=10,C=2+3+4=9;u$_{m}$=185;u$_{m+1}$=190
Trung vị của mẫu số liệu nhóm Kim Ngưu là:
M$_{e}$=185+$\frac{\frac{20}{2}-9}{10}$.(190-185)=185,5 (m)
Do đó, nếu so sánh theo trung vị thì chiều cao của các thành viên đội Kim Ngưu cao hơn các thành viên đội Sao La.
Vận dụng 1
Số vận động viên tham gia chạy là: n = 5 + 12 + 32 + 45 + 30 = 124
Gọi x$_{1}$;x$_{2}$;x$_{3}$;...;x$_{124}$ lần lượt là thời gian chạy của 124 vận động viên theo thứ tự không giảm.
Trung vị của mẫu số liệu ghép nhóm là $\frac{1}{2}$(x$_{62}$+x$_{63}$)∈[22,5;23)
Ta có: n=124;n$_{m}$=45;C=5+12+32=49;u$_{m}$=22,5;u$_{m+1}$=23
Trung vị của mẫu số liệu ghép nhóm là:
M$_{e}$=22,5+$\frac{\frac{124}{2}-49}{45}$.(23-22,5)≈22,64
Vậy ban tổ chức nên chọn các vận động viên có thời gian chạy không vượt quá 22.64 giây để tiếp tục thi vòng 2.
HĐKP 2
Để lựa chọn 25% các vận động viên có số giờ luyện tập cao nhất thì ta thực hiện
+ Cần sắp xếp mẫu số liệu theo thứ tự không giảm.
+ Chia thành 4 phần đều nhau.
+ Để xác định 25% người có thời gian cao nhất cần xác định tứ phân vị thứ ba của mẫu số liệu.
*) Dãy số liệu có n=39
*) Tứ phân vị thứ nhất là x$_{10}$ thuộc nhóm [2;4).
*) Tứ phân vị thứ hai là x$_{20}$ thuộc nhóm [4;6).
*) Tứ phân vị thứ ba là x$_{30}$ thuộc nhóm [6;8).
Kết luận
Công thức xác định tứ phân vị của mẫu số liệu ghép nhóm
+) Tứ phân vị thứ hai của mẫu số liệu ghép nhóm, kí hiệu Q$_{2}$, là trung vị của mẫu số liệu ghép nhóm.
+) Giả sử nhóm [u$_{m}$;u$_{m+1}$) chứa tứ phân vị thứ nhất;
n$_{m}$ là tần số của nhóm chứa tứ phân vị thứ nhất ,
C=n$_{1}$+n$_{2}$+…+n$_{m-1}$
Q$_{1}$=u$_{m}$+$\frac{\frac{n}{4}-C}{n_{m}}$.(u$_{m+1}$-u$_{m}$).
+) Giả sử nhóm [u$_{j}$;u$_{j+1}$) chứa tứ phân vị thứ ba;
n$_{j}$ là tần số của nhóm chứa tứ phân vị thứ ba,
C=n$_{1}$+n$_{2}$+…+n$_{j-1}$
Q$_{3}$=u$_{j}$+$\frac{\frac{3n}{4}-C}{n_{j}}$.(u$_{j+1}$-u$_{j}$).
Ví dụ 3 (SGK -tr.139)
- Chú ý: Nếu tứ phân vị thứ k là $\frac{1}{2}$(x$_{m}$+x$_{m+1}$), trong đó x$_{m}$ và x$_{m+1}$ thuộc hai nhóm liên tiếp, ví dụ x$_{m}$∈[u$_{j-1}$;u$_{j}$) và x$_{m+1}$∈[u$_{j}$;u$_{j+1}$) thì ta lấy Q$_{k}$=u$_{j}$.
Ví dụ 4 (SGK -tr.139)
*) Ý nghĩa:
+ Ba điểm tứ phân vị chia mẫu số liệu đã sắp xếp theo thứ tự không giảm thành bốn phần đều nhau.
+ Tứ phân vị thứ nhất và thứ ba đo xu thế trung tâm của nửa dưới ( các dữ liệu nhỏ hơn Q$_{2}$) và nửa trên (các dữ liệu lớn hơn Q$_{2}$) của mẫu số liệu.
Thực hành 2
Gọi x$_{1}$;x$_{2}$;…;x$_{33}$ là mẫu số liệu được xếp theo thứ tự không giảm.
Tứ phân vị thứ hai của dãy số liệu x$_{1}$;x$_{2}$;…;x$_{33}$ là x$_{17}$∈[60;120). Do đó, tứ phân vị thứ hai của mẫu số liệu ghép nhóm là Q$_{2}$=111.
Tứ phân vị thứ nhất của dãy số liệu x$_{1}$;x$_{2}$;…;x$_{33}$ là $\frac{1}{2}$(x$_{8}$+x$_{9}$) với x$_{8}$∈[0;60) và x$_{9}$∈[60;120) nên tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là Q$_{1}$=60.
Tứ phân vị thứ ba của dãy số liệu x$_{1}$;x$_{2}$;…;x$_{33}$ là $\frac{1}{2}$(x$_{25}$+x$_{26}$) với x$_{25}$∈[120;180) và x$_{26}$∈[180;240) nên tứ phân vị thứ ba của mẫu số liệuu ghép nhóm là Q$_{3}$=180.
Vận dụng 2
Do số bệnh nhân là số nguyên nên ta hiệu chỉnh lại bảng tần số ghép nhóm như sau:
Số bệnh nhân | [0,5; 10,5) | [10,5; 20,5) | [20,5; 30,5) | [30,5; 40,5) | [40,5; 50,5) |
Số ngày | 7 | 8 | 7 | 6 | 2 |
a) Gọi x$_{1}$;x$_{2}$;…;x$_{30}$ là mẫu số liệu được xếp theo thứ tư không giảm.
Tứ phân vị thứ hai của dãy số liệu x$_{1}$;x$_{2}$;…;x$_{30}$ là 12(x$_{15}$+x$_{16}$) với x$_{15}$∈[10,5;20,5) và x$_{16}$∈[20,5;30,5). Do đó, tứ phân vị thứ hai của mẫu số liệu ghép nhóm là Q$_{2}$=20,5.
Tứ phân vị thứ nhất của dãy số liệu x$_{1}$;x$_{2}$;…;x$_{30}$ là x$_{8}$∈[10,5;20,5) nên tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là Q$_{1}$=$\frac{89}{8}$=11,125.
Tứ phân vị thứ ba của dãy số liệu x$_{1}$;x$_{2}$;…;x$_{30}$ là x$_{23}$∈[30,5;40,5) nên tứ phân vị thứ ba của mẫu số liệu ghép nhóm là Q$_{3}$=$\frac{94}{3}$≈31,3.
b) Do Q$_{3}$=31,3<35 nên số ngày có trên 35 bệnh nhân đến khám chiếm chưa tới 25%. Do đó, nhận định của quản lí phòng khám là chưa hợp lí.