MỞ ĐẦU
Câu hỏi: Biểu đồ bên thống kê chiều cao (đơn vị: cm) của các vận động viên hai động bóng rổ Sao La và Kim Ngưu.
Hãy so sánh chiều cao của các vận động viên hai đội bóng theo số trung bình và số trung vị
1. Trung vị
Khám phá 1: a) Sử dụng biểu đồ ở Mở đầu, hoàn thiện bảng thống kê sau:
Chiều cao (cm) | [170;175) | [175;180) | [180;185) | [185;190) | [190;195) |
Đội Sao La | 2 | 4 | 5 | 5 | 4 |
Đội Kim Ngưu | ? | ? | ? | ? | ? |
b) Tìm các nhóm chứa giá trị trung vị chiều cao thành viên của mỗi đội
Hướng dẫn trả lời:
a)
Chiều cao (cm) | [170;175) | [175;180) | [180;185) | [185;190) | [190;195) |
Đội Sao La | 2 | 4 | 5 | 5 | 4 |
Đội Kim Ngưu | 2 | 3 | 4 | 10 | 1 |
b) Nhóm chứa giá trị trung vị chiều cao thành viên đội Sao La là [180;185)
Nhóm chứa giá trị trung vị chiều cao thành viên đội Kim Ngưu là [185;190)
Thực hành 1: Hãy trả lời câu hỏi ở Mở đầu
Hướng dẫn trả lời:
Ta có số liệu thống kê chiều cao thành viên đội Sao La ở bảng sau:
Chiều cao | [170;175) | [175;180) | [180;185) | [185;190) | [190;195) |
Giá trị đại diện | 172,5 | 177,5 | 182,5 | 187,5 | 192,5 |
Số thành viên | 2 | 4 | 5 | 5 | 4 |
Chiều cao trung bình thành viên đội Sao La xấp xỉ bằng:
$(172,5.2+177,5.4+182,5.5+187,5.5+192,5.4):20 = 183,75$ (m)
Nhóm chứa số trung vị của đội Sao La là [180;185)
Ta có: $n = 20; n_{m} = 5, C = 2+4 = 6; u_{m} = 180; u_{m+1} = 185$
Trung vị của mẫu số liệu nhóm Sao La là:
$M_{e} = 180 +\frac{\frac{20}{2}-6}{5}.(185-180) = 184$ (m)
Ta có số liệu thống kê chiều cao thành viên đội Kim Ngưu ở bảng sau:
Chiều cao | [170;175) | [175;180) | [180;185) | [185;190) | [190;195) |
Giá trị đại diện | 172,5 | 177,5 | 182,5 | 187,5 | 192,5 |
Số thành viên | 2 | 3 | 4 | 10 | 1 |
Chiều cao trung bình thành viên đội Kim Ngưu xấp xỉ bằng:
$(172,5.2+177,5.3+182,5.4+187,5.10+192,5.1):20 = 183,75$ (m)
Nhóm chứa số trung vị của đội Kim Ngưu là [185;190)
Ta có: $n = 20; n_{m} = 10, C = 2+3+4 = 9; u_{m} = 185; u_{m+1} = 190$
Trung vị của mẫu số liệu nhóm Sao La là:
$M_{e} = 185 +\frac{\frac{20}{2}-9}{10}.(190-185) = 185,5$ (m)
Vậy chiều cao trung bình của đội Sao La và Kim Ngưu bằng nhau
Số trung vị của đội Sao La nhỏ hơn số trung vị của đội Kim Ngưu
Vận dụng 1: Trong một hội thao, thời gian chạy 200 m của một nhóm các vận động viên được ghi lại ở bảng sau:
Thời gian (giây) | [21;21,5) | [21,5;22) | [22;22,5) | [22,5;23) | [23;23,5) |
Số vận động viên | 5 | 12 | 32 | 45 | 30 |
Dựa vào bảng số liệu trên, ban tổ chức muốn chọn ra khoảng 50% số vận động viên chạy nhanh nhất để tiếp tục thi vòng 2. Ban tổ chức nên chọn các vận động viên có thời gian chạy không quá bao nhiêu giây?
Hướng dẫn trả lời:
Số vận động viên tham gia chạy là: n = 5 + 12 + 32 + 45 + 30 = 124
Gọi $x_{1};x_{2};x_{3};...;x_{124}$ lần lượt là thời gian chạy của các vận động viên theo thứ tự từ nhỏ đến lớn
Do $x_{1},...,x_{5} \in [21;21,5); x_{6},...,x_{17} \in [21,5;22)$; $x_{18},...,x_{49} \in [22;22,5); x_{50},...,x_{94} \in [22,5;23);...$ nên trung vị của mẫu số liệu thuộc nhóm [22,5;23)
Ta có: $n = 124; n_{m} = 45; C = 5 + 12 + 32 = 49; u_{m}=22,5; u_{m+1} = 23$
Trung vị của mẫu số liệu ghép nhóm là:
$M_{e} = 22,5 + \frac{\frac{124}{2}-49}{45}.(23-22,5) = 22,6$
Vậy ban tổ chức nên chọn các vận động viên có thời gian chạy không quá 22,6 giây
2. Tứ trung vị
Khám phá 2: Thời gian luyện tập trong một ngày (tính theo giờ) của một số vận động viên được ghi lại ở bảng sau:
Thời gian luyện tập (giờ) | [0;2) | [2;4) | [4;6) | [6;8) | [8;10) |
Số vận động viên | 3 | 8 | 12 | 12 | 4 |
Huấn luyện viên muốn xác định nhóm gồm 25% các vận động viên có số giờ luyện tập cao nhất. Hỏi huấn luyện viên nên chọn các vận động viên có thời gian luyện tập từ bao giờ trở lên
Hướng dẫn trả lời:
Số vận động viên tham gia khảo sát là: n = 3 + 8 + 12 + 12 + 4 = 39
Gọi $x_{1};x_{2};x_{3};...;x_{39}$ lần lượt là thời gian luyện tập của các vận động viên theo thứ tự từ nhỏ đến lớn
Do $x_{1},...,x_{3} \in [0;2); x_{4},...,x_{11} \in [2;4)$; $x_{12},...,x_{23} \in [4;6); x_{24},...,x_{35} \in [6;8)$;$x_{36},...,x_{39} \in [8;10)$
Nên ta có:
Tứ phân vị thứ nhất là $x_{10}$ thuộc nhóm [2;4)
Tứ phân vị thứ hai là $x_{20}$ thuộc nhóm [4;6)
Tứ phân vị thứ ba là $x_{30}$ thuộc nhóm [6;8)
$x_{30} = 6 + \frac{\frac{3.39}{4}-(3+8+12)}{12}(8-6) = 7,042$
Vậy huấn luyện viên nên chọn các vận động viên có thời gian luyện tập từ 7,042 giờ trở lên
Thực hành 2: Một người thống kê lại thời gian thực hiện các cuộc gọi điện thoại của người đó trong một tuần ở bảng sau:
Thời gian (giây) | [0;60) | [60;120) | [120;180) | [180;240) | [240;300) | [300;360) |
Số cuộc gọi | 8 | 10 | 7 | 5 | 2 | 1 |
Hãy ước lượng các tứ phân vị của mẫu số liệu ghép nhóm trên
Hướng dẫn trả lời:
Số lần thực hiện cuộc gọi là: n = 8 + 10 + 7 + 5 + 2 + 1 = 33
Gọi $x_{1};x_{2};x_{3};...;x_{33}$ lần lượt là thời gian thực hiện cuộc gọi theo thứ tự không gian
Do $x_{1},...,x_{8} \in [0;60); x_{9},...,x_{18} \in [60;120);x_{19},...,x_{25} \in [120;180)$; $x_{26},...,x_{30} \in [180;240);....$
Tứ phân vị thứ hai của dãy số liệu là $\frac{1}{2}(x_{16}+x_{17})$ thuộc nhóm [60;120) nên tứ phân vị thứ hai của mẫu số liệu là $Q_{2} = 60 + \frac{\frac{33}{2}-8}{10}(120-60) = 111$
Tứ phân vị thứ nhất của dãy số liệu là $\frac{1}{2}(x_{8}+x_{9})$ thuộc nhóm [60;120) nên tứ phân vị thứ nhất của mẫu số liệu là $Q_{1} = 60 + \frac{\frac{33}{4}-8}{10}(120-60) = 61,5$
Tứ phân vị thứ ba của dãy số liệu là $\frac{1}{2}(x_{24}+x_{25})$ thuộc nhóm [120;180) nên tứ phân vị thứ ba của mẫu số liệu là $Q_{3} = 120 + \frac{\frac{3.33}{4}-18}{7}(180-120) = 177,8$
Vận dụng 2: Một phòng khám thống kê số bệnh nhân đến khám bệnh mỗi ngày trong 4 háng năm 2022 ở bảng sau:
Số bệnh nhân | [1;10] | [11;20] | [21;30] | [31;40] | [41;50] |
Số ngày | 7 | 8 | 7 | 6 | 2 |
a) Hãy ước lượng các tứ phân vị của mẫu số liệu ghép nhóm trên
b) Quản lí phòng khám cho rằng có khoảng 25% số ngày khám có nhiều hơn 35 bệnh nhân đến khám. Nhận định trên có hợp lí không?
Hướng dẫn trả lời:
Do số bệnh nhân là số nguyên nên ta hiệu chỉnh lại như sau:
Số bệnh nhân | [0,5;10,5) | [10,5;20,5) | [20,5;30,5) | [30,5;40,5) | [40,5;50,5) |
Số ngày | 7 | 8 | 7 | 6 | 2 |
Gọi $x_{1};x_{2};x_{3};...;x_{30}$ lần lượt là số ngày theo thứ tự không gian
Do $x_{1},...,x_{7} \in [0,5;10,5); x_{8},...,x_{15} \in [10,5;20,5);x_{16},...,x_{22} \in [20,5;30,5)$; $x_{23},...,x_{28} \in [30,5;40,5);x_{29},x_{30} \in [40,5;50,5)$
Tứ phân vị thứ hai của dãy số liệu là $\frac{1}{2}(x_{15}+x_{16})$ thuộc nhóm [20,5;30,5) nên tứ phân vị thứ hai của mẫu số liệu là $Q_{2} = 20,5 + \frac{\frac{30}{2}-15}{7}(30,5-20,5) = 20,5$
Tứ phân vị thứ nhất của dãy số liệu là $\frac{1}{2}(x_{7}+x_{8})$ thuộc nhóm [10,5;20,5) nên tứ phân vị thứ nhất của mẫu số liệu là $Q_{1} = 10,5 + \frac{\frac{30}{4}-7}{8}(20,5-10,5) = 11,125$
Tứ phân vị thứ ba của dãy số liệu là $\frac{1}{2}(x_{22}+x_{23})$ thuộc nhóm [30,5;40,5) nên tứ phân vị thứ ba của mẫu số liệu là $Q_{3} = 30,5 + \frac{\frac{3.30}{4}-22}{6}(40,5-30,5) = 31,3$
b) Do ba điểm tứ phân vị chia mẫu số liệu thành bốn phần, mỗi phần chứa 25% số lượng các số liệu nên nhận định trên là hợp lí
BÀI TẬP
Bài 1: Lương tháng của một số nhân viên văn phòng được ghi lại như sau (đơn vị: triệu đồng)
12,5 | 9,6 | 11,7 | 12,7 | 10,0 | 10,0 | 12,2 | 9,8 | 10,9 | 6,7 | 13,6 | 9,2 |
13,1 | 6,5 | 10,7 | 8,9 | 11,2 | 13,2 | 8,3 | 11,1 | 11,9 | 8,4 | 6,7 | 13,8 |
a) Tìm tứ phân vị của dãy số liệu trên
b) Tổng hợp lại dãy số liệu trên vào bảng tần số ghép nhóm theo mẫu sau:
Lương tháng (triệu đồng) | [6;8) | [8;10) | [10;12) | [12;14) |
Số nhân viên | ? | ? | ? | ? |
c) Hãy ước lượng tứ phân vị của số liệu ở bảng tần số ghép nhóm trên
Hướng dẫn trả lời:
a) Tứ phân vị thứ nhất là: 9,01
Tứ phân vị thứ hai là: 10,8
Tứ phân vị thứ ba là: 12,35
b)
Lương tháng (triệu đồng) | [6;8) | [8;10) | [10;12) | [12;14) |
Số nhân viên | 3 | 6 | 8 | 7 |
c) Gọi $x_{1};x_{2};x_{3};...;x_{24}$ lần lượt là số nhân viên theo thứ tự không gian
Do $x_{1},...,x_{3} \in [6;8); x_{4},...,x_{9} \in [8;10);x_{10},...,x_{17} \in [10;12)$; $x_{18},...,x_{24} \in [12;14)$
Tứ phân vị thứ hai của dãy số liệu là $\frac{1}{2}(x_{12}+x_{13})$ thuộc nhóm [10;12) nên tứ phân vị thứ hai của mẫu số liệu là $Q_{2} = 10 + \frac{\frac{24}{2}-9}{8}(12-10) = 10,75$
Tứ phân vị thứ nhất của dãy số liệu là $\frac{1}{2}(x_{6}+x_{7})$ thuộc nhóm [8;10) nên tứ phân vị thứ nhất của mẫu số liệu là $Q_{1} = 8 + \frac{\frac{24}{4}-3}{6}(10-8) = 9$
Tứ phân vị thứ ba của dãy số liệu là $\frac{1}{2}(x_{18}+x_{19})$ thuộc nhóm [12;14) nên tứ phân vị thứ ba của mẫu số liệu là $Q_{3} = 12 + \frac{\frac{3.24}{4}-17}{7}(14-12) = 12,3$
Bài 2: Số điểm một cầu thủ bóng rổ ghi được trong 20 trận đấu được cho ở bảng sau:
25 | 23 | 21 | 13 | 8 | 14 | 15 | 18 | 22 | 11 |
24 | 12 | 14 | 14 | 18 | 6 | 8 | 25 | 10 | 11 |
a) Tìm tứ phân vị của dãy số liệu trên
b) Tổng hợp lại dãy số liệu vào bảng tần số ghép nhóm theo mẫu sau:
Điểm số | [6;10] | [11;15] | [16;20] | [21;25] |
Số trận | ? | ? | ? | ? |
c) Hãy ước lượng phân vị của số liệu từ bảng tần số ghép nhóm trên
Hướng dẫn trả lời:
a) Tứ phân vị thứ nhất là: 11
Tứ phân vị thứ hai là: 14
Tứ phân vị thứ ba là: 21,5
b)
Điểm số | [6;10] | [11;15] | [16;20] | [21;25] |
Số trận | 3 | 9 | 2 | 6 |
c) Vì số trận là số nguyên nên ta hiệu chỉnh lại như sau:
Điểm số | [5,5;10,5) | [10,5;15,5) | [15,5;20,5) | [20,5;25,5) |
Số trận | 3 | 9 | 2 | 6 |
Gọi $x_{1};x_{2};x_{3};...;x_{20}$ lần lượt là số trận theo thứ tự không gian
Do $x_{1},...,x_{3} \in [5,5;10,5); x_{4},...,x_{12} \in [10,5;15,5);x_{13},x_{14} \in [15,5;20,5)$; $x_{15},...,x_{20} \in [20,5;25,5)$
Tứ phân vị thứ hai của dãy số liệu là $\frac{1}{2}(x_{10}+x_{11})$ thuộc nhóm [10,5;15,5) nên tứ phân vị thứ hai của mẫu số liệu là $Q_{2} = 10,5 + \frac{\frac{20}{2}-3}{9}(15,5-10,5) = 14,4$
Tứ phân vị thứ nhất của dãy số liệu là $\frac{1}{2}(x_{5}+x_{6})$ thuộc nhóm [10,5;15,5) nên tứ phân vị thứ nhất của mẫu số liệu là $Q_{1} = 10,5 + \frac{\frac{20}{4}-3}{9}(15,5-10,5) = 11,6$
Tứ phân vị thứ ba của dãy số liệu là $\frac{1}{2}(x_{15}+x_{16})$ thuộc nhóm [20,5;25,5) nên tứ phân vị thứ ba của mẫu số liệu là $Q_{3} = 20,5 + \frac{\frac{3.20}{4}-14}{6}(25,5-20,5) = 21,3$
Bài 3: Kiểm tra điện lượng của một số viên pin tiểu do một hãng sản xuất thu được kết quả sau:
Điện lượng (nghìn mAh) | [0,9;0,95) | [0,95;1,0) | [1,0;1,05) | [1,05;1,1) | [1,1;1,15) |
Số viên pin | 10 | 20 | 35 | 15 | 5 |
Hãy ước lượng số trung bình, mốt và tứ phân vị của mẫu số liệu ghép nhóm trên
Hướng dẫn trả lời:
Điện lượng (nghìn mAh) | [0,9;0,95) | [0,95;1,0) | [1,0;1,05) | [1,05;1,1) | [1,1;1,15) |
Giá trị đại diện | 0,925 | 0,975 | 1,025 | 1,075 | 1,125 |
Số viên pin | 10 | 20 | 35 | 15 | 5 |
Số trung bình của dãy số liệu xấp xỉ bằng:
$(0,925.10+0,975.20+1,025.35+1,075.15+1,125.5):85 = 1,016$
Nhóm chứa mốt của dãy số liệu là: [1,0;1,05)
$M_{0} = 1,0 + \frac{35-20}{(35-20)+(35-15)}.(1,05-1,0) = 1,02$
Gọi $x_{1};x_{2};x_{3};...;x_{85}$ lần lượt là số viên pin theo thứ tự không gian
Do $x_{1},...,x_{10} \in [0,9;0,95); x_{11},...,x_{30} \in [0,95;1,0);x_{31},...,x_{65} \in [1,0;1,05)$; $x_{66},...,x_{80} \in [1,05;1,1); x_{81},...,x_{85} \in [1,1;1,15)$
Tứ phân vị thứ hai của dãy số liệu là $\frac{1}{2}(x_{42}+x_{43})$ thuộc nhóm [1,0;1,05) nên tứ phân vị thứ hai của mẫu số liệu là $Q_{2} = 1,0 + \frac{\frac{85}{2}-30}{35}(1,05-1,0) = 1,02$
Tứ phân vị thứ nhất của dãy số liệu là $\frac{1}{2}(x_{21}+x_{22})$ thuộc nhóm [0,95;1,0) nên tứ phân vị thứ nhất của mẫu số liệu là $Q_{1} = 0,95 + \frac{\frac{85}{4}-10}{20}(1,0-0,95) = 0,98$
Tứ phân vị thứ ba của dãy số liệu là $\frac{1}{2}(x_{63}+x_{64})$ thuộc nhóm [1,0;1,05) nên tứ phân vị thứ ba của mẫu số liệu là $Q_{3} = 1,0 + \frac{\frac{3.85}{4}-30}{35}(1,05-1,0) = 1,048$
Bài 4: Cân nặng của một con lợn con mới sinh thuộc hai giống A và B được cho ở biểu đồ dưới đây (đơn vị: kg)
a) Hãy so sánh cân nặng của lớn con mới sinh giống A và giống B theo số trung bình và trung vị
b) Hãy ước lượng tứ phân vị thứ nhất và thứ ba của cân nặng lợn con mới sinh giống A và của cân nặng lợn con mới sinh giống B
Hướng dẫn trả lời:
Cân nặng của lợn con giống A và giống B được thống kê như bảng sau:
Cân nặng (kg) | [1,0;1,1) | [1,1;1,2) | [1,2;1,3) | [1,3;1,4) |
Giá trị đại diện | 1,05 | 1,15 | 1,25 | 1,35 |
Số con giống A | 8 | 28 | 32 | 17 |
Số con giống B | 13 | 14 | 24 | 14 |
a) Số cân nặng trung bình của lợn con giống A là:
$(1,05.8+1,15.28+1,25.32+1,35.17):85 = 1,22$ (kg)
Số cân nặng trung bình của lợn con giống B là:
$(1,05.13+1,15.14+1,25.24+1,35.14):65 = 1,21$ (kg)
Vậy cân nặng trung bình của lớn con giống A lớn hơn giống B
Gọi $x_{1};x_{2};x_{3};...;x_{85}$ lần lượt là số lợn con giống A theo thứ tự không gian
Do $x_{1},...,x_{8} \in [1,0;1,1); x_{9},...,x_{36} \in [1,1;1,2);x_{37},...,x_{68} \in [1,2;1,3)$; $x_{69},...,x_{85} \in [1,3;1,4)$
Trung vị của mẫu số liệu lợn con giống A thuộc nhóm [1,2;1,3)
$M_{A} = 1,2 + \frac{\frac{85}{2}-36}{32}.(1,3-1,2) = 1,22$
Gọi $y_{1};y_{2};y_{3};...;y_{65}$ lần lượt là số lợn con giống B theo thứ tự không gian
Do $y_{1},...,y_{13} \in [1,0;1,1); y_{14},...,y_{27} \in [1,1;1,2);y_{28},...,y_{51} \in [1,2;1,3)$; $y_{52},...,y_{65} \in [1,3;1,4)$
Trung vị của mẫu số liệu lợn con giống B thuộc nhóm [1,2;1,3)
$M_{B} = 1,2 + \frac{\frac{65}{2}-27}{24}.(1,3-1,2) = 1,223$
Vậy cân nặng trung bình của lớn con giống A nhỏ hơn giống B
b) Tứ phân vị thứ nhất của dãy số liệu giống A là $\frac{1}{2}(x_{21}+x_{22})$ thuộc nhóm [1,1;1,2) nên tứ phân vị thứ nhất của mẫu số liệu là $Q_{1A} = 1,1 + \frac{\frac{85}{4}-8}{28}(1,2-1,1) = 1,15$
Tứ phân vị thứ ba của dãy số liệu giống A là $\frac{1}{2}(x_{63}+x_{64})$ thuộc nhóm [1,2;1,3) nên tứ phân vị thứ ba của mẫu số liệu là $Q_{3A} = 1,2 + \frac{\frac{3.85}{4}-36}{32}(1,3-1,2) = 1,29$
Tứ phân vị thứ nhất của dãy số liệu giống B là $\frac{1}{2}(y_{16}+y_{17})$ thuộc nhóm [1,1;1,2) nên tứ phân vị thứ nhất của mẫu số liệu là $Q_{1B} = 1,1 + \frac{\frac{65}{4}-13}{14}(1,2-1,1) = 1,12$
Tứ phân vị thứ ba của dãy số liệu giống B là $\frac{1}{2}(y_{48}+y_{49})$ thuộc nhóm [1,2;1,3) nên tứ phân vị thứ ba của mẫu số liệu là $Q_{3B} = 1,2 + \frac{\frac{3.65}{4}-27}{24}(1,3-1,2) = 1,29$