Câu hỏi: Một cửa hàng đã ghi lại số tiền bán xăng cho 35 khách hàng đi xe máy. Mẫu số liệu gốc có dạng: $x_{1}, x_{2}, ..., x_{35}$ trong đó xi là số tiền bán xăng cho khách hàng thứ i. Vì một lí do nào đó, cửa hàng chỉ có mẫu số liệu ghép nhóm dạng sau:
Số tiền (nghìn đồng) | [0; 30) | [30; 60) | [60; 90) | [90; 120) |
Số khách hàng | 3 | 15 | 10 | 7 |
Bảng 3.1. Số tiền khách hàng mua xăng
Dựa trên mẫu số liệu ghép nhóm này, làm thế nào để ước lượng các số đặc trưng đo xu thế trung tâm (số trung bình, trung vị, tứ phân vị, mốt) cho mẫu số liệu gốc?
Hướng dẫn trả lời:
Sau bài học này, ta sẽ giải quyết được bài toán trên như sau:
+) Số trung bình
Trong mỗi khoảng số tiền, giá trị đại diện là trung bình cộng của giá trị hai đầu mút nên ta có bảng sau:
Số tiền (nghìn đồng) | 15 | 45 | 75 | 105 |
Số khách hàng | 3 | 15 | 10 | 7 |
Tổng số khách hàng là n = 35. Số tiền bán xăng trung bình của 35 khách hàng là
$\bar{x}=\frac{3.15+15.45+10.75+7.105}{35}=63$ (nghìn đồng).
Do đó, số trung bình cho mẫu số liệu gốc khoảng 63 nghìn đồng.
+) Số trung vị, tứ phân vị
Cỡ mẫu là n = 35.
Trung vị là $x_{18}$ thuộc nhóm [30;60), do đó $p = 2; a_{2}=30;m_{2}=15;m_{1}=3,a_{3}-a_{2}=30$ và ta có: $M_{e}=30+\frac{\frac{35}{2}-3}{15}\times 30=59$
Tứ phân vị thứ nhất $Q_{1}$ là $x_{9}$ thuộc nhóm [30;60), do đó $p=2;a_{2}=30;m_{2}=15;m_{1}=3;a_{3}-a_{2}=30$ và ta có: $Q_{1}=30+\frac{\frac{35}{4}-3}{15}\times 30=41.5$
Tứ phân vị thứ ba $Q_{3}$ là $x_{27}$ thuộc nhóm [60;90), do đó $p=3;a_{3}=60;m_{3}=10;m_{1}+m_{2}=3+15=18;a_{4}-a_{3}=30$ và ta có: $Q_{3}=30+\frac{\frac{3\times 35}{4}-18}{10}\times 30=54.75$
Do đó, trung vị của mẫu số liệu gốc khoảng 59 và các tứ phân vị khoảng 41,5; 59; 84,75.
+) Mốt
Tần số lớn nhất là 15 nên mốt thuộc nhóm [30;60). Ta có, $j=2;a_{2}=30;m_{2}=15;m_{1}=3;m_{3}=10;h=30$, do đó: $M_{o}=30+\frac{15-3}{(15-3)+(15-10)}\times 30=51.18$
Vậy mốt của mẫu số liệu gốc xấp xỉ 51,18.
Hoạt động 1: Khảo sát thời gian tự học của các học sinh trong lớp theo mẫu bên
a) Hãy lập bảng thống kê cho mẫu số liệu ghép nhóm thu được
b) Có thể tính chính xác thời gian tự học trung bình của các học sinh trong lớp không?
c) Có cách nào tính gần đúng thời gian tự học trung bình của các học sinh trong lớp dựa trên mẫu số liệu ghép nhóm này không?
Hướng dẫn trả lời:
a) Giả sử lớp 11A có 30 học sinh và sau khi khảo sát, ta có được bảng thống kê như sau
Số giờ tự học (giờ) | [0;1.5) | [1.5;3) | [3;4.5) | $\geq 4.5$ |
Số học sinh | 8 | 23 | 6 | 3 |
b) Ta không thể tính chính xác thời gian tự học trung bình của các học sinh trong lớp vì không có mẫu số liệu cụ thể về thời gian tự học của từng học sinh, chúng ta chỉ có thể tinh số gần đúng thời gian tự học trung bình của các học sinh trong lớp
c) Giá trị đại diện của nhóm bằng trung bình giá trị đầu mút phải và trái của nhóm đó
Nhóm $\geq 4.5$ là nhóm mở nên ta dựa theo nhóm gần đó nhất là nhóm [3;4.5) để lấy giá trị đại diện
Số giờ tự học (giờ) | [0;1.5) | [1.5;3) | [3;4.5) | $\geq 4.5$ |
Giá trị đại diện | 0.75 | 2.25 | 3.75 | 5.25 |
Số trung binh của mẫu số liệu: $\bar{x}=\frac{0.75\times 8+2.25\times 23+2.75\times 6+5.25\times 3}{40}=2.25$
Luyện tập 1: Tìm hiểu thời gian xem ti vi trong tuần trước (đơn vị: giờ) của một số học sinh thu được kết quả như sau:
Thời gian (giờ) | [0;5) | [5;10) | [10;15) | [15;20) | [20;25) |
Số học sinh | 8 | 16 | 4 | 2 | 2 |
Tính thời gian xem ti vi trung bình trong tuần trước của các bạn học sinh này
Hướng dẫn trả lời:
Thời gian (giờ) | [0;5) | [5;10) | [10;15) | [15;20) | [20;25) |
Số học sinh | 8 | 16 | 4 | 2 | 2 |
Giá trị đại diện | 2.5 | 7.5 | 12.5 | 17.5 | 22.5 |
Thời gian xem ti vi trung bình trong tuần trước của các bạn học sinh này là:
$\bar{x}=\frac{8\times 2.5+16\times 7.5+4\times 12.5+2\times 17.5+2\times 22.5}{8+16+4+2+2}=8.4375$ (giờ)
Hoạt động 2: Cho mẫu số liệu ghép nhóm về chiều cao của 21 cây na giống
Chiều cao (cm) | [0;5) | [5;10) | [10;15) | [15;20) |
Số cây | 3 | 8 | 7 | 3 |
Gọi $x_{1},x_{2},...,x_{21}$ là chiều cao của các cây giống, đã được sắp xếp theo thứ tự tăng dần. Khi đó, $x_{1},...,x_{3}$ thuộc [0;5), $x_{4};...;x_{11}$ thuộc [5;10),... Hỏi trung vị thuộc nhóm nào?
Hướng dẫn trả lời:
Cỡ mẫu n = 3 + 8 + 7 + 3 = 21
Suy ra trung vị là $x_{11}$ thuộc nhóm [5;10)
Luyện tập 2: Ghi lại tốc độ bóng trong 200 lần giao bóng của một vận động viên môn quần vợt cho kết quả như bảng bên. Tính trung vị của mẫu số liệu ghép nhóm này
Tốc độ v (km/h) | Số lần |
$150\leq v<155$ | 18 |
$155\leq v<160$ | 28 |
$160\leq v<165$ | 35 |
$165\leq v<170$ | 43 |
$170\leq v<175$ | 41 |
$175\leq v<180$ | 35 |
Hướng dẫn trả lời:
Cỡ mẫu là: n = 18 + 28 + 35 + 43 + 43 + 41 + 35 = 200
Gọi $x_{1},x_{2}...x_{200}$ là tốc độ giao bóng của 200 lần và giả sử dãy này được sắp xếp theo thứ tự tăng dần. Khi đó trung vị là $\frac{x_{100}+x_{101}}{2}$.
Do hai giá trị $x_{100},x_{101}$ thuộc nhóm [165;170) nên nhóm này chứa trung vị.
Suy ra , $p = 4; a_{4}=165;m_{4}=43;m_{1}+m_{2}+m_{3}=18+28+35=81;a_{5}-a_{4}=5$ và ta có"
$M_{e}=165+\frac{\frac{200}{2}-81}{43}\times 5=167.21$
Hoạt động 3: Với mẫu số liệu ghép nhóm cho trong HĐ2, hãy cho biết tứ phân vị thứ nhất $Q_{1}$ và tứ phân vị thứ ba $Q_{3}$ thuộc nhóm nào.
Hướng dẫn trả lời:
Cỡ mẫu là: n = 21
Suy ra tứ phân vị thứ nhất $Q_{1}$ là $\frac{x_{5}+x_{6}}{2}$. Do $x_{5};x_{6}$ đều thuộc nhóm [5;10) nên tứ phân vị thứ nhất thuộc nhóm [5;10)
Tứ phân vị thứ ba $Q_{3}$ là $\frac{x_{16}+x_{17}}{2}$. Do $x_{16},x_{17}$ đều thuộc nhóm [10;15) nên tứ phân vị thứ ba thuộc nhóm [10;15)
Luyện tập 3: Tìm tứ phân vị thứ nhất và tứ phân vị thứ ba cho mẫu số liệu ghép nhóm ở Luyện tập 2
Hướng dẫn trả lời:
Cỡ mẫu: n = 200
Tứ phân vị thứ nhất $Q_{1}$ là $\frac{x_{50}+x_{51}}{2}$. Do $x_{50};x_{51}$ đều thuộc nhóm [160;165) nên tứ phân vị thứ nhất thuộc nhóm [160;165). Do đó, $p =3; a_{3}=160;m_{3}=35;m_{1}+m_{2}=18+28=46;a_{4}-a_{3}=5$ và ta có:
$Q_{1}=160+\frac{\frac{200}{4}-46}{35}\times 5=160.57$
Tứ phân vị thứ ba $Q_{3}$ là $\frac{x_{150}+x_{151}}{2}$. Do $x_{150},x_{151}$ đều thuộc nhóm [170;175) nên tứ phân vị thứ ba thuộc nhóm [170;175). Do đó, $p =5; a_{5}=170;m_{5}=41;m_{1}+m_{2}+m_{3}+m_{4}=18+28+35+43=124;a_{6}-a_{5}=5$ và ta có:
$Q_{1}=170+\frac{\frac{600}{4}-124}{41}\times 5=173.17$
Hoạt động 4: Với số liệu cho trong Luyện tập 1:
a) Có thể tìm được giá trị chính xác cho mốt của mẫu số liệu gốc về thời gian xem ti vi của học sinh không?
b) Mốt thuộc nhóm nào là hợp lí nhất? Nên lấy số nào trong nhóm để ước lượng cho mốt?
Hướng dẫn trả lời:
a) không thể tìm được giá trị chính xác cho mốt của mẫu số liệu gốc về thời gian xem ti vi của học sinh
b) Tần số lớn nhất là 16 nên nhóm chứa mốt là [5;10)
Ta có $j = 2,a_{2}=5,m_{2}=16,m_{1}=8;m_{3}=4,h = 5$. Do đó:
$M_{o}=5+\frac{16-8}{(16-8)+(16-4)}\times 5=7$
Luyện tập 4: Thời gian (phút) để học sinh hoàn thành một câu hỏi thi được cho như sau:
Thời gian (phút) | [0.5;10.5) | [10.5;20.5) | [20.5;30.5) | [30.5;40.5) | [40.5;50.5) |
Số học sinh | 2 | 10 | 6 | 4 | 3 |
Tìm mốt của mẫu số liệu ghép nhóm này
Hướng dẫn trả lời:
Tân số lớn nhất là 10 nên nhóm chứa mốt là nhóm [10.5; 20.5] . Ta có, $j = 2,a_{2}=10.5,m_{2}=10,m_{1}=2;m_{3}=6,h = 10$. Do đó:
$M_{o}=10.5+\frac{10-2}{(10-2)+(10-6)}\times 10=17.17$
Vận dụng: Hãy tính các số đặc trung cho mẫu số liệu trong Bảng 3.1 và giải thích ý nghĩa của các giá trị thu được.
Hướng dẫn trả lời:
Ta có:
Số tiền (nghìn đồng) | [0;30) | [30;60) | [60;90) | [90;120) |
Số khách hàng | 3 | 15 | 10 | 7 |
Giá trị đại diện | 15 | 45 | 75 | 105 |
Số trung bình là: $\bar{x}=\frac{3\times 15+15\times 45+10\times 75+7\times 105}{3+15+10+7}=63$
Cỡ mẫu là: n= 3 + 15 + 10 + 7 =35
Ý nghĩa: Xấp xỉ bằng số trung bình của mẫu số liệu gốc, cho biết vị trí trung tâm của mẫu số liệu và đại diện cho mẫu số liệu
Trung vị là $x_{18}$ thuộc nhóm [30;60), do đó $p = 2; a_{2}=30;m_{2}=15;m_{1}=3,a_{3}-a_{2}=30$ và ta có: $M_{e}=30+\frac{\frac{35}{2}-3}{15}\times 30=59$
Ý nghĩa: Xấp xỉ bằng trung vị của mẫu số liệu gốc, chia mẫu số liệu thành 2 phần , mỗi phần chứa 50% giá trị
Tứ phân vị thứ nhất $Q_{1}$ là $x_{9}$ thuộc nhóm [30;60), do đó $p=2;a_{2}=30;m_{2}=15;m_{1}=3;a_{3}-a_{2}=30$ và ta có: $Q_{1}=30+\frac{\frac{35}{4}-3}{15}\times 30=41.5$
Ý nghĩa: Có 25% số giá trị nhỏ hơn 41.5
Tứ phân vị thứ ba $Q_{3}$ là $x_{27}$ thuộc nhóm [60;90), do đó $p=3;a_{3}=60;m_{3}=10;m_{1}+m_{2}=3+15=18;a_{4}-a_{3}=30$ và ta có: $Q_{3}=30+\frac{\frac{3\times 35}{4}-18}{10}\times 30=54.75$
Ý nghĩa: Có 75% số giá trị nhỏ hơn 54.75%
Tần số lớn nhất là 15 nên mốt thuộc nhóm [30;60). Ta có, $j=2;a_{2}=30;m_{2}=15;m_{1}=3;m_{3}=10;h=30$, do đó: $M_{o}=30+\frac{15-3}{(15-3)+(15-10)}\times 30=51.18$
Ý nghĩa: Xấp xỉ bằng mốt của mẫu số liệu gốc, được dùng để đo xu thế trung tâm của mẫu số liệu
Bài tập 3.4: Quãng đường (km) từ nhà đến nơi làm việc của 40 công nhân một nhà máy được ghi lại như sau:
5; 3; 10; 20; 25; 11; 13; 7; 12; 31; 19; 10; 12; 17; 18; 11; 32; 17; 16; 2; 7; 9; 7; 8; 3; 5; 12; 15; 18; 3; 12; 14; 2; 9; 6; 15; 15; 7; 6; 12.
a) Ghép nhóm dãy số liệu trên thành các khoảng có độ rộng bằng nhau, khoảng đầu tiên là [0;5). Tìm giá trị đại diện cho mỗi nhóm
b) Tính số trung bình của mẫu số liệu không ghép nhóm và mẫu số liệu ghép nhóm. Giá trị nào chính xác hơn?
c) Xác định nhóm chứa mốt của mẫu số liệu ghép nhóm thu được
Hướng dẫn trả lời:
a)
Quãng đường (km) | [0;5) | [5;10) | [10;15) | [15;20) | [20;25) | [25;30) | [30;35) |
Số công nhân | 5 | 111 | 11 | 9 | 1 | 1 | 2 |
Giá trị đại diện | 2.5 | 7.5 | 12.5 | 17.5 | 22.5 | 27.5 | 32.5 |
b) Với mẫu số liệu không ghép nhóm: $\bar{x}=(5+3+10+20+25+11+13+7+12+31+19+10+12+17$
$+18+11+32+17+16+2+7+9+7+8+3+5+12+15+18+3$
$+12+14+2+9+6+15+15+7+6+12):40=11,9$
Với mẫu số liệu ghép nhóm: $\bar{x}=\frac{2.5\times 5+7.5\times 11+12.5\times 11+17.5\times 9+22.5+27.5+32.5\times 2}{40}=12,625$
Số trung bình của mẫu số liệu không ghép nhóm chính xác hơn
c) Tần số lớn nhất trong bảng tần số của mẫu số liệu ghép nhóm là 11. Do đó, nhóm chứa mốt của mẫu số liệu ghép nhóm là các nhóm [5; 10) và [10; 15).
Bài tập 3.5: Tuổi thọ (năm) của 50 bình ắc quy ô tô được cho như sau:
Tuổi thọ (năm) | [2;2.5) | [2.5;3) | [3;3.5) | [3.5;4) | [4;4.5) | [4.5;5) |
Tần số | 4 | 9 | 14 | 11 | 7 | 5 |
a) Xác định mốt và giải thích ý nghĩa
b) Tính tuổi thọ trung bình của 50 bình ắc quy ô tô này
Hướng dẫn trả lời:
a) 14 là tần số lớn nhất nên mốt thuộc nhóm [3;3.5), ta có $j = 3, a_{3}=3,m_{3}=14,m_{2}=9,m_{4}=11,h =0.5$
Do đó: $M_{o}=3+\frac{14-9}{(14-9)+(14-11)}\times 0.5=3.31$
b)
Tuổi thọ (năm) | [2;2.5) | [2.5;3) | [3;3.5) | [3.5;4) | [4;4.5) | [4.5;5) |
Tần số | 4 | 9 | 14 | 11 | 7 | 5 |
Giá trị đại diện | 2.25 | 2.75 | 3.25 | 3.75 | 4.25 | 4.75 |
Tuổi thọ trung bình: $\bar{x}=\frac{4\times 2.25+9\times 2.75+14\times 3.25+11\times 3.75+7\times 4.25+5\times 4.75}{50}=3.48$
Bài tập 3.6: Điểm thi môn Toán (thang điểm 100, điểm được làm tròn đến 1) của 60 thí sinh được cho trong bảng sau:
Điểm | 0 - 9 | 10 - 19 | 20 - 29 | 30 - 39 | 40 - 49 |
Số thí sinh | 1 | 2 | 4 | 6 | 15 |
Điểm | 50 - 59 | 60 - 69 | 70 - 79 | 80 - 89 | 90 - 99 |
Số thí sinh | 12 | 10 | 6 | 3 | 1 |
a) Hiệu chỉnh để thu được mẫu số liệu ghép nhóm dạng Bảng 3.2
b) Tìm các tứ phân vị và giải thích ý nghĩa của chúng
Hướng dẫn trả lời:
a)
Điểm | [0;10) | [10;20) | [20;30) | [30;40) | [40;50) | [50;60) | [60;70) | [70;80) | [80;90) | [90;100) |
Số thí sinh | 1 | 2 | 4 | 6 | 15 | 12 | 10 | 6 | 3 | 1 |
b) Cỡ mẫu n = 60
Tứ phân vị thứ nhất $Q_{1}$ là $\frac{x_{15}+x_{16}}{2}$. Do $x_{15},x_{16}$ đều thuộc nhóm [40;50) nên nhóm này chứa $Q_{1}$. Do đó, $p=5;a_{5}=40,m_{5}=15,m_{1}+m_{2}+m_{3}+m_{4}=1+2+4+6=13,4$
$a_{6}-a_{5}=10$ và ta có:
$Q_{1}=40+\frac{\frac{60}{4}-13}{15}\times 10=41.33$
Ý nghĩa: Có 25% số giá trị nhỏ hơn 41.3
Tứ phân vị thứ hai tức $M_{e}$ là $\frac{x_{30}+x_{31}}{2}$. Do $x_{30},x_{31}$ đều thuộc nhóm [50;60) nên nhóm này chứa $M_{e}$. Do đó, $p=6;a_{6}=50,m_{6}=12,$
$m_{1}+m_{2}+m_{3}+m_{4}+m_{5}=1+2+4+6+15=28,$
$a_{7}-a_{6}=10$ và ta có:
$M_{e}=50+\frac{\frac{60}{2}-28}{12}\times 10=51.67$
Ý nghĩa: Có 50% số giá trị nhỏ hơn 51.67
Tứ phân vị thứ ba $Q_{3}$ là $\frac{x_{45}+x_{46}}{2}$. Do $x_{45},x_{46}$ đều thuộc nhóm [60;70) nên nhóm này chứa $Q_{3}$. Do đó, $p=7;a_{7}=60,m_{7}=10,$
$m_{1}+m_{2}+m_{3}+m_{4}+m_{5}+m_{6}=1+2+4+6+15+12=40,$
$a_{8}-a_{7}=10$ và ta có:
$Q_{3}=60+\frac{\frac{60\times 3}{4}-40}{10}\times 10=65$
Ý nghĩa: Có 75% số giá trị nhỏ hơn 65
Bài tập 3.7: Phỏng vấn một số học sinh khối 11 về thời gian (giờ) ngủ của một buổi tối, thu được kết quả số liệu ở bên
Thời gian | Số học sinh nam | Số học sinh nữ |
[4;5) | 6 | 4 |
[5;6) | 10 | 8 |
[6;7) | 13 | 10 |
[7;8) | 9 | 11 |
[8;9) | 7 | 8 |
a) So sánh thời gian ngủ trung bình của các bạn học sinh nam và nữ
b) Hãy cho biết 75% học sinh khối 11 ngủ ít nhất bao nhiêu giờ?
Hướng dẫn trả lời:
a)
Thời gian | Giá trị đại diện | Số học sinh nam | Số học sinh nữ |
[4;5) | 4.5 | 6 | 4 |
[5;6) | 5.5 | 10 | 8 |
[6;7) | 6.5 | 13 | 10 |
[7;8) | 7.5 | 9 | 11 |
[8;9) | 8.5 | 7 | 8 |
Thời gian ngủ trung bình của các bạn nam $\bar{x}_{nam}=\frac{4.5\times 6+5.5\times 10+6.5\times 13+7.5\times 9+8.5\times 7}{6+10+13+9+7}=6.52$
Thời gian ngủ trung bình của các bạn nữ $\bar{x}_{nữ}=\frac{4.5\times 4+5.5\times 8+6.5\times 10+7.5\times 11+8.5\times 8}{4+8+10+11+8}=6.77$
6.77 > 6.52. Như vậy thời gian ngủ trung bình của các bạn nữ nhiều hơn các bạn nam
b) Cỡ mẫu n = 86
Tứ phân vị thứ ba $Q_{3}$ là $\frac{x_{64}+x_{65}}{2}$. Do $x_{64},x_{65}$ đều thuộc nhóm [7;8) nên nhóm này chứa $Q_{3}$. Do đó, $p=4,a_{4}=7,m_{4}=20;m_{1}+m_{2}+m_{3}=10+18+23=51,a_{5}-a_{4}=1$ và ta có:
$Q_{3}=7+\frac{\frac{3.86}{4}-51}{20}\times 1=7,675$
Vậy 75% học sinh khối 11 ngủ ít nhất 7,675 giờ