Câu hỏi: Tạo dãy số thực ngẫu nhiên; sử dụng các hàm mean, median, mode trong mô đun statistics để:
a) Tìm mean của a và đếm số phần tử bé hơn, bằng, lớn hơn mean.
b) Tìm median của a và cho biết đó là phần tử nào hay nó ở giữa hai phần tử nào.
c) Tìm mode của z và cho biết số lần xuất hiện và dãy các chỉ số tương ứng.
d) Áp dụng để phân tích dãy điểm từng môn học của lớp 11A.
Hướng dẫn trả lời:
a) Tạo dãy số thực ngẫu nhiên:
import numpy as np
a = np.array([[1, 2], [3, 4]])
b=np.mean(a)
b
x = np.array([[5, 6], [7, 34]])
y=np.mean(x)
y
b) Để tìm ra median của dãy trên chúng ta làm như sau:
Sắp xếp dãy trên theo thứ tự tăng dần, 1, 3, 4, 4, 4, 8, 9, 15. Meadian ở đây chính bằng 4
c) Xét ví dụ sau với tập dữ liệu {1, 2, 2, 3, 3, 3, 4, 4, 5}. Nếu chúng ta tạo biểu đồ phân phối dữ liệu, chúng ta sẽ thấy một đường cong đối xứng với đỉnh ở x = 3 và giảm dần xuống x = 1 và x = 5. Bởi vì giá trị 3 xuất hiện nhiều nhất, nó là mode của tập dữ liệu. Giá trị trung vị (median) của tập dữ liệu cũng là 3 vì có 4 giá trị nằm ở hai bên giá trị 3. Cuối cùng, giá trị trung bình (mean) của tập dữ liệu là (1 + 2 + 2 + 3 + 3 + 3 + 4 + 4 + 5) / 9 = 27/9 = 3, do đó 3 cũng là mean của tập dữ liệu này.
Ngoại lệ cho quy tắc này là các tập dữ liệu đối xứng có nhiều hơn một mode - trong trường hợp này, vì chỉ có duy nhất một median và mean cho tập dữ liệu đó nên cả hai mode này sẽ không trùng với các điểm kia.
d) Áp dụng để phân tích