Ôn tập kiến thức Tin học 10 KNTT bài 3: Một số kiểu dữ liệu và dữ liệu văn bản

Ôn tập kiến thức Tin học 10 kết nối tri thức bài 3: Một số kiểu dữ liệu và dữ liệu văn bản. Nội dung ôn tập bao gồm cả lí thuyết trọng tâm và bài tập ôn tập để các em nắm chắc kiến thức trong chương trình học. Hi vọng đây sẽ là tài liệu hữu ích giúp các em ôn luyện và kiểm tra. Kéo xuống để tham khảo.

[toc:ul]

MỘT SỐ KIỂU DỮ LIỆU VÀ DỮ LIỆU VĂN BẢN (2 TIẾT)

I. PHÂN LOẠI THÔNG TIN VÀ BIỂU DIỄN DỮ LIỆU TRONG MÁY TÍNH

- Các thông tin trên căn cước công dân:

  • Ảnh
  • Họ và tên
  • Giới tính
  • Quốc tịch
  • Quê quán
  • Nơi cư trú
  • Ngày sinh
  • Thời gian hết hạn
  • Quốc hiệu, tiêu ngữ
  • Số căn cước công dân.

- Các thông tin trên được chia thành ba nhóm: dữ liệu dạng số, dữ liệu dạng văn bản và dữ liệu hình ảnh.

- Các dữ liệu dạng số là các đối tượng có thể làm việc được với các phép tính số học.

- Dữ liệu dạng văn bản có nhiều loại. Kiểu kí tự có thể làm việc với các phép toán như sắp xếp hay so sánh theo thứ tự trong bảng kí tự; trong khi đó các xâu kí tự - là một chuỗi các kí tự  có thể được xử lí bằng các phép toán so sánh, sắp xếp, cắt, ghép...

- Dữ liệu đa phương tiện (multimedia) bao gồm một số loại như âm thanh, hình ảnh, video.

- Dữ liệu logic: thể hiện các trạng thái đúng sai, được dùng để mô tả các điều kiện thực hiện của các câu lệnh trong phần mềm.

Câu hỏi và bài tập củng cố 1:

Thực tế số căn cước công dân là một dãy chữ số, tuy nhiên đó là mã ghép. Ví dụ ba chữ số đầu là mã tỉnh thành, chữ số tiếp theo là mã gộp thế kỉ của ngày sinh và giới tính, hai chữ số tiếp theo là năm sinh, 6 chữ số còn lại cấp tuần tự khi công dân đến làm căn cước công dân. Bản chất của căn cước công dân là dữ liệu văn bản.

Câu hỏi và bài tập củng cố 2:

Một vài loại hồ sơ có dùng đến số có phần thập phân, tương ứng với kiểu số thực: điểm trung bình học bạ của HS hay hệ số lương của cán bộ, viên chức.

II. ĐƠN VỊ LƯU TRỮ DỮ LIỆU

- Kiểu văn bản có ba loại: kiểu kí tự, kiểu xâu kí tự và kiểu tệp văn bản.

- Bảng chữ cái tiếng Anh có 26 chữ cái “a, b, c, ..., x, y, z” và 26 chữ cái in hoa tương ứng.

- Các kí tự tiếng Việt không có trong tiếng Anh:

  • Các kí tự riêng của tiếng Việt là các nguyên âm có dấu và hai kí tự đ và Đ. Các nguyên âm của tiếng Việt gồm có o, ô, ơ, a, ă, â, e, ê, u, ư, i, y và cả chữ thường và chữ hoa.
  • So với tiếng Anh, mỗi chữ o, a, e, u, i, y cả chữ thường và chữ hoa có 1 kí tự, mỗi kí tự phát sinh 5 kí tự có dấu thành không có trong tiếng Anh nên sẽ có thêm 60 kí tự.
  • Mỗi chữ ô, ơ, ă, â, ê, ư kể cả chữ thường và chữ in hoa có 12 kí tự không có trong tiếng Anh, mỗi kí tự sẽ phát sinh 6 kí tự không có trong tiếng Anh nên sẽ có thêm 72 kí tự.
  • Chữ đ phát sinh thêm 2 kí tự.

 Tổng cộng có 134 kí tự không có trong tiếng Anh.

a) Bảng mã ASCII

- ASCII là bảng mã chuẩn để trao đổi thông tin của Mỹ quy định biểu diễn nhị phân các kí tự, ban đầu là 7 bit (128 kí tự), sau đó được mở rộng thành 8 bit (256 kí tự).

- Các quốc gia có thể sử dụng phần mở rộng cho bộ kí tự của mình.

b) Bảng mã Unicode và tiếng Việt trong Unicode

- Lí do cần có một bộ mã hợp nhất toàn cầu:

  • Bảng mã ASCII không đủ chỗ cho kí tự của tất cả các quốc gia.
  • Tồn tại các mặt chữ nhiều quốc gia nhưng có mã khác nhau dẫn đến thể hiện nhầm lẫn trong các ứng dụng.

- Đặc điểm:

  • Bảng mã chung cho tất cả các quốc gia, dùng từ 1 đến 4 byte để mã hóa các kí tự.
  • Nếu một “chữ” đã được một quốc gia định nghĩa trong bảng mã Unicode mà các quốc gia khác cũng có chữ đó thì dùng lại mã đã có, không tạo ra mã mới.
  • UTF-8 (một định dạng chuyển đổi Unicode) được dùng phổ biến trong web, mail và các ứng dụng khác.

- Lợi ích:

  • Đủ chỗ cho các kí tự của mỗi quốc gia.
  • Tránh tình trạng mất nhất quán, một “mặt chữ” có nhiều mã khác nhau.
  • Các ứng dụng đa ngữ, trên cùng một ứng dụng, nhiều ngôn ngữ khác nhau được thể hiện đồng thời.

c) Số hóa văn bản

- Xâu kí tự: là định dạng của một chuỗi các kí tự, chúng được đặt trong các byte kế tiếp nhau trong bộ nhớ.

- Tệp văn bản: là định dạng để lưu văn bản ở bộ nhớ ngoài.

Câu hỏi và bài tập củng cố 1:

Mã nhị phân (và mã thập phân - chính là số thực tự trong bảng) của các kí tự S, G, K trong bảng ASCII lần lượt là: 01010011 (83), 01000111 (71), 01001011 (75).

Câu hỏi và bài tập củng cố 2:

Đáp án D.

III. LUYỆN TẬP

Luyện tập 1

Luyện tập 1

Luyện tập 2: Đáp án C

IV. VẬN DỤNG

Vận dụng: 

Gõ một câu tiếng Việt Unicode có các nguyên âm có dấu và lần lượt thử với các phông khác nhau.

Ví dụ:

  • Phông Algerian: “Phông cần thể hiện đúng kí tự và có một phong cách đặc trưng thống nhất”
  • Phông Adobe Garamond Pro: “Không cần thể hiện đúng kí tự và có một phong cách đặc trưng thống nhất”

Ngoài bộ phông Times New Roman, còn nhiều bộ phông khác hỗ trợ đầy đủ tiếng Việt Unicode theo một phong cách thống nhất như Arial, Calibri, Tahoma, Adobe và nhiều phông khác nữa.

 
Tìm kiếm google: Ôn tập tin học 10 KNTT bài 3: Một số kiểu dữ liệu và dữ liệu văn bản, ôn tập tin 10 kết nối tri thức, lí thuyết trọng tâm tin học 10 kết nối tri thức

Xem thêm các môn học

Giải tin học 10 kết nối tri thức


Đia chỉ: Tòa nhà TH Office, 90 Khuất Duy Tiến, Thanh Xuân, Hà Nội
Điện thoại hỗ trợ: Fidutech - click vào đây
Chúng tôi trên Yotube
Cùng hệ thống: baivan.net - Kenhgiaovien.com - tech12h.com