[toc:ul]
- Các thông tin trên căn cước công dân:
- Các thông tin trên được chia thành ba nhóm: dữ liệu dạng số, dữ liệu dạng văn bản và dữ liệu hình ảnh.
- Các dữ liệu dạng số là các đối tượng có thể làm việc được với các phép tính số học.
- Dữ liệu dạng văn bản có nhiều loại. Kiểu kí tự có thể làm việc với các phép toán như sắp xếp hay so sánh theo thứ tự trong bảng kí tự; trong khi đó các xâu kí tự - là một chuỗi các kí tự có thể được xử lí bằng các phép toán so sánh, sắp xếp, cắt, ghép...
- Dữ liệu đa phương tiện (multimedia) bao gồm một số loại như âm thanh, hình ảnh, video.
- Dữ liệu logic: thể hiện các trạng thái đúng sai, được dùng để mô tả các điều kiện thực hiện của các câu lệnh trong phần mềm.
Câu hỏi và bài tập củng cố 1:
Thực tế số căn cước công dân là một dãy chữ số, tuy nhiên đó là mã ghép. Ví dụ ba chữ số đầu là mã tỉnh thành, chữ số tiếp theo là mã gộp thế kỉ của ngày sinh và giới tính, hai chữ số tiếp theo là năm sinh, 6 chữ số còn lại cấp tuần tự khi công dân đến làm căn cước công dân. Bản chất của căn cước công dân là dữ liệu văn bản.
Câu hỏi và bài tập củng cố 2:
Một vài loại hồ sơ có dùng đến số có phần thập phân, tương ứng với kiểu số thực: điểm trung bình học bạ của HS hay hệ số lương của cán bộ, viên chức.
- Kiểu văn bản có ba loại: kiểu kí tự, kiểu xâu kí tự và kiểu tệp văn bản.
- Bảng chữ cái tiếng Anh có 26 chữ cái “a, b, c, ..., x, y, z” và 26 chữ cái in hoa tương ứng.
- Các kí tự tiếng Việt không có trong tiếng Anh:
Tổng cộng có 134 kí tự không có trong tiếng Anh.
a) Bảng mã ASCII
- ASCII là bảng mã chuẩn để trao đổi thông tin của Mỹ quy định biểu diễn nhị phân các kí tự, ban đầu là 7 bit (128 kí tự), sau đó được mở rộng thành 8 bit (256 kí tự).
- Các quốc gia có thể sử dụng phần mở rộng cho bộ kí tự của mình.
b) Bảng mã Unicode và tiếng Việt trong Unicode
- Lí do cần có một bộ mã hợp nhất toàn cầu:
- Đặc điểm:
- Lợi ích:
c) Số hóa văn bản
- Xâu kí tự: là định dạng của một chuỗi các kí tự, chúng được đặt trong các byte kế tiếp nhau trong bộ nhớ.
- Tệp văn bản: là định dạng để lưu văn bản ở bộ nhớ ngoài.
Câu hỏi và bài tập củng cố 1:
Mã nhị phân (và mã thập phân - chính là số thực tự trong bảng) của các kí tự S, G, K trong bảng ASCII lần lượt là: 01010011 (83), 01000111 (71), 01001011 (75).
Câu hỏi và bài tập củng cố 2:
Đáp án D.
Luyện tập 1
Luyện tập 2: Đáp án C
Vận dụng:
Gõ một câu tiếng Việt Unicode có các nguyên âm có dấu và lần lượt thử với các phông khác nhau.
Ví dụ:
Ngoài bộ phông Times New Roman, còn nhiều bộ phông khác hỗ trợ đầy đủ tiếng Việt Unicode theo một phong cách thống nhất như Arial, Calibri, Tahoma, Adobe và nhiều phông khác nữa.