3.3: Quiz thu thập dữ liệu qua Internet
3.3: Quiz thu thập dữ liệu qua Internet
Quiz Summary
0 of 9 Questions completed
Questions:
Information
You have already completed the quiz before. Hence you can not start it again.
Quiz is loading…
You must sign in or sign up to start the quiz.
You must first complete the following:
Results
Results
0 of 9 Questions answered correctly
Your time:
Time has elapsed
You have reached 0 of 0 point(s), (0)
Earned Point(s): 0 of 0, (0)
0 Essay(s) Pending (Possible Point(s): 0)
Categories
- Not categorized 0%
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- Current
- Review
- Answered
- Correct
- Incorrect
-
Question 1 of 9
1. Question
Trong những câu dưới đây, câu nào nói đúng về thu thập dữ liệu trên internet? (Chọn nhiều đáp án)
CorrectIncorrectHint
- Thu thập dữ liệu trên internet (web scraping, web harvesting, hoặc web data mining): xây dựng một chương trình để tải, phân tích, tổ chức và lưu trữ dữ liệu từ web một cách tự động.
- Việc dùng một chương trình để thực thi các tác vụ nhàm chán và lặp lại sẽ hiệu quả, năng suất và có thể chính xác hơn con người.
- Việc thu nhập dữ liệu trên internet là cần thiết khi không có dữ liệu hoặc dữ liệu đang có quá ít đối với yêu cầu của bài toán. Ví dụ:
- Thu thập danh sách các bài đánh giá từ một trang phim, tạo ra một hệ thống đề xuất hoặc xây dựng mô hình dự đoán để phát hiện các bài đánh giá giả mạo
- Thu nhập dữ liệu các bất động sản trên các trang web hoặc sàn giao dịch để xây dựng mô hình dự đoán giá
-
Question 2 of 9
2. Question
Thu thập dữ liệu trên internet (web scraping) là gì?
CorrectIncorrectHint
- Thu thập dữ liệu trên internet (web scraping, web harvesting, hoặc web data mining): xây dựng một chương trình để tải, phân tích, tổ chức và lưu trữ dữ liệu từ web một cách tự động.
- Quét web là quá trình trích xuất dữ liệu từ các trang web bằng cách tự động truy cập và phân tích mã HTML của trang web.
-
Question 3 of 9
3. Question
Một số yếu tố pháp lý cần lưu ý khi thu thập dữ liệu trên internet là gì?
CorrectIncorrectHint
- Quét web có khả năng vi phạm luật bản quyền và quy định bảo mật dữ liệu nếu nó liên quan đến việc sao chép hoặc sử dụng nội dung mà không có sự cho phép hoặc đồng ý. Điều quan trọng là phải nhận thức được các vấn đề pháp lý và đạo đức này và chỉ thu thập dữ liệu công khai hoặc dữ liệu đã được cung cấp để thu thập.
- Hầu hết các trang web đều có mục đề cập tới các điều khoản pháp lý, chính sách nội dung bị cấm và thông tin chung như Chính sách quyền riêng tư (Privacy Policy), Giới thiệu chung (About Us), Điều khoản và Điều kiện (Terms and Conditions).
-
Question 4 of 9
4. Question
Trong những tầng sau, tầng nào thuộc mô hình OSI (Open Systems Interconnection Reference Model)? (Chọn nhiều đáp án)
CorrectIncorrectHint
Mô hình OSI: mô hình tham chiếu kết nối các hệ thống mở, bao gồm 7 tầng giao thức truyền thông, mỗi một tầng giải quyết một phần của tiến trình truyền tải thông tin.
- Tầng 1 Tầng vật lý (Physical Layer): Bao gồm giao thức Ethernet, nhưng cũng USB, Bluetooth và các giao thức radio khác
- Tầng 2 Tầng liên kết dữ liệu (Data-Link Layer): Bao gồm giao thức Ethernet
- Tầng 3 Tầng mạng (Network Layer): Bao gồm IP (Giao thức Internet).
- Tầng 4 Tầng giao vận (Transport Layer): Bao gồm TCP, nhưng cũng có các giao thức như UDP, không cung cấp cơ chế kiểm tra lỗi và khôi phục nâng cao của TCP
- Tầng 5 Tầng phiên (Session layer): Bao gồm các giao thức để mở / đóng và quản lý phiên.
- Tầng 6 Tầng trình diễn (Presentation layer): Bao gồm các giao thức để định dạng và dịch dữ liệu
- Tầng 7: Tầng ứng dụng (Application layer): HTTP và DNS
- Tầng mạng truy cập (Network Access Layer) và tầng mạng (Internet Layer) thuộc mô hình TCP/IP.
-
Question 5 of 9
5. Question
HTTP là viết tắt của từ gì?
CorrectIncorrectHint
- Giao thức truyền siêu văn bản (HTTP – Hypertext Transfer Protocol): giao thức trao đổi các tài nguyên như tài liệu HTML giữa các máy khách (client) và máy chủ (server).
- Được sử dụng để truyền dữ liệu qua internet, đặc biệt để truyền các tài liệu siêu văn bản như các trang web.
- HTTPS (HTTP Secure) là phiên bản bảo mật của HTTP sử dụng mã hóa để bảo vệ dữ liệu được truyền giữa máy khách và máy chủ. Mặt khác, HTTP không sử dụng mã hóa và do đó không an toàn để truyền thông tin nhạy cảm.
-
Question 6 of 9
6. Question
Phương thức HTTP nào được sử dụng để yêu cầu dữ liệu từ máy chủ?
CorrectIncorrectHint
- Phương thức GET được sử dụng để yêu cầu dữ liệu từ máy chủ, chẳng hạn như trang web hoặc điểm cuối API với trạng thái tài nguyên không bị thay đổi.
- GET được sử dụng để cung cấp các chuỗi truy vấn, chẳng hạn như http://www.test-domain.com/, yêu cầu thông tin từ máy chủ dựa trên các tham số id và display được gửi cùng với request.
-
Question 7 of 9
7. Question
Trong đoạn mã HTML sau, hình ảnh sẽ hiển thị với kích thước bao nhiêu?
CorrectIncorrectHint
- Thẻ hình ảnh <img> với thuộc tính src, width, height và alt, cùng với các giá trị tương ứng. src chứa địa chỉ hình ảnh, width là chiều rộng, height là chiều cao, và alt chứa giá trị văn bản thay thế.
- Các thẻ khác:
- Phần tử <p> và <h1> HTML chứa thông tin văn bản
- Phần tử <a> được xác định bằng thuộc tính href chứa liên kết thực, và 1 đoạn văn bản Click here for Google.com.
- <br /> đại diện cho một ngắt dòng trong HTML và không có thuộc tính hoặc nội dung.
-
Question 8 of 9
8. Question
Ngôn ngữ lập trình nào sau đây được sử dụng để lập trình các ứng dụng với các tính năng động trên trang web?
CorrectIncorrectHint
- JavaScript: ngôn ngữ lập trình được sử dụng để lập trình trang web và các ứng dụng chạy trong trình duyệt web với mục tiêu thêm các tính năng động và cung cấp khả năng tương tác với web cho người dùng.
- JavaScript, HTML và CSS là một trong những công nghệ web được sử dụng phổ biến nhất và hiện nay chúng cũng được sử dụng với các trình duyệt web không có giao diện đồ họa người dùng.
- SQL không sử dụng trong lập trình trang web.
-
Question 9 of 9
9. Question
Trong các thư viện sau, thư viện nào hỗ trợ xử lý bất đồng bộ khi thực hiện các yêu cầu HTTP tới máy chủ web trong Python?
CorrectIncorrectHint
- Thư viện aiohttp là ứng dụng máy khách HTTP hỗ trợ xử lý bất đồng bộ phổ biến dành cho Python, được xây dựng dựa trên asyncio.
- Nó cung cấp một API trực quan để thực hiện các yêu cầu HTTP và xây dựng các ứng dụng web bằng cú pháp async/await.
- aiohttp đặc biệt hữu ích để xây dựng các ứng dụng web hiệu suất cao yêu cầu xử lý một số lượng lớn các kết nối trong cùng 1 lúc.