Bộ định vị tài nguyên thống nhất HTML (URL)
Một URL là một cách viết khác cho địa chỉ web.
Một URL có thể bao gồm các từ (tedu.com.vn), hoặc một địa chỉ giao thức internet (IP) (192.68.20.50).
Hầu hết mọi người đều nhập tên trang khi lướt web, vì tên thì dễ nhớ hơn các số.
URL – Bộ định vị tài nguyên thống nhất
Các trình duyệt yêu cầu tải trang từ dịch vụ web bằng cách dùng một URL.
Một bộ định vị tài nguyên thống nhất (URL) được sửa dụng để xác định địa chỉ một tài liệu (hoặc dữ liệu khác) trên web.
Một địa chỉ web như https://tedu.com.vn/ tuân theo những quy tắc sau:
scheme://prefix.domain:port/path/filename
Giải thích:
- scheme - định nghĩa kiểu dịch vụ Internet (thường là HTTP hoặc HTTPS)
- prefix - phần tiền tố của tên miền (mặc định với HTTPS là www)
- domain - định nghĩa tên miền (ví dụ tedu.com.vn)
- port - định nghĩa số cổng tại host (mặc định với HTTP là 80)
- path - định nghĩa đường dẫn tới máy chủ (nếu bỏ qua thì đây sẽ là thư mục gốc (root) của trang)
- filename - định nghĩa tên của tập tin hoặc nguồn dữ liệu
Các URL Scheme phổ biến
Bảng dưới đây liệt kê một số scheme phổ biến
Scheme |
Viết tắt của |
Mô tả |
http |
HyperText Transfer Protocol |
Trang web phổ biến, chưa được mã hóa |
https |
Secure HyperText Transfer Protocol |
Trang web bảo mật, đã được mã hóa |
ftp |
File Transfer Protocol |
Tải xuống hoặc tải lên các tệp |
file |
Một tệp trên máy tính |
Mã hóa URL
Các URL chỉ có thể được gửi qua Internet bằng bộ ký tự ASCII. Nếu một URL chứa các ký tự ngoài bộ mã ASCII, URL đó cần phải được chuyển đổi.
Mã hóa URL chuyển đổi các ký tự không thuộc ASCII về một định dạng có thể truyền qua Internet.
Mã hóa URL thay thế các ký tự không thuộc ASCII bằng một “%” theo sau bởi các số thập lục phân.
Các URL không thể chứa khoảng trắng. Mã hóa URL thường thay thế khoảng trắng bằng dấu cộng (+) hoặc %20.
Các ví dụ mã hóa ASCII
Trình duyệt của bạn sẽ mã hóa đầu vào tùy theo bộ ký tự được sử dụng trong trang.
Bộ ký tự mặc định của HTML5 là UTF-8.
Ký tự |
Từ Windows-1252 |
Từ UTF-8 |
€ |
%80 |
%E2%82%AC |
£ |
%A3 |
%C2%A3 |
© |
%A9 |
%C2%A9 |
® |
%AE |
%C2%AE |
À |
%C0 |
%C3%80 |
Á |
%C1 |
%C3%81 |
 |
%C2 |
%C3%82 |
à |
%C3 |
%C3%83 |
Ä |
%C4 |
%C3%84 |
Å |
%C5 |
%C3%85 |
Trích nguồn từ: (https://www.w3schools.com/html/html_urlencode.asp)