HTML - Mã hóa URL

 Bộ định vị tài nguyên thống nhất HTML (URL)

Một URL là một cách viết khác cho địa chỉ web.

Một URL có thể bao gồm các từ (tedu.com.vn), hoặc một địa chỉ giao thức internet (IP) (192.68.20.50).

Hầu hết mọi người đều nhập tên trang khi lướt web, vì tên thì dễ nhớ hơn các số.

 

URL – Bộ định vị tài nguyên thống nhất

Các trình duyệt yêu cầu tải trang từ dịch vụ web bằng cách dùng một URL.

Một bộ định vị tài nguyên thống nhất (URL) được sửa dụng để xác định địa chỉ một tài liệu (hoặc dữ liệu khác) trên web.

Một địa chỉ web như https://tedu.com.vn/ tuân theo những quy tắc sau:

scheme://prefix.domain:port/path/filename

Giải thích:

  • scheme - định nghĩa kiểu dịch vụ Internet (thường là HTTP hoặc HTTPS)
  • prefix - phần tiền tố của tên miền (mặc định với HTTPS là www)
  • domain - định nghĩa tên miền (ví dụ tedu.com.vn)
  • port - định nghĩa số cổng tại host (mặc định với HTTP là 80)
  • path - định nghĩa đường dẫn tới máy chủ (nếu bỏ qua thì đây sẽ là thư mục gốc (root) của trang)
  • filename - định nghĩa tên của tập tin hoặc nguồn dữ liệu

 

Các URL Scheme phổ biến

Bảng dưới đây liệt kê một số scheme phổ biến

Scheme

Viết tắt của

Mô tả

http

HyperText Transfer Protocol

Trang web phổ biến, chưa được mã hóa

https

Secure HyperText Transfer Protocol

Trang web bảo mật, đã được mã hóa

ftp

File Transfer Protocol

Tải xuống hoặc tải lên các tệp

file

 

Một tệp trên máy tính

 

Mã hóa URL

Các URL chỉ có thể được gửi qua Internet bằng bộ ký tự ASCII. Nếu một URL chứa các ký tự ngoài bộ mã ASCII, URL đó cần phải được chuyển đổi.

Mã hóa URL chuyển đổi các ký tự không thuộc ASCII về một định dạng có thể truyền qua Internet.

Mã hóa URL thay thế các ký tự không thuộc ASCII bằng một “%” theo sau bởi các số thập lục phân.

Các URL không thể chứa khoảng trắng. Mã hóa URL thường thay thế khoảng trắng bằng dấu cộng (+) hoặc %20.

 

Các ví dụ mã hóa ASCII

Trình duyệt của bạn sẽ mã hóa đầu vào tùy theo bộ ký tự được sử dụng trong trang.

Bộ ký tự mặc định của HTML5 là UTF-8.

Ký tự

Từ Windows-1252

Từ UTF-8

%80

%E2%82%AC

£

%A3

%C2%A3

©

%A9

%C2%A9

®

%AE

%C2%AE

À

%C0

%C3%80

Á

%C1

%C3%81

Â

%C2

%C3%82

Ã

%C3

%C3%83

Ä

%C4

%C3%84

Å

%C5

%C3%85

 


Trích nguồn từ: (https://www.w3schools.com/html/html_urlencode.asp)

Lên trên