Mã hóa HTML URL
Trong hướng dẫn này, bạn sẽ học cách mã hóa URL để truyền dữ liệu qua internet một cách an toàn.
Mã hóa URL là gì
Theo RFC 3986 , các ký tự trong URL chỉ giới hạn trong một tập hợp các ký tự US-ASCII dành riêng và chưa được lưu trữ. Bất kỳ ký tự nào khác không được phép trong một URL. Nhưng URL thường chứa các ký tự bên ngoài bộ ký tự US-ASCII, vì vậy chúng phải được chuyển đổi sang định dạng US-ASCII hợp lệ để có khả năng tương tác trên toàn thế giới. Mã hóa URL, còn được gọi là mã hóa phần trăm là một quá trình mã hóa thông tin URL để nó có thể được truyền một cách an toàn qua internet.
Để lập bản đồ nhiều loại ký tự được sử dụng trên toàn thế giới, quy trình gồm hai bước được sử dụng:
- Lúc đầu, dữ liệu được mã hóa theo bảng mã ký tự UTF-8.
- Sau đó, chỉ những byte không tương ứng với các ký tự trong tập hợp chưa được lưu trữ mới được mã hóa theo phần trăm như% HH, trong đó HH là giá trị thập lục phân của byte.
Ví dụ: chuỗi: François sẽ được mã hóa thành: Fran% C3% A7ois
Ç, ç (c-cedilla) là một chữ cái theo hệ chữ Latinh.
Ký tự đặc biệt
Một số ký tự nhất định được bảo lưu hoặc hạn chế sử dụng trong URL vì chúng có thể (hoặc không) được định nghĩa là dấu phân cách theo cú pháp chung trong lược đồ URL cụ thể . Ví dụ: /
các ký tự gạch chéo chuyển tiếp được sử dụng để phân tách các phần khác nhau của URL.
Nếu dữ liệu cho thành phần URL chứa ký tự xung đột với tập hợp ký tự dành riêng, được xác định là dấu phân cách trong lược đồ URL thì ký tự xung đột phải được mã hóa theo phần trăm trước khi URL được hình thành. Các ký tự dành riêng trong một URL là:
! |
# |
$ |
& |
' |
( |
) |
* |
+ |
, |
/ |
: |
; |
= |
? |
@ |
[ |
] |
%21 |
%23 |
%24 |
%26 |
%27 |
%28 |
%29 |
%2A |
%2B |
%2C |
%2F |
%3A |
%3B |
%3D |
%3F |
%40 |
%5B |
%5D |
Ký tự không được lưu trữ
Các ký tự được cho phép trong một URL nhưng không có mục đích đặc biệt được gọi là không được lưu trữ. Chúng bao gồm chữ hoa và chữ thường, chữ số thập phân, dấu gạch ngang, dấu chấm, dấu gạch dưới và dấu ngã. Bảng sau liệt kê tất cả các ký tự chưa được lưu trữ trong một URL:
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
K |
L |
M |
N |
O |
P |
Q |
R |
S |
T |
U |
V |
W |
X |
Y |
Z |
a |
b |
c |
d |
e |
f |
g |
h |
i |
j |
k |
l |
m |
n |
o |
p |
q |
r |
s |
t |
u |
v |
w |
x |
y |
z |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
- |
_ |
. |
~ |
Công cụ chuyển đổi mã hóa URL
Bộ chuyển đổi sau đây mã hóa và giải mã các ký tự theo RFC 3986 .
Nhập một số ký tự và nhấp vào nút mã hóa hoặc giải mã để xem đầu ra.