URL Là Gì? Các Thành Phần Có Trong URL

cấu trúc URL

Bạn thường thấy trên các trang mạng hay các bài báo nhắc đến URL. Vậy bạn có biết URL thực sự là gì không? Mạng máy tính hay các trang web là nơi chứa vô vàn những điều thú vị nhưng để mang đến cho bạn những thông tin thú vị đó không phải dễ dàng.

URL là thứ giúp bạn mỗi ngày đọc những tin tức trên thế giới qua mạng Internet. Cùng tìm hiểu xem URL là gì mà có thể làm được điều này và những thành phần từ trước tới giờ bạn không hề biết về URL.

URL là gì?

URL là viết tắt của Uniform Resource Locator và được định nghĩa là địa chỉ toàn cầu của tài liệu và các nguồn tài nguyên khác trên World Wide Web. 

Tất cả chúng ta đều sử dụng URL để truy cập vào các trang web và các tài nguyên khác trên web. URL là một địa chỉ đưa người dùng đến một tài nguyên cụ thể trực tuyến, chẳng hạn như trang web, video hoặc tài liệu. 

URL là gì
Định nghĩa về URL không phải ai cũng biết

Ví dụ khi bạn tìm kiếm trên Google, kết quả tìm kiếm sẽ hiển thị URL của các tài nguyên phù hợp với truy vấn tìm kiếm của bạn. Tiêu đề trong kết quả tìm kiếm chỉ đơn giản là một siêu liên kết đến URL dẫn đến tài nguyên.

Một URL là một loại Uniform Resource Identifier (URI) là thuật ngữ chung cho tất cả các loại tên và địa chỉ đề cập đến các đối tượng trên World Wide Web.

Cấu trúc của URL

Về cơ bản, URL là sự kết hợp giữa tên miền với việc sử dụng đường dẫn file để xác định cấu trúc file và các thư mục cụ thể. 

Nó tương tự như sử dụng trong Windows các đường dẫn như C:\Documents\Personal\myfile.doc, nhưng thêm một số thứ ở đầu để có thể tìm thấy đúng máy chủ trên Internet. URL có thể sẽ bao gồm một vài đường dẫn khác. Hai thành phần chính của URL gồm Scheme (giao thức kết nối) và Authority (nhà cung cấp).

Phần giao thức kết nối (Scheme)

Rất nhiều người nghĩ rằng URL chỉ là một địa chỉ web thông thường nhưng nó không hoàn toàn như vậy. Không phải tất cả URL là địa chỉ web nhưng hầu hết các địa chỉ web là URL. 

cấu trúc URL
Cấu trúc của URL

Các dịch vụ khác bạn có thể truy cập trên Internet như FTP hay MAILTO cũng là ví dụ cho URL. Phần Scheme của URL (các chữ cái theo sau dấu hai chấm trong cấu trúc cơ bản) biểu thị giao thức đặc trưng cho máy chủ giao tiếp và ứng dụng (hay trình duyệt web).

URL phổ biến nhất là các địa chỉ web, ngoài ra còn có một số URL khác nữa. Do đó, bạn sẽ thấy các giao thức kết nối (Scheme) như:

  • Giao thức cơ bản của web: giao thức truyền tải siêu văn bản (HTTP) xác định các trình duyệt cần thực hiện để đáp ứng các lệnh nhất định và hành động của các máy chủ web.
  • Một dạng HTTP khác được gọi là giao thức HTTP an toàn (HTTPS): Đây là một dạng HTTP hoạt động dựa trên lớp bảo mật, được mã hóa để truyền tải thông tin đến người dùng một cách an toàn hơn.
  • Giao thức thường được sử dụng phổ biến để truyền file qua Internet được gọi là giao thức truyền tập tin (File Transfer Protocol - FTP).

Về mặt kỹ thuật trong các trình duyệt hiện đại, giao thức kết nối (Scheme) không nhất thiết là một phần của URL. Nếu bạn nhập trang web ví dụ như www.abcde.com, trình duyệt sẽ giúp bạn tự động xác định giao thức phù hợp để sử dụng. Tuy nhiên, Scheme lại được yêu cầu sử dụng ở một số ứng dụng khác.

Nhà cung cấp (Authority)

Phần Authority của một URL là phần bắt đầu sau hai dấu gạch chéo, được chia thành nhiều phần nhỏ. bạn hãy bắt đầu với URL đơn giản, URL đơn giản thường là URL dẫn bạn đến trang chủ của trang web nào đó.

cấu trúc URL
Các phần phải có trong cấu trúc URL

Ví dụ đơn giản như www.example.com, toàn bộ phần “www.example.com” được gọi là hostname. Nó có nhiệm vụ là lấy một địa chỉ IP. Nếu bạn biết địa chỉ IP, bạn có thể gõ nó vào thanh địa chỉ trình duyệt sẽ đến trang bạn cần nhanh hơn thay vì hostname.

Một số thành phần có trong  phần Authority:

  • Tên miền cấp cao nhất: có ba tên miền cấp cao nhất thường được sử dụng nhất là .com., .net, .gov. Ngoài ra, cũng có một số tên miền khác dùng chung như: .life, .club và .news. 
  • Tên miền phụ: hai phần “www” và “example” trong ví dụ về URL trên được xem là tên miền phụ. 
  • Phần Authority có thể sẽ chứa thông tin người dùng bao gồm tên người dùng và mật khẩu của trang web mà bạn đang truy cập.

Các thành phần của URL

Bên cạnh những thông tin về cấu trúc có trong URL thì từng thành phần nhỏ trong đó cũng không nên bỏ qua. Những thông tin sau sẽ giúp bạn trải nghiệm thú vị về URL.

Mã định danh giao thức (Protocol Identifier)

Phần đầu tiên của URL được gọi là mã định danh giao thức (IP) hay còn được gọi là giao thức Internet. Giao thức Internet được thiết kế để sử dụng trong các hệ thống được kết nối với nhau của mạng truyền thông máy tính. 

cấu trúc URL
Các thành phần trong URL

Nó đóng vai trò quan trọng trong thành phần của URL. Mã định danh giao thức thực hiện chức năng cơ bản là định tuyến. Nó lựa chọn một con đường dẫn đến trang web mà bạn muốn và cho biết giao thức sẽ sử dụng.

Tài nguyên (Resource Name)

Phần thứ hai được gọi là tên tài nguyên và nó chỉ định địa chỉ IP hoặc tên miền nơi tài nguyên được đặt. Định danh giao thức và tên tài nguyên được phân tách bằng dấu hai chấm và hai dấu gạch chéo về phía trước.

Đường dẫn (path)

Đường dẫn (như đường dẫn trong Windows) là thứ sẽ đưa bạn đến đúng thư mục hoặc file có trên máy chủ đó. Đường dẫn bắt đầu bằng dấu gạch chéo, có các dấu gạch chéo giữa các thư mục và thư mục con.

Phần cuối cùng của đường dẫn là tên file sẽ được mở khi truy cập vào trang web. Có thể bạn sẽ không thấy đường dẫn trên các thanh địa chỉ truy cập, nhưng không có nghĩa là các đường dẫn này không tồn tại.

Truy vấn (query)

Những thứ không phải là thành phần của một cấu trúc đường dẫn cố định sẽ được xác định nhờ vào phần truy vấn của một URL. Bạn sẽ thường thấy chúng được sử dụng để thực hiện tìm kiếm. Phần truy vấn theo sau tên máy chủ nếu không có đường dẫn hoặc sau đường dẫn và được bắt đầu bằng dấu chấm hỏi.

thành phần URL
Truy vấn là một trong các thành phần của URL

Phân mảnh (fragment)

Phân mảnh là thành phần cuối cùng của URL được bắt đầu bằng một dấu thăng(#) và được sử dụng để xác định vị trí cụ thể của một trang web. 

Khi sử dụng một phân mảnh ở cuối URL thích hợp, trình duyệt của bạn sẽ tải trang và sau đó đưa bạn đến một liên kết. Liên kết và URL cùng với phân mảnh thường được sử dụng giúp điều hướng dễ dàng hơn khi tạo mục lục cho các trang web.

Địa chỉ trang web là một URL có HTTP / HTTPS

Thuật ngữ “địa chỉ web” là từ đồng nghĩa với một URL sử dụng giao thức HTTP hoặc HTTPS. 

Bộ định vị tài nguyên thống nhất (URL) được phát triển nhờ vào Tim Berners-Lee vào năm 1994 và nhóm công tác URI của Lực lượng Đặc nhiệm Kỹ thuật Internet (IETF). Ngày nay, định dạng của URL không thay đổi. Định dạng URL được chỉ định trong RFC 1738 Uniform Resource Locators (URL) .

Trong lập trình hướng đến đối tượng là lớp URL

Lưu ý rằng trong lập trình hướng đối tượng, chẳng hạn như Java, các chương trình có thể sử dụng một lớp (một loại đối tượng) được gọi là URL. Bạn có thể tạo một đối tượng URL để đại diện cho địa chỉ URL của mình.

Địa chỉ trang web là một URL
Địa chỉ trang web là một URL

Kết luận

Sau khi xem xong bài viết này bạn có thể đã biết được rất nhiều thông tin về URL. Nếu như bạn hứng thú với những thứ liên quan đến mạng máy tính thì những thông tin trên mang lại cho bạn những kiến thức và trải nghiệm thú vị.