HTML (viết tắt của HyperText Markup Language, được dịch là “Ngôn ngữ Đánh dấu Siêu văn bản”) là một ngôn ngữ đánh dấu được thiết kế ra để tạo nên các trang web với các mẩu thông tin được trình bày trên World Wide Web. Cùng với CSS và JavaScript, HTML tạo ra bộ ba nền tảng kỹ thuật cho World Wide Web. HTML được định nghĩa như là một ứng dụng đơn giản của SGML và được sử dụng trong các tổ chức cần đến các yêu cầu xuất bản phức tạp. HTML đã trở thành một chuẩn Internet do tổ chức World Wide Web Consortium (W3C) duy trì. Phiên bản chính thức mới nhất của HTML là HTML 4.01 (1999). Sau đó, các nhà phát triển đã thay thế nó bằng XHTML. Hiện nay, HTML đang được phát triển tiếp với phiên bản HTML5 hứa hẹn mang lại diện mạo mới cho Web.
Bằng cách dùng HTML động hoặc Ajax, lập trình viên có thể được tạo ra và xử lý bởi số lượng lớn các công cụ, từ một chương trình soạn thảo văn bản đơn giản – có thể gõ vào ngay từ những dòng đầu tiên – cho đến những công cụ xuất bản WYSIWYG phức tạp.
Ngôn ngữ HTML định nghĩa các phần tử HTML là các khối xây dựng của các trang HTML, các phần tử HTML được biểu diễn ở dạng các thẻ. Thẻ HTML gắn nhãn các phần nội dung như “tiêu đề”, “đoạn”, “bảng”… Khi mở một trang HTML, trình duyệt web không hiển thị các thẻ HTML, nhưng sử dụng chúng để hiển thị nội dung của trang.
Các phiên bản HTML
Cho đến nay, nhiều phiên bản HTML đã được phát hành nhằm đơn giản hóa và tăng tốc độ xử lý các tài liệu và ứng dụng trên nền web:
Phiên bản | Năm phát hành |
---|---|
HTML | 1991 |
HTML 2.0 | 1995 |
HTML 3.2 | 1997 |
HTML 4.01 | 1999 |
XHTML | 2000 |
HTML5 | 2014 |
Cấu trúc của tài liệu HTML
Một tài liệu HTML sẽ bao gồm các phần thiết yếu như sau:
<html>
<head>
</head>
<body>
</body>
</html>
Một tài liệu HTML cần được mở đầu bằng thẻ mở <html>
và kết thúc bằng thẻ đóng </html>
. Bên trong thẻ html
này là hai thẻ head
và body
quy định hai vùng thông tin của trang tài liệu HTML.
Chỉ nội dung bên trong phần <body>
(vùng màu trắng ở trên) mới được hiển thị trong trình duyệt.
Các phần tử trong phần <head>
được dùng để khai báo các tham số cần thiết cho việc hiển thị một trang tài liệu HTML. Các công cụ tìm kiếm cũng quy định các phần tử và cấu trúc bắt buộc để làm rõ ràng nội dung của trang tài liệu HTMl như: thẻ title
, các thẻ meta
(xem bài Thẻ meta mà Google hiểu được và bài Tạo mô tả thẻ meta chính xác), thẻ H1… cấu trúc trang web theo vi định dạng – microformat, cấu trúc trang web theo vi dữ liệu – schema
- Thẻ
title
: Tiêu đề của trang tài liệu HTML, thẻ này có thể trùng hoặc khác với thẻH1
. Các trình duyệt sử dụng nội dung của thẻ tiêu đề này để hiển thị lên trên thanh tiêu đề của trình duyệt và các cỗ máy tìm kiếm cũng dựa vào thẻ này để phân loại kết quả tìm kiếm. - Thẻ
meta
với thuộc tínhname="keywords"
: các từ khóa có liên quan đến nội dung của trang tài liệu HTML. Hiện này các công cụ tìm kiếm không yêu cầu phải có nhưng tốt nhất chúng ta cũng nên thêm vào vì nó làm rõ ràng hơn cho nội dung trong trang web của chúng ta, và bạn có thể bỏ qua thẻ này nếu bạn muốn. Như bạn thấy danh sách các từ khóa liên quan được đặt trong thuộc tínhcontent
. - Thẻ
meta
với thuộc tínhname="description"
: đoạn mô tả ngắn về nội dung của trang web. Google và các cỗ máy tìm kiếm khác thường cắt lấy 160 ký tự đầu tiên trong thuộc tínhcontent
của thẻmeta
này. - Thẻ
link
: liên kết tới các thư viện cần thiết cho việc hiển thị trang web như stylesheet (CSS), font chữ, shortcut icon, hoặc các thư viện được nhúng khác… - Thẻ
script
: liên kết tới các thư viện JavaScript cần thiết cho việc hiển thị trang web như JQuery, hoặc các đoạn code JavaScript do người lập trình tự định nghĩa…
Phần mở rộng của tập tin HTML
Một tài liệu HTML thường được lưu với phần mở rộng là .html
hoặc .htm
hoặc một số định dạng khác tùy thuộc vào loại và phiên bản của tài liệu HTML.
Một số ngôn ngữ lập trình quy định phần mở rộng khác như .php
đối với ngôn ngữ PHP hay .aspx
đối với ASP.NET. Mục đích này là để server nhận biết cần phải biên dịch trước khi truyền nội dung đến phía người dùng.