HTML là gì và ứng dụng ra sao

HTML là gì và nó được ứng dụng ra sao, hiểu được vì sao nó lại quan trọng dù bạn là người làm website chuyên nghiệp hay nghiệp dư đều phải biết qua nó. Thậm chí những người làm công việc không mấy liên quan như Biên tập viên cũng cần nên biết HTML.

HTML là gì?

HTML là chữ viết tắt của cụm từ HyperText Markup Language (xem thêm) (dịch là Ngôn ngữ đánh dấu siêu văn bản) được sử dụng để tạo một trang web, trên một website có thể sẽ chứa nhiều trang và mỗi trang được quy ra là một tài liệu HTML (thi thoảng mình sẽ ghi là một tập tin HTML). Cha đẻ của HTML là Tim Berners-Lee, cũng là người khai sinh ra World Wide Web và chủ tịch của World Wide Web Consortium (W3C – tổ chức thiết lập ra các chuẩn trên môi trường Internet).
 
Một tài liệu HTML được hình thành bởi các phần tử HTML (HTML Elements) được quy định bằng các cặp thẻ (tag), các cặp thẻ này được bao bọc bởi một dấu ngoặc ngọn (ví dụ <html>) và thường là sẽ được khai báo thành một cặp, bao gồm thẻ mở và thẻ đóng (ví <strong> dụ </strong> và ). Các văn bản muốn được đánh dấu bằng HTML sẽ được khai báo bên trong cặp thẻ (ví dụ <strong>Đây là chữ in đậm</strong>). Nhưng một số thẻ đặc biệt lại không có thẻ đóng và dữ liệu được khai báo sẽ nằm trong các thuộc tính (ví dụ như thẻ <img>).
 
Một tập tin HTML sẽ bao gồm các phần tử HTML và được lưu lại dưới đuôi mở rộng là .html hoặc .htm.

HTML được xử lý ra sao?

Khi một tập tin HTML được hình thành, việc xử lý nó sẽ do trình duyệt web đảm nhận. Trình duyệt sẽ đóng vai trò đọc hiểu nội dung HTML từ các thẻ bên trong và sẽ chuyển sang dạng văn bản đã được đánh dấu để đọc, nghe hoặc hiểu (do các bot máy tính hiểu).

Cấu trúc một đoạn HTML

Như mình đã nói ở trên, HTML sẽ được khai báo bằng các phần tử bởi các từ khóa. Nội dung nằm bên trong cặp từ khóa sẽ là nội dung bạn cần định dạng với HTML. Ví dụ dưới đây là một đoạn HTML khai báo một đoạn văn bản.
 
<p>Đây là một đoạn văn bản trong HTML.</p>
 
Ngoài ra, trong các thẻ còn có các thuộc tính, thuộc tính sẽ đặt bên trong thẻ mở đầu, mỗi thuộc tính sẽ có giá trị được đặt trong dấu ngoặc kép và cách nhau bởi dấu bằng (=) với tên thuộc tính. Ví dụ dưới đây là một thẻ có sử dụng thuộc tính-

<font color="red">chữ màu đỏ</font>

Một thẻ có thể sử dụng nhiều thuộc tính chứ không phải chỉ một thuộc tính nhé.

Dùng chương trình gì để tạo tập tin HTML?

HTML là một tập tin siêu văn bản nên bạn có thể dùng các chương trình soạn thảo văn bản không có chức năng định dạng văn bản để tạo ra một tập tin HTML. Trong Windows, bạn có thể dùng Notepad để tạo ra một tập tin HTML, còn trên Mac thì có thể dùng TextEdit và Vim trên các hệ điều hành Linux khác. Miễn là sau đó bạn phải lưu tập tin thành đuôi .html và sử dụng trình duyệt website để đọc nó.
 
HTML có thể được soạn thảo bởi bất kỳ một trình soạn thảo văn bản đơn giản.
Tuy nhiên Notepad lại quá đơn giản để sử dụng cho mục đích soạn thảo, nên từ các bài sau chúng ta sẽ dùng một chương trình khác tương tự để soạn thảo HTML. Và mình cũng không bao giờ khuyến khích bạn sửa một tập tin HTML bất kỳ bằng chương trinh Notepad để tránh gặp các lỗi hiển thị ký tự tiếng Việt.

HTML đóng vai trò gì trong website?

Như mình đã nói, HTML là một ngôn ngữ đánh dấu siêu văn bản nên nó sẽ có vai trò xây dựng cấu trúc siêu văn bản trên một website, hoặc khai báo các tập tin kỹ thuật số (media) như hình ảnh, video, nhạc.
 
Điều đó không có nghĩa là chỉ sử dụng HTML để tạo ra một website mà HTML chỉ đóng một vai trò hình thành trên website. Ví dụ một website như mangthuvien.com sẽ được hình thành bởi:
  1. HTML – Xây dựng cấu trúc và định dạng các siêu văn bản.
  2. CSS – Định dạng các siêu văn bản dạng thô tạo ra từ HTML thành một bố cục website, có màu sắc, ảnh nền,….
  3. Javascript – Tạo ra các sự kiện tương tác với hành vi của người dùng (ví dụ nhấp vào ảnh trên nó sẽ có hiệu ứng phóng to).
  4. ASP – Ngôn ngữ lập trình để xử lý và trao đổi dữ liệu giữa máy chủ đến trình duyệt (ví dụ như các bài viết sẽ được lưu trong máy chủ).
  5. SQLServer – Hệ quản trị cơ sở dữ liệu truy vấn có cấu trúc (SQL – ví dụ như các bài viết sẽ được lưu lại với dạng dữ liệu SQL).
Nhưng ở đây, tạm thời bạn chỉ cần quan tâm đến HTML mà thôi. Dễ hiểu hơn, bạn hãy nghĩ rằng nếu website là một cơ thể hoàn chỉnh thì HTML chính là bộ xương của cơ thể đó, nó như là một cái khung sườn vậy.
 
Như vậy, dù website thuộc thể loại nào, giao tiếp với ngôn ngữ lập trình nào để xử lý dữ liệu thì vẫn phải cần HTML để hiển thị nội dung ra cho người truy cập xem.

Một số khái niệm

- Dynamic HTML (DHTML-HTML động): là ngôn ngữ HTML mở rộng làm tăng hiệu ứng trình bày văn bản và đối tượng khác. Trong FrontPage, bạn có thể sử dụng thanh công cụ DHTML Effects để làm tăng cường hiệu ứng cho các thành phần của mà không cần lập trình.

- Active Data Objects(ADO): Các thành phần gíup các ứng dụng của người dùng(client applications) truy cập và chế tác dữ liệu cơ sở dữ liệu trên server qua 1 nhà cung cấp.

- Active Server Page (ASP): là 1 tài liệu chứa script nhúng trên server . Web servers tương thích ASP có thể chạy các script này. Trên máy trạm, 1 ASP là 1 tài liệu HTML chuẩn có thể được xem trên bất kỳ máy nào trên Web browser nào.

- ActiveX: 1 tập hợp các kỹ thuật cho phép các thành phần phần mềm tương tác với một thành phần khác trong môi trường mạng, bất chấp ngôn ngữ của thành phần được tạo ra. ActiveX được dùng làm chính yếu để phát triển nội dung tương tác của World Wide Web, mặc dù nó có thể sử dụng trong các ứng dụng người-máy và các chương trình khác.

- URL (Uniform Resource Locator): địa chỉ tới một trạm Internet hay mạng nội bộ, laf 1 chuỗi cung cấp địa chỉ Internet của 1 Web site tài nguyên trên World Wide Web, đi theo sau 1 nghi thức. URL thường dùng là http://, để chỉ định địa chỉ Web site trên Internet. Những URL khác là gopher://, ftp://, mailto://...

- Bookmark: 1 vị trí trên 1 trang web có thể là đích của 1 hyperlink. 1 bookmark có thể áp dụng cho 1 chuỗi ký tự tồn tại trên trang ngăn cách bởi bất kỳ ký tự nào. Bookmarks cho phép tác giả link đến 1 phần đã chỉ định trên trang. Trong 1 URL, 1 bookmark được đánh dấu phía trước bằng dấu thăng(#). Cũng được gọi là neo (anchor).

- Web browser (Trình duyệt web): Phần mền phiên dịch đánh dấu của các file bằng HTML, định dạng chúng sang các trang Web, và thể hiện chúng cho người dùng. Vài browser có thể cho phép người dùng gởi nhận e-mail, đọc newsgroups, và thực hiện các file sound hoặc video đã được nhúng và trong tài liệu Web.

- Script: Một tập các chỉ lệnh dùng để báo cho chương trình biết cách thực hiện một thủ tục qui định, như đang nhập vào hệ thống thư điện tử chẳng hạn. Các khả năng script được cài sẵn trong một số chương trình. Bạn phải tìm hiểu cách viết script đó bằng loại ngôn ngữ không khác gì ngôn ngữ lập trình mini. Có một số chương trình ghi script này một cách tự động bằng cách ghi lại những lần gõ phím và chọn dùng lệnh của bạnh khi bạn tiến hành thủ tục này. Các script giống như các macro, trừ một điều là thuật ngữ macro được dành riêng để chỉ những script nào mà bạn có thể khởi đầu bằng cách ấn một tổ hợp phím do bạn tự quy định.

- Structured Query Language - SQL: Trong các hệ quản lý cơ sở dữ liệu, đây là ngôn ngữ vấn đáp do IBM soạn thảo được sử dụng rộng rãi trong máy tính lớn và hệ thống máy tính mini. SQL đang được trang bị trong các mạng khách/chủ như là một phương pháp làm cho các máy tính cá nhân có khả năng thâm nhập vào các tài nguyên của các cơ sở dữ liệu hợp tác. Ðây là loại ngôn ngữ độc lập với dữ liệu; người sử dụng không phải bận tâm đến vấn đề dữ liệu sẽ được thâm nhập vào bằng cách nào về mặt vật lý. 

- Hypertext Transfer Protocol-HTTP: Giao thức truyền siêu văn bản

- Hyperlink: Siêu liên kết

- Web site: trang web.

- HTTP address: địa chỉ HTTP, ví dụ http://cunglamseo.com

- Database: Cơ sở dữ liệu, kho dữ liệu. Một bộ sưu tập các thông tin về một chủ đề, được tổ chức hợp lý để thành một cơ sở cho các thủ tục công việc như truy tìm thông tin, rút ra các kết luận, và thành lập các quyết định. Bất kỳ một sưu tập thông tin nào phục vụ cho các mục đích này đều được coi là một cơ sở dữ liệu, ngay cả trường hợp các thông tin đó không được lưu trữ trong máy tính.

- Table: (Bảng) Trong chương trình quản lý cơ sở dữ liệu liên quan, đây là cấu trúc cơ sở của việc lưu trữ và hiển thị dữ liệu, trong đó các khoản mục dữ liệu được liên kết với nhau bởi các quan hệ hình thành do việc đặt chúng theo các hàng và các cột. Các hàng ứng với các bản ghi dữ liệu của các chương trình quản lý dữ liệu hướng bảng, và các cột thì ứng với các trường dữ liệu. Trong chương trình xử lý từ, thường có thể dùng lệnh Table để tạo ra một bảng tính gồm các cột và các hnàg có khản năng tính toán. Trong chương trình xử lý, thường có thể dùng lệnh Table để tạo ra một bảng tính gồm các cột và các hàng có khả năng tính toán. Trong một vài chương trình xử lý từ, tài liệu dữ liệu được tạo ra bằng tính năng hòa hợp thư sẽ tổ chức dữ liệu hòa hợp đó trong một bảng.

- Hypertext: văn bản của một tài liệu truy tìm không theo tuần tự. Người đọc tự do đuổi theo các dấu vết liên quan qua suốt tài liệu đó bằng các mối liên kết xác định sẵn do người sử dụng tự lập nên. Trong một môi trường ứng dụng hepertext thực sự, bạn có thể trỏ vào ( highlight) bất kỳ từ nào của tài liệu và sẽ tức khắc nhảy đến các tài liệu khác có văn bản liên quan đến nó. Cũng có những lệnh cho phép bạn tự tạo cho riêng mình những dấu vết kết hợp qua suốt tài liệu. Các trình ứng dụng hypertext rất hữu ích trong trường hợp phải làm với một số lượng văn bản lớn, như các bộ từ điển bách khoa và các bộ sách nhiều tập.

- Multimedia: đa phương tiện, đa môi trường, đa truyền thông Một phương pháp giới thiệu thông tin bằng máy tính, sử dụng nhiều phương tiện truyền thông tin như văn bản, đồ hoạ và âm thanh, cùng với sự gây ấn tượng bằng tương tác.

Trong chương trình giới thiệu đa phương tiện gọi là BeethovenWindowss World ( Thế giới Beethoven) chẳng hạn, bạn có thể nhìn thấy chân dung của nhà soạn nhạc, nghe âm nhạc của ông, và cả những đoạn văn bản về cuộc sống riêng của nhạc sĩ. Những tiến bộ đạt được trong việc đồng bộ âm thanh và video cho phép bạn có thể hiển thị các hình video động trong những cửa sổ màn hình.

- World Wide Web - WWW: Trong các máy tính có cơ sở UNIX và được nối với mạng Internet. Ðây là một hệ thống dùng để truy tìm và phục hồi các tài liệu hypertext thực hiện. Ðược xây dựng đầu tiên ở một phòng thí nghiệm vật lý, WWW thường xuyên nhận được các thông tin bổ sung nhờ những người sử dụng đóng góp thêm các tài liệu đã được đánh chỉ số.
Khi nhìn vào một trình đơn Web, bạn nhìn thấy một số các khoản mục được gạch dưới (trên các màn hình đồ họa) hoặc được đánh số thứ tự (trên các màn hình ký tự) đó là các mối liên kết sẽ hiển thị một tài liệu liên quan khi làm cho chúng hoạt động bằng một lệnh thích hợp.

- File Transfer Protocol - FTP: định ước truyền tệp, giao thức truyền tệp. Trong truyền thông không đồng bộ, đây là một tiêu chuẩn nhằm bảo đảm truyền dẫn không bị lỗi cho các tệp chương trình và dữ liệu thông qua hệ thống điện thoại. Chương trình FTP cũng được dùng để gọi tên cho định ước truyền tệp UNIX, một định ước hướng dẫn việc truyền dữ liệu.

- Internet: Một hệ thống gồm các mạng máy tính được liên kết với nhau trên phạm vi toàn thế giới, tạo điều kiện thuận lợi cho các dịch vụ truyền thông dữ liệu, như đăng nhập từ xa, truyền các tệp tin, thư tín điện tử, và các nhóm thông tin.

Tài nguyên tham khảo HTML

Trong serie này mình không có nói hết về các thẻ trong HTML mà chỉ nói qua các thẻ quan trọng nhất vì bạn sẽ sử dụng nó thường xuyên. Vì vậy, bạn hãy vào trang w3school.com để tham khảo ý nghĩa và cách sử dụng của tất cả các thẻ HTML.

Khi bạn làm SEO thì một website chuẩn theo HTML là rất quan trọng

Tổng hợp

Bài khác

Bài viết mới