Home » Bài 1: XML là gì? Tổng quan về XML

Bài 1: XML là gì? Tổng quan về XML

by Tan Nguyen
8 minutes read

XML là gì? Nó là một ngôn ngữ đánh dấu mà khá giống HTML. Một tài liệu XML là thuần văn bản và chứa các thẻ được giới hạn bởi <>. XML tạo bởi World Wide Web Consortium (W3C) để xác định cú pháp mã hóa tài liệu mà cả người và máy đều có thể đọc được. Nó thực hiện điều này thông qua việc sử dụng các thẻ xác định cấu trúc của tài liệu.
Ngôn ngữ đánh dấu mở rộng (XML) được sử dụng để mô tả dữ liệu. Tiêu chuẩn XML là một cách linh hoạt để tạo các định dạng thông tin và chia sẻ dữ liệu có cấu trúc điện tử thông qua Internet công cộng , cũng như qua các mạng công ty.

tong quan ve xml la gi

XML là gì? Tổng quan về XML

XML không có thẻ riêng, người dùng có thể tạo bất kỳ thẻ nào theo ý muốn ( nhưng vẫn phải tuân thủ quy tắc của XML). Các thẻ XML khá giống với HTML: tag, attribute, data.
XML sẽ được xây dựng theo dạng cây và phải có tổi thiểu một nút gốc.

Tổng quan XML là gì?

  • XML cũng là một ngôn ngữ đánh dấu như  HTML.
  • XML là viết tắt của EXtensible Markup Language.
  • Trong XML sẽ có các cặp thẻ do người dùng tự định nghĩa.
  • XML là nơi để lưu trữ và vận chuyển dữ liệu, khác với HTML là nơi để hiển thị dữ liệu.
  • Có thể hiểu đơn giản XML như là một cơ sở dữ liệu dạng nhỏ.

Hai điểm khác nhau chủ yếu giữa XML và HTML là gì.

  • XML không định nghĩa một tập các thẻ cụ thể.
  • XML thực sự “kén chọn” cấu trúc tài liệu.

Với XMLsẽ cung cấp cho bạn nhiều đặc quyền hơn HTML. HTML có một tập hợp thẻ cụ thể: thẻ <a></a> bao quanh một link, thẻ <p> bắt đầu một đoạn văn, …
Tuy nhiên, một tài liệu XML có thể sử dụng bất kỳ thẻ nào bạn muốn. Đặt thẻ <rating></rating> xung quanh một movie rating, thẻ <height></height> xung quanh độ cao của người nào đó. Vì thế, XML cung cấp cho bạn tùy chọn để cơ cấu các thẻ cho riêng bạn.

XML dùng để làm gì ?

  • Lưu trữ những thông tin nhỏ.
  • Tạo phần tóm tắt nội dung cho website (RSS)
  • Tạo sơ đồ Website (Sitemap)
  • Dùng làm cầu nối trao đổi dữ liệu giữa các ứng dụng web (Web service).

Đối với các bạn đã từng tham gia vào vọc vạch với blogspot rồi thì chắc hẳn đã tiếp xúc với XML rất nhiều rồi phải không nào !

Cấu trúc tập tin XML

<?xml version="1.0" encoding="UTF-8"?>
<root>
  <name>
    <subname>Van Minh</subname>
  </name>
  <name>
    <subname>.....</subname>
  </name>
</root>

Trong một tập tin XML sẽ bắt đầu bằng cú pháp khai báo phiên bản XML, và khai báo bộ dịch ngôn ngữ.
Tiếp theo là một cặp thẻ gốc do người dùng tự đặt. Sau đó là các cặp thẻ con cấp nhỏ hơn tuân theo cấu trúc dạng cây.

Khai báo Header (Chỉ thị xử lý)

Trên đầu mỗi file XML bạn phải khai báo một thẻ để thông báo version XML đang sử dụng (thường là version 1.0) và giá trị của encoding (kiểu mã hóa ký tự) thuộc một trong các định dạng sau: UTF-8, UTF-16, ISO-10646-UCS-2, ISO-10646-UCS-4, ISO-8859-1 to ISO-8859-9, ISO-2022-JP, Shift_JIS, EUC-JP.
Ví dụ:

<?xml version="1.0" encoding="UTF-8"?>
<title>Học PHP - TanHongIT</title>

Các quy tắc viết tài liệu XML

  • Mỗi tài liệu XML phải có một phần tử gốc và nó là duy nhất
  • Phải có thẻ đóng khi mở thẻ (hầu như mọi ngôn ngữ khác đều cần).
  • Tên các phần tử trong XML sẽ có phân biệt chứ hoa chữ thường
  • Giá trị thuộc tính nằm trong dấu nháy đôi
  • Không sử dụng các giá trị đặt biệt: & (thay thế bằng &amp;), < ( thay thế bằng &lt;), > (thay thế bằng &gt;), ” (thay thế bằng &quot;), ‘ (thay thế bằng &apos;)

Ví dụ:

<?xml version="1.0" encoding="UTF-8"?>
<root>
  <note>
    <title>Lap trinh PHP &amp; MySQL</title> <!-- &amp; sẽ thay thế cho dấu & -->
    <pages>200</pages>
  </note>
  <name>
    <subname>.....</subname>
  </name>
</root>

Kết quả nhận được sẽ như sau:
quy tac viet xml

Lưu trữ nội dung, các ký hiệu đặc biệt trong file xml

Trong trường hợp cần lưu trữ một nội dung nào đó hoặc các ký hiệu đặc biệt trong XML ta sẽ sử dụng CDATA.
Cú pháp:

<![CDATA[
   <!--các thẻ nôi dung-->
]]>

Cũng từ ví dụ tiếp ở phần quy tắc phía trên, ta sẽ sử dụng CDATA để lưu trữ nội dung như sau:

<?xml version="1.0" encoding="UTF-8"?>
<root>
  <![CDATA[
    <title>Lap trinh PHP &amp; MySQL</title> <!-- &amp; sẽ thay thế cho dấu & -->
    <pages>200</pages>
  ]]>
  <name>
    <subname>.....</subname>
  </name>
</root>

Kết quả trên trình duyệt khi này:
luu noi dung xml voi cdata

Tổng kết

Bài viết trên mình đã giới thiệu cho các bạn về khái niệm của XML là gì cũng như những chuyên đề tổng quát, cú pháp của XML. Các bạn hãy tham khảo thêm về XML trong những bài tiếp theo của series học XML tại website của mình nhé!
Xem thêm:

Nếu các bạn cảm thấy Website TanHongIT.Com thật sự hữu ích mình mong các bạn có thể chia sẻ những bài viết đến cho cộng đồng cùng thao khảo nhé. Cảm ơn các bạn !!!

Các bạn có bất kì thắc mắc cần được hỗ trợ hay yêu cầu các phần mềm, thủ thuật, khoá học,… thì cứ để lại comment bên dưới bài viết hoặc liên hệ qua fanpage của TanHongIT để được hỗ trợ nhé! Mình sẽ cố gắng chia sẻ cho các bạn mọi thứ cần thiết nhất!

CHÚC CÁC BẠN THÀNH CÔNG VÀ VUI VẺ
5/5 - (4 votes)

Related Posts

5 1 vote
Article Rating
Subscribe
Notify of
guest
0 Comments
Most Voted
Newest Oldest
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More