XML là gì?

Ngôn ngữ đánh dấu mở rộng (XML) cho phép bạn xác định và lưu trữ dữ liệu theo cách có thể chia sẻ. XML hỗ trợ trao đổi thông tin giữa các hệ thống máy tính như trang web, cơ sở dữ liệu và ứng dụng của bên thứ ba. Các quy tắc định sẵn giúp dễ dàng truyền dữ liệu dưới dạng tệp XML qua bất kỳ mạng nào do người nhận có thể áp dụng các quy tắc đó để đọc dữ liệu một cách chính xác và hiệu quả.

Tại sao XML lại quan trọng?

Ngôn ngữ đánh dấu mở rộng (XML) là một ngôn ngữ đánh dấu cung cấp các quy tắc để xác định bất kỳ dữ liệu nào. Không giống như những ngôn ngữ lập trình khác, XML không thể tự thực hiện các hoạt động điện toán. Thay vào đó, bất kỳ phần mềm hoặc ngôn ngữ lập trình nào cũng có thể được triển khai để quản lý dữ liệu có cấu trúc.

Ví dụ: hãy xem xét một tài liệu văn bản có bình luận đi kèm. Các bình luận có thể đưa ra những đề xuất như sau:

  • In đậm tiêu đề
  • Câu này là tiêu đề
  • Từ này là tác giả

Những bình luận như vậy sẽ cải thiện khả năng sử dụng mà không gây ảnh hưởng đến nội dung của tài liệu đó. Tương tự, XML cũng sử dụng các ký hiệu đánh dấu để cung cấp thêm thông tin về bất kỳ dữ liệu nào. Các phần mềm khác, chẳng hạn như trình duyệt và ứng dụng xử lý dữ liệu, sử dụng thông tin này để xử lý dữ liệu có cấu trúc hiệu quả hơn.

Thẻ XML

Bạn sử dụng các ký hiệu đánh dấu được gọi là thẻ trong XML để xác định dữ liệu. Ví dụ: để biểu thị dữ liệu cho một hiệu sách, bạn có thể tạo các thẻ như <book>, <title> và <author>. Tài liệu XML của bạn cho một cuốn sách sẽ có nội dung như sau:

<book>

<title> Tìm hiểu về Amazon Web Services </title>

<author> Mark Wilkins </author>

</book>

Thẻ mang khả năng viết mã dữ liệu phức tạp nhằm tích hợp các luồng thông tin trên nhiều hệ thống khác nhau.

Lợi ích của việc sử dụng XML là gì?

Hỗ trợ giao dịch giữa các doanh nghiệp

Khi một công ty bán hàng hóa hoặc dịch vụ cho một công ty khác, hai doanh nghiệp cần trao đổi các thông tin như chi phí, thông số kỹ thuật và lịch trình phân phối. Với Ngôn ngữ đánh dấu mở rộng (XML), họ có thể chia sẻ tất cả thông tin cần thiết qua dạng điện tử và tự động đóng các giao dịch phức tạp mà không cần đến bất kỳ sự can thiệp nào từ con người. 

Duy trì tính toàn vẹn của dữ liệu

XML cho phép bạn truyền dữ liệu cùng với thông tin mô tả của dữ liệu đó, đảm bảo tính toàn vẹn của dữ liệu. Bạn có thể sử dụng thông tin mô tả này để thực hiện các thao tác sau:

  • Xác minh độ chính xác của dữ liệu
  • Tự động tùy chỉnh cách trình bày dữ liệu cho những người dùng khác nhau
  • Lưu trữ dữ liệu nhất quán trên nhiều nền tảng 

Nâng cao hiệu quả tìm kiếm

Những chương trình máy tính như công cụ tìm kiếm có thể sắp xếp và phân loại các tệp XML một cách hiệu quả và chính xác hơn nhiều loại tài liệu khác. Ví dụ: từ mark có thể là danh từ hoặc động từ. Dựa trên thẻ XML, công cụ tìm kiếm có thể phân loại chính xác mark cho kết quả tìm kiếm có liên quan. Do đó, XML giúp máy tính diễn giải ngôn ngữ tự nhiên hiệu quả hơn.

Thiết kế ứng dụng linh hoạt

Với XML, bạn có thể thuận tiện nâng cấp hoặc điều chỉnh thiết kế ứng dụng của mình. Nhiều công nghệ, đặc biệt là những công nghệ mới, đi kèm với khả năng hỗ trợ XML tích hợp. Những công nghệ này có thể tự động đọc và xử lý các tệp dữ liệu XML, do đó bạn có thể thực hiện thay đổi mà không cần phải định dạng lại toàn bộ cơ sở dữ liệu của mình.

 

XML có những ứng dụng gì?

Ngôn ngữ đánh dấu mở rộng (XML) là công nghệ cơ sở trong hàng nghìn ứng dụng, trải dài từ các công cụ năng suất phổ biến như xử lý văn bản cho đến phần mềm xuất bản sách, hay thậm chí là cả các hệ thống cấu hình ứng dụng phức tạp.

Truyền dữ liệu

Bạn có thể sử dụng XML để truyền dữ liệu giữa hai hệ thống lưu trữ cùng một dữ liệu ở nhiều định dạng khác nhau. Ví dụ: trang web của bạn lưu trữ ngày ở định dạng MM/DD/YYYY, nhưng hệ thống kế toán của bạn lại lưu trữ ngày ở định dạng DD/MM/YYYY. Bạn có thể truyền dữ liệu từ trang web đến hệ thống kế toán bằng XML. Nhà phát triển của bạn có thể viết mã tự động chuyển đổi những yếu tố sau:

  • Chuyển đổi dữ liệu trang web thành định dạng XML
  • Chuyển đổi dữ liệu XML thành dữ liệu hệ thống kế toán
  • Chuyển đổi dữ liệu hệ thống kế toán trở lại định dạng XML
  • Chuyển đổi dữ liệu XML trở lại dữ liệu trang web

Ứng dụng web

XML cung cấp cấu trúc cho dữ liệu mà bạn nhìn thấy trên các trang web. Các công nghệ trang web khác, chẳng hạn như HTML, làm việc với XML để trình bày dữ liệu nhất quán và có liên quan đến khách truy cập trang web. Ví dụ: hãy xem xét một trang web thương mại điện tử bán quần áo. Thay vì hiển thị mọi loại quần áo cho tất cả khách truy cập, trang web này sử dụng XML để tạo các trang web tùy chỉnh dựa trên sở thích của người dùng. Trang web tùy chỉnh này hiển thị sản phẩm từ các thương hiệu cụ thể khi lọc thẻ <brand>.

Tài liệu

Bạn có thể sử dụng XML để chỉ định thông tin cấu trúc của bất kỳ tài liệu kỹ thuật nào. Sau đó, các chương trình khác xử lý cấu trúc tài liệu để trình bày nó một cách linh hoạt. Ví dụ: bạn có các thẻ XML cho một đoạn văn, một mục trong danh sách được đánh số và một tiêu đề. Khi sử dụng những thẻ này, các loại phần mềm khác sẽ tự động chuẩn bị tài liệu để phục vụ cho nhiều mục đích sử dụng, chẳng hạn như in ấn và xuất bản trang web.

Loại dữ liệu

Nhiều ngôn ngữ lập trình hỗ trợ XML như một kiểu dữ liệu. Nhờ đó, bạn có thể dễ dàng viết chương trình bằng những ngôn ngữ khác có thể làm việc trực tiếp với các tệp XML.

Tệp XML bao gồm những thành phần nào?

Tệp Ngôn ngữ đánh dấu mở rộng (XML) là tài liệu dựa trên văn bản cho phép bạn lưu bằng đuôi mở rộng .xml. Bạn có thể viết XML tương tự như các tệp văn bản khác. Để tạo hoặc chỉnh sửa một tệp XML, bạn có thể sử dụng bất kỳ cách nào sau đây: 

  • Trình soạn thảo văn bản như Notepad hoặc Notepad++
  • Trình biên tập XML trực tuyến
  • Trình duyệt web

Bất kỳ tệp XML nào cũng bao gồm các thành phần sau.

Tài liệu XML

Các thẻ <xml></xml> được dùng để đánh dấu phần đầu và phần cuối tệp XML. Nội dung trong những thẻ này còn được gọi là tài liệu XML. Đây là thẻ mà bất kỳ phần mềm nào cũng tìm kiếm đầu tiên để xử lý mã XML.

Phần khai báo XML

Một tài liệu XML luôn bắt đầu với một số thông tin về chính nó. Ví dụ: tài liệu này có thể đề cập đến phiên bản XML mà nó tuân theo. Phần mở đầu này được gọi là phần khai báo XML. Đây là một ví dụ.

<?xml version="1.0" encoding="UTF-8"?>

Các phần tử XML

Tất cả những thẻ khác bạn tạo trong tài liệu XML được gọi là các phần tử XML. Các phần tử XML có thể chứa những đặc tính này:

  • Văn bản
  • Thuộc tính
  • Các phần tử khác

Tất cả các tài liệu XML đều bắt đầu với một thẻ chính, được gọi là phần tử gốc.

Ví dụ: hãy xem xét tệp XML dưới đây.

<InvitationList>

<family>

       <aunt>

       <name>Christine</name>

        <name>Stephanie</name>

       </aunt>

</family>

</InvitationList>

<InvitationList> là phần tử gốc; familyaunt là tên phần tử khác.

Các thuộc tính XML

Phần tử XML có thể có nhiều bộ mô tả khác được gọi là các thuộc tính. Bạn có thể xác định tên thuộc tính của riêng mình và viết giá trị thuộc tính trong các dấu ngoặc kép như sau.

<person age=“22”>

Nội dung XML

Dữ liệu trong tệp XML còn được gọi là nội dung XML. Ví dụ: trong tệp XML, bạn có thể thấy dữ liệu như thế này. 

<friend>

       <name>Charlie</name>

       <name>Steve</name>

</friend>

Các giá trị dữ liệu CharlieSteve là nội dung.

Lược đồ XML là gì?

Lược đồ Ngôn ngữ đánh dấu mở rộng (XML) là tài liệu mô tả một số quy tắc hoặc giới hạn về cấu trúc của một tệp XML. Bạn có thể mô tả những ràng buộc này theo một số cách khác nhau như sau:

  • Quy tắc ngữ pháp để xác định thứ tự phần tử
  • Dạng điều kiện Có hoặc Không mà nội dung bắt buộc phải đáp ứng
  • Kiểu dữ liệu cho nội dung trong tệp XML
  • Ràng buộc đối với tính toàn vẹn của dữ liệu

Giả sử một lược đồ XML cho các hiệu sách có thể đặt ra các ràng buộc như sau:

  1. Phần tử sách sẽ có các thuộc tính titleauthor.
  2. Phần tử sách sẽ được lồng trong phần tử danh mục có tên thuộc tính.
  3. Giá của một cuốn sách sẽ là một phần tử riêng biệt được lồng trong book

Để đáp ứng những ràng buộc này, chúng ta sẽ viết tệp XML như sau. 

<category name=“Công nghệ”>

<book title=“Tìm hiểu về Amazon Web Services”, author=“Mark Wilkins”>

<price>20 USD</price>

</book>

</category>

Lược đồ XML thực thi tính nhất quán trong cách các ứng dụng phần mềm khác nhau tạo và sử dụng tệp XML. Một số ngành triển khai lược đồ XML dành riêng cho các hoạt động của họ nhằm giảm độ phức tạp trong quá trình viết mã XML để truyền dữ liệu giữa các doanh nghiệp. Ví dụ: Đồ họa vectơ quy mô linh hoạt (SVG) là định dạng đặc tả XML dùng để mô tả dữ liệu liên quan đến đồ họa máy tính. Nhà phát triển phần mềm viết các tệp XML sao cho đáp ứng được thông số kỹ thuật của ngành.

Trình phân tích cú pháp XML là gì?

Trình phân tích cú pháp Ngôn ngữ đánh dấu mở rộng (XML) là phần mềm có thể xử lý hoặc đọc các tài liệu XML để trích xuất dữ liệu bên trong chúng. Trình phân tích cú pháp XML cũng kiểm tra cú pháp hoặc quy tắc của tệp XML và có thể xác thực dựa trên một lược đồ XML cụ thể. XML là một ngôn ngữ đánh dấu nghiêm ngặt, do đó trình phân tích cú pháp sẽ không xử lý tệp nếu có bất kỳ lỗi xác thực hoặc lỗi cú pháp nào. Giả sử trình phân tích cú pháp XML sẽ đưa ra lỗi nếu xảy ra bất kỳ điều kiện nào sau đây:

  • Thiếu thẻ đóng hoặc thẻ kết thúc
  • Giá trị thuộc tính không có dấu ngoặc kép
  • Chưa đáp ứng một điều kiện lược đồ

Các ứng dụng phần mềm sử dụng trình phân tích cú pháp XML để biến tệp XML thành kiểu dữ liệu gốc. Nhờ đó, các ứng dụng này có thể tập trung vào logic ứng dụng mà không cần phải đi sâu vào XML.

 

XML khác với HTML như thế nào?

Ngôn ngữ đánh dấu siêu văn bản (HTML) là ngôn ngữ được sử dụng trong hầu hết các trang web. Trình duyệt web xử lý và hiển thị các tài liệu HTML dưới dạng trang đa phương tiện. Hiệp hội web toàn cầu (W3C) là cộng đồng quốc tế phát triển các giao thức và hướng dẫn để đảm bảo web phát triển lâu dài. W3C đã thiết lập cả hai tiêu chuẩn HTML và Ngôn ngữ đánh dấu mở rộng (XML) mà các nhà phát triển trang web triển khai để đảm bảo tính nhất quán và chất lượng.

XML so với HTML

Tệp HTML và XML trông rất giống nhau, tuy nhiên lại có một số điểm khác biệt chính.

Mục đích

HTML mang mục đích trình bày và hiển thị dữ liệu. Tuy nhiên, XML lại mang mục đích lưu trữ và di chuyển dữ liệu.

Thẻ

HTML có các thẻ định sẵn, song người dùng vẫn có thể tạo và xác định các thẻ của riêng mình trong XML.

Quy tắc về cú pháp

Cú pháp của HTML và XML có một số điểm khác biệt nhỏ nhưng quan trọng không kém. Ví dụ: XML phân biệt chữ hoa chữ thường, nhưng HTML thì không. Trình phân tích cú pháp XML sẽ đưa ra lỗi nếu bạn viết thẻ là <Book> thay vì <book>.

Các dịch vụ của AWS hỗ trợ XML như thế nào?

Tất cả các dịch vụ tích hợp dữ liệu của AWS đều có thể xử lý tệp Ngôn ngữ đánh dấu mở rộng (XML). Sau đây là một vài ví dụ chúng tôi liệt kê ra.

AWS Glue là dịch vụ tích hợp dữ liệu phi máy chủ mà bạn có thể sử dụng để tìm kiếm, chuẩn bị và kết hợp dữ liệu cho hoạt động phân tích, máy học và phát triển ứng dụng. AWS Glue DataBrew là công cụ chuẩn bị dữ liệu trực quan mà bạn có thể sử dụng để chuẩn bị dữ liệu với giao diện trực quan tương tác trỏ và nhấp mà không cần viết mã. DataBrew có thể nhập tất cả các loại định dạng tệp, kể cả XML.

Dịch vụ hàng đợi đơn giản (SQS) của Amazon là dịch vụ hàng đợi tin nhắn được quản lý toàn phần mà bạn có thể sử dụng để gửi, lưu trữ và nhận tin nhắn giữa các thành phần phần mềm ở dung lượng bất kỳ. Tin nhắn Amazon SQS có thể chứa tới 256 KB dữ liệu văn bản, bao gồm XML, JSON và văn bản chưa định dạng.

Amazon Kinesis giúp cho việc thu thập, xử lý và phân tích dữ liệu thời gian thực, theo luồng dễ dàng hơn để bạn có thể có được thông tin chuyên sâu kịp thời và phản ứng nhanh với thông tin mới. Nhờ các tính năng chính của Kinesis, bạn có thể xử lý dữ liệu theo luồng với mức chi phí hiệu quả ở mọi quy mô. Bạn cũng có thể linh hoạt lựa chọn các công cụ phù hợp với yêu cầu ứng dụng của bạn. Phân luồng, chuyển đổi và phân tích dữ liệu XML theo thời gian thực với Kinesis.

Bắt đầu sử dụng tích hợp dữ liệu bằng cách tạo tài khoản AWS ngay hôm nay.

Các bước tiếp theo để sử dụng AWS

Tham khảo các tài nguyên bổ sung liên quan đến sản phẩm
Tìm hiểu thêm về các Dịch vụ phân tích 
Đăng ký tài khoản miễn phí

Nhận ngay quyền sử dụng bậc miễn phí của AWS. 

Đăng ký 
Bắt đầu xây dựng trong bảng điều khiển

Bắt đầu xây dựng với AWS trên Bảng điều khiển quản lý AWS.

Đăng nhập