¿Qué es XML?
El lenguaje de marcado extensible (XML) permite definir y almacenar datos de forma compartible. XML admite el intercambio de información entre sistemas de computación, como sitios web, bases de datos y aplicaciones de terceros. Las reglas predefinidas facilitan la transmisión de datos como archivos XML a través de cualquier red, ya que el destinatario puede usar esas reglas para leer los datos de forma precisa y eficiente.
¿Por qué es importante el XML?
El lenguaje de marcado extensible (XML) es un lenguaje de marcado que proporciona reglas para definir cualquier dato. A diferencia de otros lenguajes de programación, XML no puede realizar operaciones de computación por sí mismo. En cambio, se puede implementar cualquier software o lenguaje de programación para la administración estructurada de datos.
Por ejemplo, imagine un documento de texto con comentarios. Los comentarios pueden ofrecer sugerencias como las siguientes:
- Ponga el título en negrita
- Esta oración es un encabezado
- Esta palabra es el autor
Estos comentarios mejoran la usabilidad del documento sin repercutir en su contenido. Del mismo modo, XML utiliza símbolos de marcado para proporcionar más información sobre los datos. Otros programas, como los navegadores y las aplicaciones de procesamiento de datos, utilizan esta información para procesar datos estructurados de manera más eficiente.
Etiquetas XML
Los símbolos de marcado, denominados etiquetas en XML, se utilizan para definir los datos. Por ejemplo, para representar los datos de una librería, puede crear etiquetas como <libro>, <título> y <autor>. El documento XML de un solo libro tendría el siguiente contenido:
<libro>
<título>Introducción a Amazon Web Services</título>
<autor>Mark Wilkins</autor>
</libro>
Las etiquetas ofrecen una sofisticada codificación de datos para integrar los flujos de información en diferentes sistemas.
¿Cuáles son los beneficios de usar XML?
Respaldo para las transacciones interempresariales
Cuando una empresa vende un bien o servicio a otra empresa, las dos empresas necesitan intercambiar información como el costo, las especificaciones y los plazos de entrega. Con el lenguaje de marcado extensible (XML), pueden compartir toda la información necesaria electrónicamente y cerrar negocios complejos de forma automática, sin intervención humana.
Conservación de la integridad de los datos
XML le permite transferir datos junto con la descripción de los datos, lo que evita la pérdida de la integridad de los datos. Puede usar esta información descriptiva para hacer lo siguiente:
- Verificar la precisión de los datos.
- Personalizar automáticamente la presentación de datos para diferentes usuarios.
- Almacenar datos de forma coherente en múltiples plataformas.
Mejora de la eficiencia de búsqueda
Los programas de computación, como los motores de búsqueda, pueden ordenar y categorizar archivos XML de forma más eficiente y precisa que otros tipos de documentos. Por ejemplo, la palabra marca puede ser un sustantivo o un verbo. Basándose en las etiquetas XML, los motores de búsqueda pueden categorizar con precisión marca para resultados de búsqueda relevantes. Por lo tanto, XML ayuda a las computadoras a interpretar el lenguaje natural de manera más eficiente.
Diseño de aplicaciones flexibles
Con XML, puede actualizar o modificar cómodamente el diseño de su aplicación. Muchas tecnologías, especialmente las más nuevas, vienen con compatibilidad con XML incorporada. Pueden leer y procesar automáticamente los archivos de datos XML para que pueda realizar cambios sin tener que volver a formatear toda la base de datos.
¿Cuáles son las aplicaciones de XML?
El lenguaje de marcado extensible (XML) es la tecnología subyacente en miles de aplicaciones, que van desde herramientas de productividad comunes, como el procesamiento de textos hasta el software de publicación de libros e incluso sistemas de configuración de aplicaciones complejos.
Transferencia de datos
Puede usar XML para transferir datos entre dos sistemas que almacenan los mismos datos en diferentes formatos. Por ejemplo, su sitio web almacena las fechas en formato MM/DD/AAAA, pero su sistema de contabilidad almacena las fechas en formato DD/MM/AAAA. Puede transferir los datos del sitio web al sistema de contabilidad mediante XML. Los desarrolladores pueden escribir código que convierta automáticamente lo siguiente:
- Datos del sitio web a formato XML
- Datos XML a datos del sistema contable
- Los datos del sistema de contabilidad de vuelta a formato XML
- Datos XML de vuelta a datos del sitio web
Aplicaciones web
XML da estructura a los datos que se ven en las páginas web. Otras tecnologías de sitios web, como HTML, funcionan con XML para presentar datos coherentes y relevantes a los visitantes del sitio web. Por ejemplo, consideremos un sitio web de comercio electrónico que vende ropa. En lugar de mostrar toda la ropa a todos los visitantes, el sitio web utiliza XML para crear páginas web personalizadas basadas en las preferencias del usuario. Muestra productos de marcas específicas filtrando la etiqueta <marca>.
Documentación
Puede usar XML para especificar la información estructural de cualquier documento técnico. Luego, otros programas procesan la estructura del documento para presentarla de manera flexible. Por ejemplo, hay etiquetas XML para un párrafo, un elemento de una lista numerada y un encabezado. Con estas etiquetas, otros tipos de software preparan automáticamente el documento para usos como impresión y publicación de páginas web.
Tipo de datos
Muchos lenguajes de programación admiten XML como tipo de datos. Con esta compatibilidad, puede escribir fácilmente programas en otros lenguajes que funcionen directamente con archivos XML.
¿Cuáles son los componentes de un archivo XML?
Un archivo de lenguaje de marcado extensible (XML) es un documento basado en texto que se puede guardar con la extensión .xml. Puede escribir XML de forma similar a otros archivos de texto. Para crear o editar un archivo XML, puede usar cualquiera de las siguientes opciones:
- Editores de texto como Notepad o Notepad++
- Editores XML en línea
- Navegadores web
Cualquier archivo XML incluye los siguientes componentes.
Documento XML
Las etiquetas <xml></xml> se utilizan para marcar el principio y el final de un archivo XML. El contenido de estas etiquetas también se denomina documento XML. Es la primera etiqueta que cualquier software buscará para procesar código XML.
Declaración XML
Un documento XML comienza con alguna información sobre el propio XML. Por ejemplo, podría mencionar la versión XML que sigue. Esta apertura se denomina declaración XML. A continuación se muestra un ejemplo.
<?xml version="1.0" encoding="UTF-8"?>
Elementos XML
Todas las demás etiquetas que cree en un documento XML se denominan elementos XML. Los elementos XML pueden contener las siguientes características:
- Texto
- Atributos
- Otros elementos
Todos los documentos XML comienzan con una etiqueta principal, que se denomina elemento raíz.
Por ejemplo, eche un vistazo al archivo XML que aparece a continuación.
<ListaInvitación>
<familia>
<tía>
<nombre>Cristina</nombre>
<nombre>Estefanía</nombre>
</tía>
</familia>
</ListaInvitación>
<ListaInvitación> es el elemento raíz; familia y tía son otros nombres de elementos.
Atributos XML
Los elementos XML pueden tener otros descriptores denominados atributos. Puede definir sus propios nombres de atributos y escribir los valores de los atributos entre comillas, como se muestra a continuación.
<edad de la persona=“22”>
Contenido XML
Los datos de los archivos XML también se denominan contenido XML. Por ejemplo, en el archivo XML, es posible que veas datos como este.
<amigo>
<nombre>Carlos</nombre>
<nombre>Esteban</nombre>
</amigo>
Los valores de los datos Carlos y Esteban son el contenido.
¿Qué es un esquema XML?
Un esquema de lenguaje de marcado extensible (XML) es un documento que describe algunas reglas o límites de la estructura de un archivo XML. Puede describir estas restricciones de varias maneras diferentes, como las siguientes:
- Reglas gramaticales para determinar el orden de los elementos
- Condiciones de Sí o No que el contenido debe cumplir
- Tipos de datos para el contenido de los archivos XML
- Restricciones de integridad de datos
Por ejemplo, un esquema XML para librerías podría imponer restricciones como las siguientes:
- Un elemento de libro tendrá los atributos título y autor.
- El elemento libro se anidará en un elemento de categoría con un nombre de atributo.
- El precio de un libro será un elemento independiente anidado en libro.
Para cumplir con estas restricciones, escribiremos el archivo XML como se muestra a continuación.
<nombre de la categoría=“Tecnología”>
<título del libro=“Learning Amazon Web Services”, autor=“Mark Wilkins”>
<precio>20 USD</precio>
</libro>
</categoría>
Los esquemas XML refuerzan la coherencia en la forma en que las diferentes aplicaciones de software crean y usan los archivos XML. Algunas industrias implementan esquemas XML que son específicos de sus operaciones para reducir la complejidad de escribir código XML para la transferencia de datos entre empresas. Por ejemplo, los gráficos vectoriales escalables (SVG) son una especificación XML para describir datos relacionados con gráficos de computadora. Los desarrolladores de software escriben archivos XML para que cumplan con las especificaciones de la industria.
¿Qué es un analizador XML?
Un analizador de lenguaje de marcado extensible (XML) es un software que puede procesar o leer documentos XML para extraer los datos que contienen. Los analizadores XML también comprueban la sintaxis o las reglas del archivo XML y pueden validarlo con un esquema XML concreto. Como XML es un lenguaje de marcado estricto, los analizadores no procesarán el archivo si hay algún error de validación o sintaxis. Por ejemplo, el analizador XML dará errores si se cumple alguna de estas condiciones:
- Falta una etiqueta de cierre o una etiqueta final
- Los valores de los atributos no tienen comillas
- No se ha cumplido una condición de esquema
Las aplicaciones de software utilizan analizadores XML para transformar los archivos XML en tipos de datos nativos. De este modo, pueden centrarse en la lógica de la aplicación sin tener que entrar en los detalles del propio XML.
¿En qué se diferencia XML de HTML?
El lenguaje de marcado de hipertexto (HTML) es el lenguaje utilizado en la mayoría de las páginas web. Un navegador web procesa los documentos HTML y los muestra como una página multimedia. El World Wide Web Consortium (W3C) es la comunidad internacional que desarrolla protocolos y directrices para garantizar el crecimiento a largo plazo de la web. El W3C estableció los estándares HTML y de lenguaje de marcado extensible (XML) que los desarrolladores de sitios web implementan para lograr coherencia y calidad.
Diferencias entre XML y HTML
Si bien los archivos HTML y XML son muy similares, existen algunas diferencias clave.
Objetivo
El propósito de HTML es presentar y mostrar datos. Sin embargo, XML almacena y transporta datos.
Etiquetas
HTML tiene etiquetas predefinidas, pero los usuarios pueden crear y definir sus propias etiquetas en XML.
Reglas de sintaxis
Existen algunas diferencias menores pero importantes entre la sintaxis de HTML y XML. Por ejemplo, XML distingue entre mayúsculas y minúsculas, pero HTML no. Los analizadores de XML darán errores si escribes una etiqueta como <Libro> en lugar de <libro>.
¿Cómo los servicios de AWS admiten XML?
Todos los servicios de integración de datos de AWS pueden procesar archivos con el lenguaje de marcado extensible (XML). A continuación, enumeramos algunos ejemplos.
AWS Glue es un servicio de integración de datos sin servidores que facilita la detección, preparación y combinación de datos para análisis, machine learning y desarrollo de aplicaciones. AWS Glue DataBrew es una herramienta de preparación visual de datos que puede utilizar para preparar datos con una interfaz visual interactiva de apuntar y hacer clic sin necesidad de escribir código. DataBrew puede introducir todos los tipos de formatos de archivo, incluido XML.
Amazon Simple Queue Service (SQS) es un servicio de cola de mensajes totalmente administrado que puede usar para enviar, almacenar y recibir mensajes entre componentes de software en cualquier volumen. Los mensajes de Amazon SQS pueden contener un máximo de 256 KB de datos de texto, incluidos XML, JSON y texto sin formato.
Amazon Kinesis facilita la recopilación, procesamiento y análisis de datos de streaming en tiempo real para obtener información de manera oportuna y reaccionar rápidamente ante información nueva. Con las funciones clave de Kinesis, puede procesar datos de streaming de forma rentable a cualquier escala. También obtiene la flexibilidad de elegir herramientas que se adapten a los requisitos de su aplicación. Transmita, transforme y analice datos XML en tiempo real con Kinesis.
Comience con la integración de datos creando una cuenta de AWS hoy mismo.
Siguientes pasos con AWS
Obtenga acceso inmediato al nivel Gratuito de AWS.
Comience a crear con AWS en la consola de administración de AWS.