Web social para profesionales de la información (2008)

RSS, RDF, Atom, feed, sindicación… empecemos con algunas definiciones

La semana pasada, cuando Catuxa presentaba la anatomía y las características de los blogs, hizo referencia a los formatos RSS, RDF y atom. Estos formatos son el punto de partida del módulo de esta semana, dedicada a la sindicación de contenidos, así que empezaremos con algunas definiciones.

La Web y los lenguajes de marcado

En 1990, con el nacimiento de la WWW, Tim Berners-Lee definió el HTML, un lenguaje de marcado para definir la estructura y contenido de una página web y que ha sido el más extendido durante años en la creación de páginas web. Las etiquetas de HTML estaban basadas en otro lenguaje de marcado, el SGML, que sirve para especificar las reglas de etiquetado de documentos.

De la adaptación y simplificación del SGML surgió el XML, que al igual que el SGML es un metalenguaje (un lenguaje de lenguajes) ya que sirve para describir otros lenguajes para la creación de documentos electrónicos con información estructurada, como el XHTML, cuyo objetivo es avanzar en el proyecto del WWW Consortium de lograr una web semántica, donde la información y la forma de presentarla estén claramente separadas.

RSS, otro lenguaje de marcado

Icono RSSRSS es otro lenguaje creado a partir de XML. Sus siglas corresponden a RDF Site Summary, Rich Site Summary o Really Simple Syndication (ésta última, sindicación realmente simple, es la más utilizada en la actualidad) y describen un lenguaje diseñado para la distribución o sindicación (syndication en inglés) de noticias o información tipo noticias contenidas en sitios web.

Existen distintas versiones del lenguaje RSS. Las primeras versiones, la 0.90 y 0.91 fueron desarrolladas por Netscape en 1999 para su proyecto my.netscape.com (un sitio de actualidad personalizable que se nutría de titulares de sitios web de terceros), pero abandonó el desarrollo cuando la compañía cambió su estrategia de negocio. La empresa UserLand Software adoptó la versión 0.91 y desarrolló otras versiones 0.9x y posteriormente la versión 2.0. Las mejoras de la versión 2.0 han sido publicadas por el RSS Advisory Board. La extensión de estos ficheros es “.xml” o “.rss”.

RDF es el nombre que tenía la versión 1.0 del lenguaje RSS, desarrollada por un grupo independiente de desarrolladores. Podréis encontrar feeds o canales RSS etiquetados como “RSS 1.0″ o “RDF” y guardados en archivos con extensión “.rdf”.

Atom es otro sublenguaje XML. No se basa en ninguna versión de RSS, pero es un formato muy similar y tiene el mismo objetivo: permitir la distribución de contenidos y noticias de blogs y sitios web. Para este tipo de feeds podéis encontrar las extensiones “.xml” o “.atom”. Fue creado para solventar las incompatibilidades de las distintas versiones de RSS; un documento Atom puede contener más información (y más compleja) y es más consistente que un documento RSS. Sin embargo, parece que está más extendido el formato RSS.Otros iconos RSS

El icono naranja de la Figura 1 se ha convertido en el estándar para indicar la existencia de un canal RSS en una web o blog, independientemente de si los archivos son RSS, RDF o Atom. No obstante, podréis encontrar también otros iconos como los que se muestran en la Figura 2 para indicar la existencia de un feed.

Feeds y canales RSS

Los archivos RSS o Atom comúnmente se llaman feeds o canales RSS. Un canal RSS o feed siempre tiene al menos 3 elementos: el título del canal, el enlace a la web o blog que proporciona el canal y una descripción. También puede tener otros elementos opcionales que nos informan sobre el idioma, la última fecha de actualización, el programa con el que se ha generado…

El canal está constituido por una serie de ítems que representan cada unidad de contenido (noticia, post…) publicada en la web o blog a la que pertenecen. Cada ítem consta, al menos, de un título o una descripción; además la mayoría de canales suelen mostrar también el enlace a la fuente original donde se encuentra el contenido, la fecha de publicación, el autor, la/s categoría/s, e incluso el contenido completo de la noticia.

Los canales RSS no son interpretados por los navegadores web por lo que si abrimos un archivo rss con el navegador sólo veremos código XML como el que se muestra en la Figura 3.

Código XML del feed

Para leer estos archivos necesitaremos un lector o agregador de feeds. Más adelante veremos los tipos de agregadores RSS y cómo funcionan.

14 Comentarios