apuntes+santiggd+21-4-08

Normalmente los XML siguen algun tipo de esquema estándar, salvo cosas pequeñas. Existen algunos formatos conocidos como SVG, XHTML o el cada vez mas usado RSS. Ahora vamos a ver como está formado el rss.
 * Formatos XML específicos**

RSS siempre tiene un documento raiz rss y a continuación suele separar los bloques en canales. Despues tiene una serie de datos sobre el canal, como titulo, alguna imagen, y por lo general tiene una fecha de publicación, que indica se suele usar para saber si hay algo nuevo desde la última vez que lo visitamos. Despues van apareciendo las distintas noticias con por lo menos titulo, enlace y descripcion, además de la fecha de publicación.

Dado que rss es xml, para leerlo unicamente tenemos que movernos por su estructura, solo que sabemos exactamente cual es esta estrucutra. Ademas podemos encontrar algunas librerias que nos simplifican esto, de forma que no hace falta buscar literalmente los elementos y tenemos métodos que los hacen.

Parentesis( cuando necesitemos algun tipo de librería para Perl, ir directamente a http://search.cpan.org y ahí están todas. Además esto se puede hacer por línea de comandos haciendo sudo cpan, y una vez dentro se usa i tom, y da todas las que tienen tom. Esto mismo esta en ruby con el gems)

Hasta ahora hemos editado archivos XML pero ahora vamos tambíen a crearlos desde distintos script, como por ejemplo en perl se puede usar print<< y una cadena de texto que no se repita en el texto, a partir de ahi imprime todo el texto hasta que vuelva a encontrar la cadena.
 * Creando documentos XML**