{"id":357,"date":"2017-03-15T18:20:43","date_gmt":"2017-03-15T16:20:43","guid":{"rendered":"http:\/\/tecnologiasweb.jsenso.es\/?p=357"},"modified":"2017-03-15T18:20:43","modified_gmt":"2017-03-15T16:20:43","slug":"el-fichero-sitemap-xml","status":"publish","type":"post","link":"https:\/\/blogs.ugr.es\/tecweb\/el-fichero-sitemap-xml\/","title":{"rendered":"El fichero sitemap.xml"},"content":{"rendered":"<p>Contin\u00fao con la trilog\u00eda sobre los ficheros clave en cualquier servidor web. Si en anteriores entradas hablaba de <a href=\"http:\/\/tecnologiasweb.jsenso.es\/el-fichero-htaccess\/\" target=\"_blank\" rel=\"noopener\"><em>.htaccess<\/em><\/a>, ahora me centrar\u00e9 en sitemap.xml.<\/p>\n<p>Antes de nada, creo que es necesario establecer una distinci\u00f3n terminol\u00f3gica. La mayor\u00eda de mis alumnos suele confundir <em>sitemap.xml<\/em> con el <em>mapa del sitio<\/em>. Es una confusi\u00f3n bastante razonable. Ambos significan lo mismo y sirven, m\u00e1s o menos, para lo mismo: mostrar la estructura del sitio web. Sin embargo existen diferencias evidentes.<\/p>\n<p>Un mapa del sitio es un mecanismo de navegaci\u00f3n de los que <a href=\"http:\/\/shop.oreilly.com\/product\/0636920034674.do\" target=\"_blank\" rel=\"noopener\">Rosenfeld, Morville y Arango<\/a> denominan <em>complementarios<\/em>. Es decir, de los que sirven para un prop\u00f3sito concreto y est\u00e1n integrados dentro del sistema de navegaci\u00f3n principal del sitio web. De ah\u00ed se puede deducir que poseen una serie de caracter\u00edsticas propias, que los diferencian de los \u201cotros\u201d mapas del sitio:<\/p>\n<ul>\n<li>Se trata de un elemento visible para el usuario, quien podr\u00e1 acceder a \u00e9l por medio de alg\u00fan enlace determinado que se puede mostrar dentro de cualquier secci\u00f3n del sitio web. Es decir, que est\u00e1 vinculado desde el mecanismo de navegaci\u00f3n del sitio. Por ejemplo, en la primera imagen se puede observar el acceso al mapa web del Ministerio de Sanidad, Servicios Sociales e Igualdad<a href=\"#_edn1\" name=\"_ednref1\">[i]<\/a>, y en la segunda el resultado de dicho enlace:<\/li>\n<\/ul>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright wp-image-566\" src=\"https:\/\/blogs.ugr.es\/tecweb\/wp-content\/uploads\/sites\/55\/2018\/10\/Captura01.png\" alt=\"\" width=\"597\" height=\"110\" \/><\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-567\" src=\"https:\/\/blogs.ugr.es\/tecweb\/wp-content\/uploads\/sites\/55\/2018\/10\/Captura02.png\" alt=\"\" width=\"495\" height=\"444\" \/><\/p>\n<p>&nbsp;<\/p>\n<ul>\n<li>Es un documento en formato HTML (aunque tambi\u00e9n los hay como formatos gr\u00e1ficos, algo poco recomendable por evidentes cuestiones de indizaci\u00f3n) que tiene el mismo aspecto y respeta las convenciones tipogr\u00e1ficas, de color, de estilo\u2026 del sitio web donde se encuentra enmarcado.<\/li>\n<li>Que es indizable por los buscadores, por lo que habr\u00e1 que considerarlo como un elemento clave en el posicionamiento del sitio.<\/li>\n<li>No suelen tener un tama\u00f1o determinado. Generalmente vendr\u00e1 condicionado por la estructura de la organizaci\u00f3n del contenido del sitio web y, en funci\u00f3n de la cantidad de secciones, subsecciones, enlaces\u2026 que tenga el sitio, el mapa ser\u00e1 m\u00e1s o menos grande. Al igual que el resto de p\u00e1ginas de cualquier web, se debe considerar la posibilidad de no obligar a los usuarios a tener que hacer demasiado scroll, por lo que lo recomendable es que no tenga un tama\u00f1o excesivo. Por otra parte, si la informaci\u00f3n que muestran est\u00e1 poco estructurada, tampoco ser\u00e1n de utilidad. Existen determinadas convenciones como, por ejemplo, usar las tabulaciones para indicar diferentes niveles de especificidad o los distintos submen\u00fas; agrupar las opciones empleando alguna met\u00e1fora (como formas cuadradas o rectangulares\u2026).<\/li>\n<\/ul>\n<p><a href=\"http:\/\/banana-soft.com\/sites\/default\/files\/542%20GAP.png\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-568 \" src=\"https:\/\/blogs.ugr.es\/tecweb\/wp-content\/uploads\/sites\/55\/2018\/10\/542-GAP-300x272.png\" alt=\"\" width=\"349\" height=\"316\" \/><\/a><\/p>\n<ul>\n<li>Y, por \u00faltimo, no es \u201cobligatorio\u201d. No todos los sitios web son susceptibles de necesitar un mapa del sitio. Tan solo deber\u00edan contar con este mecanismo aquellos sitios que, por tener una estructura muy compleja o grande, sientan que debe ofrecer a sus usuarios otra forma de acceder a la informaci\u00f3n. Hay que tener en cuenta que no todo el mundo colocar\u00eda las secciones y subsecciones en el mismo sitio, ya que no todo el mundo posee la misma organizaci\u00f3n conceptual. Un mapa del sitio ofrece una visi\u00f3n global del sitio web de un simple vistazo, lo que facilita la ubicaci\u00f3n del elemento que se est\u00e1 buscando, en ocasiones, de manera m\u00e1s sencilla que cualquier m\u00e9todo de consulta. Por otro lado, favorece la <a href=\"https:\/\/es.wiktionary.org\/wiki\/serendipidad\" target=\"_blank\" rel=\"noopener\">serendipidad<\/a>, algo muy favorable en la navegaci\u00f3n que se realiza sobre sitios que se consultan por primera vez.<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<p>Sitemap.xml es un fichero en formato <a href=\"https:\/\/www.w3.org\/XML\/\" target=\"_blank\" rel=\"noopener\">XML<\/a> que se suele encontrar en el directorio ra\u00edz de cualquier servidor. Y digo <em>suele<\/em> porque no es obligatorio que est\u00e9 all\u00ed, ya que puede cumplir su funci\u00f3n perfectamente desde cualquier otro sitio del servidor, aunque s\u00ed es muy recomendable. El hecho de que est\u00e9 realizado en un formato como XML nos puede indicar otra caracter\u00edstica: no est\u00e1 pensado para que lo visualicen las personas, sino que ser\u00e1n los motores de b\u00fasqueda los que hagan uso de \u00e9l.<\/p>\n<p>El objetivo que cumple este fichero es el de informar a los motores de b\u00fasqueda de la ruta que se debe seguir para obtener todos los documentos que hay en un sitio web. De esa manera, el rastreador que indexe ese contenido tendr\u00e1 un control mayor sobre qu\u00e9 documentos ha procesado y cu\u00e1les no. Por lo tanto, lo que incluye es un listado de las URLs de las p\u00e1ginas que conforman el sitio web, junto a informaci\u00f3n adicional.<\/p>\n<p>En condiciones normales, si las p\u00e1ginas del sitio web est\u00e1n bien enlazadas, se cuenta con un mecanismo de navegaci\u00f3n bien estructurado y la informaci\u00f3n est\u00e1 bien organizada, no deber\u00eda ser necesario contar con este fichero. Sin embargo, est\u00e1 demostrado que el fichero sitemap.xml ayuda al rastreador a hacer su trabajo de manera m\u00e1s precisa, lo que repercute en un mejor tratamiento del sitio web por parte del buscador, as\u00ed como un buen posicionamiento.<\/p>\n<p>Evidentemente, si el sitio es muy grande (en cuanto a n\u00famero de p\u00e1ginas), lo ideal es contar con esta herramienta. En este tipo de sitios tambi\u00e9n suele ser com\u00fan que existan p\u00e1ginas que tengan contenido pero que, por cualquier motivo, se han quedado aisladas del resto, al no contar con un enlace que las conecte con las dem\u00e1s, o estar este mal hecho.<\/p>\n<p>&nbsp;<\/p>\n<h2><strong>El protocolo sitemap<\/strong><\/h2>\n<p>La idea de contar con una herramienta que facilitase el trabajo de los webcrawlers fue desarrollada por Google en <a href=\"https:\/\/googleblog.blogspot.com.es\/2005\/06\/webmaster-friendly.html\" target=\"_blank\" rel=\"noopener\">junio de 2005<\/a>, a partir de las teor\u00edas plasmadas en un <a href=\"http:\/\/dl.acm.org\/citation.cfm?doid=362883.362894\" target=\"_blank\" rel=\"noopener\">art\u00edculo<\/a> publicado la revista del grupo <a href=\"http:\/\/www.sigmetrics.org\/\" target=\"_blank\" rel=\"noopener\">Sigmetrics<\/a> en 2000. Un a\u00f1o m\u00e1s tarde se public\u00f3 la versi\u00f3n 0.90 del <a href=\"https:\/\/www.sitemaps.org\/es\/protocol.html\" target=\"_blank\" rel=\"noopener\">protocolo sitemap.xml<\/a> que especificaba la sintaxis que deb\u00edan tener tales ficheros. En la actualidad es un est\u00e1ndar de facto y es empleado por la mayor\u00eda de servicios de b\u00fasqueda de la Web. Las caracter\u00edsticas de este protocolo especifican, entre otras cosas, lo siguiente:<\/p>\n<ul>\n<li>El hecho de contar con este fichero no garantiza que los buscadores indexen todas las p\u00e1ginas que aparezcan en \u00e9l, pero facilita el trabajo de los rastreadores y, por lo tanto, la posibilidad de que todo el sitio web est\u00e9 indizado es mayor.<\/li>\n<li>Las direcciones que conforman ese fichero deben pertenecer al mismo dominio y al mismo protocolo. Esto significa que no se pueden incluir subdominios (desde el punto de vista SEO un subdominio es un sitio web distinto, por lo que no tendr\u00eda ning\u00fan sentido listar las direcciones de otro dominio en el que estoy publicando).El hecho de que cada sitemap.xml se asocie a un protocolo determinado obliga a que si un mismo sitio web trabaja con http y con https, sea obligatorio que cuente con dos sitemap.xml diferentes.<\/li>\n<li>El tama\u00f1o m\u00e1ximo del fichero ser\u00e1 de 10 megas, con un n\u00famero m\u00e1ximo de URLs de 50.000. En el caso de que fuese necesario, es posible usar m\u00e1s de un fichero sitemap.xml, pero siempre teniendo en cuenta que esos ficheros deben estar almacenados en el mismo sitio. Si se ha decidido crear un directorio para almacenar esta informaci\u00f3n, todos los ficheros sitemap.xml deber\u00e1n almacenarse ah\u00ed. Y se ha decidido crear m\u00e1s de un fichero sitemap.xml ser\u00e1 obligatorio crear un fichero \u00edndice que especifique c\u00f3mo se llaman y d\u00f3nde se encuentran los dem\u00e1s como, por ejemplo, <a href=\"http:\/\/tecnologiasweb.jsenso.es\/sitemap_index.xml\" target=\"_blank\" rel=\"noopener\">sucede en este sitio<\/a>.<\/li>\n<li>Es posible comprimir, en formato <a href=\"https:\/\/es.wikipedia.org\/wiki\/Gzip\" target=\"_blank\" rel=\"noopener\">GZIP<\/a>, el fichero. Reduciendo as\u00ed su tama\u00f1o y haci\u00e9ndolo m\u00e1s manejable.<\/li>\n<li>El fichero sitemap.xml se tiene que codificar en UTF-8. Si fuese necesario emplear valores para los datos, se deben emplear los <a href=\"http:\/\/ascii.cl\/es\/codigos-html.htm\" target=\"_blank\" rel=\"noopener\">c\u00f3digos de escape para los caracteres especiales del HTML<\/a>.<\/li>\n<li>Las etiquetas b\u00e1sicas son:\n<ul>\n<li>&lt;urlset&gt;&lt;\/urlset&gt; para el elemento ra\u00edz del fichero xml<\/li>\n<li>&lt;url&gt;&lt;\/url&gt; para cada entrada<\/li>\n<li>&lt;loc&gt;&lt;\/loc&gt; para introducir la url completa de la p\u00e1gina referenciada. Debe especificar el protocolo (http o https). Tiene un tama\u00f1o m\u00e1ximo de 2048 caracteres.<\/li>\n<\/ul>\n<\/li>\n<li>Las etiquetas opcionales, que se introducen despu\u00e9s de cada &lt;loc&gt; son:\n<ul>\n<li>&lt;lastmod&gt;&lt;\/lastmod&gt; con la fecha de la \u00faltima modificaci\u00f3n de esa p\u00e1gina, en formato AAAA-MM-DD<\/li>\n<li>&lt;changefrec&gt;&lt;\/changefrec&gt; que indica la frecuencia de cambios que sufre una p\u00e1gina determinada. Es un elemento muy importante, ya que indica al rastreador la frecuencia con la que deber\u00eda volver para indizar esa p\u00e1gina de nuevo, ya que su contenido ha cambiado desde la \u00faltima vez que lo proces\u00f3. Los valores van desde always (siempre) a rangos peri\u00f3dicos como weeky, monthly, yearly o never.<\/li>\n<li>&lt;priority&gt;&lt;\/priority&gt; indica la importancia que tiene una p\u00e1gina con respecto al resto del sitio web. Sirve para indicar el peso relativo de una p\u00e1gina concreta dentro del sitio. Puede tener valores entre 0 y 1. Lo habitual es que la p\u00e1gina principal sea 1 y, a partir de ah\u00ed, se van estableciendo diferentes escalas de valor, teniendo en cuenta que 0.5 es el valor por defecto. Un error muy com\u00fan es poner la misma prioridad a todas las p\u00e1ginas. Si se hace eso se puede conseguir el efecto contrario: que todas las se consideren igual de importantes y, por lo tanto, desaparece el posible efecto que tenga la ponderaci\u00f3n que se hace de las p\u00e1ginas.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>Teniendo en cuenta todo esto, un posible ejemplo de fichero sitemap.xml podr\u00eda ser:<\/p>\n<pre><code>&lt;?xml version=\"1.0\" encoding=\"UTF-8\"?&gt;\n\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 &lt;urlset xmlns=\"http:\/\/www.sitemaps.org\/schemas\/sitemap\/0.9\"&gt;\n\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 &lt;url&gt;\n\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 &lt;loc&gt;http:\/\/www.ejemplo.es\/&lt;\/loc&gt;\n\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 &lt;lastmod&gt;2017-03-15&lt;\/lastmod&gt;\n\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 &lt;changefrec&gt;weekly&lt;\/changefrec&gt;\n\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 &lt;priority&gt;1&lt;\/priority&gt;\n\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 &lt;\/url&gt;\n\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 &lt;url&gt;\n\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 &lt;loc&gt;http:\/\/www.ejemplo.es\/saludo.html&lt;\/loc&gt;\n\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 &lt;lastmod&gt;2017-03-15&lt;\/lastmod&gt;\n\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 &lt;changefrec&gt;yearly&lt;\/changefrec&gt;\n\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 &lt;priority&gt;0.5&lt;\/priority&gt;\n\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 &lt;\/url&gt;\n&lt;\/urlset&gt;<\/code><\/pre>\n<p>Que es el de un sitio web ubicado en http:\/\/www.ejemplo.es y que cuenta con dos p\u00e1ginas; la primera de ellas, con una prioridad de 1, modificada el 15 de marzo y una frecuencia de actualizaci\u00f3n semanal; y la segunda realizada el mismo d\u00eda, con una actualizaci\u00f3n anual y con un peso de 0.5.<\/p>\n<p>&nbsp;<\/p>\n<h2><strong>Creaci\u00f3n del fichero<\/strong><\/h2>\n<p>Al contrario de lo que pudiera desprenderse de lo escrito hasta ahora, la creaci\u00f3n de este fichero no es especialmente complicada aunque, eso s\u00ed, hay que ser muy minucioso si se pretende hacer de forma manual. Lo cierto es que en la mayor\u00eda de sitios web la creaci\u00f3n (y alimentaci\u00f3n diaria) de este fichero se realiza de forma autom\u00e1tica.<\/p>\n<p>Para ello se suelen emplear dos procedimientos:<\/p>\n<ul>\n<li>Uso de plantillas. Hay multitud de aplicaciones en la web que, de forma gratuita, generan el fichero sitemap.xml de cualquier sitio web. Eso s\u00ed, unos los hace de forma m\u00e1s concienzuda (con m\u00e1s etiquetas optativas) y otros de manera m\u00e1s simple. En cualquier caso, emplear este m\u00e9todo tiene un problema: y es que obligan a tener que genera el fichero sitemap.xml de nuevo cada vez que se introduce nuevo contenido en el sitio web o se actualiza el ya existente. Dentro de esta modalidad podemos encontrar <a href=\"https:\/\/www.check-domains.com\/sitemap\/\" target=\"_blank\" rel=\"noopener\">xml sitemap generator<\/a>, <a href=\"https:\/\/www.xml-sitemaps.com\/\" target=\"_blank\" rel=\"noopener\">XML-Sitemaps.com<\/a>, <a href=\"https:\/\/xmlsitemapgenerator.org\/\" target=\"_blank\" rel=\"noopener\">Xml Sitemap Generator<\/a> (con versi\u00f3n tanto online como cliente), <a href=\"http:\/\/www.web-site-map.com\/\" target=\"_blank\" rel=\"noopener\">Online XML Sitemap Generator<\/a> o <a href=\"http:\/\/smallseotools.com\/xml-sitemap-generator\/\" target=\"_blank\" rel=\"noopener\">Sitemap Generator<\/a> de Small Seo Tools.<\/li>\n<li>Si se est\u00e1 trabajando con un CMS lo habitual es contar con un m\u00f3dulo\/plugin que se encargue tanto de la creaci\u00f3n como de la constante actualizaci\u00f3n del sitemap.xml conforme se va creando\/modificando contenido en el sitio. Los hay para <a href=\"https:\/\/es.wordpress.org\/plugins\/google-sitemap-generator\/\" target=\"_blank\" rel=\"noopener\">WordPress<\/a>, <a href=\"https:\/\/www.drupal.org\/project\/xmlsitemap\" target=\"_blank\" rel=\"noopener\">Drupal<\/a>, <a href=\"https:\/\/extensions.joomla.org\/category\/structure-a-navigation\/site-map\/\" target=\"_blank\" rel=\"noopener\">Joomla<\/a>, etc.<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h2><strong>Tipos de fichero<\/strong><\/h2>\n<p>Dado que el contenido de un sitio web puede no s\u00f3lo ser textual, es l\u00f3gico que el fichero sitemap.xml incluya tambi\u00e9n informaci\u00f3n sobre las diversas variantes en las que planteamos trasladar nuestra informaci\u00f3n. As\u00ed, nos podemos encontrar con:<\/p>\n<ul>\n<li>Sitemaps de imagen. De esta manera es m\u00e1s sencillo informar al motor de b\u00fasqueda de c\u00f3mo queremos que indexe las im\u00e1genes del sitio web, pudiendo especificar t\u00edtulos, localizaci\u00f3n geogr\u00e1fica de las fotos, licencia de uso etc. Para una mejor configuraci\u00f3n de estas opciones, lo ideal es revisar las <a href=\"https:\/\/support.google.com\/webmasters\/answer\/178636\" target=\"_blank\" rel=\"noopener\">recomendaciones<\/a> que sobre esto hace Google. Por cierto, que resulta muy curioso observar c\u00f3mo Google propone el uso de etiquetas (&lt;image&gt;, &lt;image:loc&gt;, &lt;image:caption&gt;, &lt;image:license&gt;\u2026) que no est\u00e1n aprobadas por el protocolo que ellos auspiciaron.<\/li>\n<li>Sitemaps de v\u00eddeos. Proporciona informaci\u00f3n sobre la localizaci\u00f3n de un video del sitio, indicando el t\u00edtulo, un resumen, la plataforma en la que se encuentra disponible (youtube, vimeo\u2026) y la duraci\u00f3n. <a href=\"https:\/\/www.youtube.com\/watch?v=dJT1jN2BtZk\" target=\"_blank\" rel=\"noopener\">En este v\u00eddeo<\/a>, Google Webmaster te explica muy bien c\u00f3mo trabajar con las etiquetas espec\u00edficas.<\/li>\n<li>Sitemaps de noticias. Para configurar cada art\u00edculo por g\u00e9nero, t\u00edtulo, autor\u2026 Aqu\u00ed explican <a href=\"https:\/\/support.google.com\/news\/publisher\/answer\/74288?hl=es\" target=\"_blank\" rel=\"noopener\">c\u00f3mo configurarlo<\/a>.<\/li>\n<\/ul>\n<p>Por otra parte, hay que mencionar que este tipo de ficheros se pueden realizar con m\u00faltiples formatos. En la <a href=\"https:\/\/www.microsystools.com\/products\/sitemap-generator\/help\/website-sitemap-kinds-comparison\/\" target=\"_blank\" rel=\"noopener\">entrada de MicroSys<\/a> analizan, de forma sencilla y clara, c\u00f3mo se construye un sitemap con HTML, txt, ROR o RSS.<\/p>\n<p>&nbsp;<\/p>\n<h2><strong>Enviar el sitemap al buscador<\/strong><\/h2>\n<p>Una vez que est\u00e1 creado el fichero, y almacenado en el lugar correspondiente del servidor, lo ideal es validar que es correcto. Para ello se pueden emplear un cualquiera de las herramientas recomendadas por el Consorcio: <a href=\"https:\/\/www.w3.org\/XML\/Schema#Tools\" target=\"_blank\" rel=\"noopener\">W3c Schema Tools<\/a>. Aunque, si hemos optado por la generaci\u00f3n autom\u00e1tica del fichero, no suele hacer falta, ya que suelen crearse de manera s\u00f3lida (por no hablar de que la mayor\u00eda de aplicaciones que crean sitemap.xml tambi\u00e9n tienen un parser incluido que lo valida antes de su publicaci\u00f3n).<\/p>\n<p>Lo siguiente es decirle al buscador que nuestro sitio web tiene un fichero sitemap.xml y d\u00f3nde est\u00e1. Para ello se pueden emplear tres opciones:<\/p>\n<ul>\n<li>Empleando cualquiera de las herramientas para webmaster que, de manera gratuita, ofrecen la mayor\u00eda de motores de b\u00fasqueda, como <a href=\"https:\/\/www.google.com\/webmasters\/#?modal_active=none\" target=\"_blank\" rel=\"noopener\">Google Webmaster<\/a> o <a href=\"http:\/\/www.bing.com\/toolbox\/webmaster\" target=\"_blank\" rel=\"noopener\">Bing Webmaster tools<\/a>.<\/li>\n<li>Introducir, al final del archivo robots.txt la orden: sitemap: http:\/\/www.ejemplo.es\/sitemap.xml<\/li>\n<li>Hacer un ping, es decir informar directamente al navegador d\u00f3nde se encuentra ese fichero. Para eso, en funci\u00f3n del buscador la URL var\u00eda:\n<ul>\n<li><em>http:\/\/www.google.com\/webmasters\/tools\/ping?sitemap=http:\/\/www.ejemplo.es\/sitemap.xml<\/em><\/li>\n<li><em>http:\/\/www.bing.com\/webmaster\/ping.aspx?sitemap= http:\/\/www.ejemplo.es\/sitemap.xml<\/em><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-<\/p>\n<div><a href=\"#_ednref1\" name=\"_edn1\">[i]<\/a> Buscando sitios institucionales para ejemplos de mapas de sitio me he dado cuenta de que la mayor\u00eda de webs de los Ministerios espa\u00f1oles ha dado un giro al dise\u00f1o, y se sit\u00faan a lo que se hac\u00eda hace 10 a\u00f1os. Son feos, muy poco agraciados desde el punto de vista del dise\u00f1o, y con una organizaci\u00f3n de la informaci\u00f3n que brilla por su ausencia.<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Contin\u00fao con la trilog\u00eda sobre los ficheros clave en cualquier servidor web. Si en anteriores entradas hablaba de .htaccess, ahora me centrar\u00e9 en sitemap.xml. Antes de nada, creo que es necesario establecer una distinci\u00f3n terminol\u00f3gica. La mayor\u00eda de mis alumnos suele confundir sitemap.xml con el mapa del sitio. Es una confusi\u00f3n bastante razonable. Ambos significan [&hellip;]<\/p>\n","protected":false},"author":65,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_genesis_hide_title":false,"_genesis_hide_breadcrumbs":false,"_genesis_hide_singular_image":false,"_genesis_hide_footer_widgets":false,"_genesis_custom_body_class":"","_genesis_custom_post_class":"","_genesis_layout":"","footnotes":""},"categories":[20,72,11],"tags":[40,60,61,42],"class_list":{"0":"post-357","1":"post","2":"type-post","3":"status-publish","4":"format-standard","6":"category-arquitectura-de-la-informacion-web","7":"category-arquitectura-de-los-sistemas-de-informacion-basados-en-la-web","8":"category-posicionamiento-seo","9":"tag-administrador-del-sitio","10":"tag-posicionamiento","11":"tag-seo","12":"tag-servidores-web","13":"entry"},"_links":{"self":[{"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/posts\/357","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/users\/65"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/comments?post=357"}],"version-history":[{"count":0,"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/posts\/357\/revisions"}],"wp:attachment":[{"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/media?parent=357"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/categories?post=357"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/tags?post=357"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}