Cómo eliminar URL. Parte 1: URL y directorios

Actualmente se puede encontrar una gran cantidad de contenido en Internet [inglés]. En algún momento, puede aparecer algún contenido que preferirías no haber encontrado, desde una polémica entrada de blog hasta información confidencial que se ha publicado de forma accidental. En la mayoría de los casos, cuando se elimina ese contenido o se restringe el acceso al mismo, el contenido deja de aparecer en los resultados de búsqueda de forma natural transcurrido un tiempo. Sin embargo, si necesitas eliminar de forma urgente contenido no deseado que haya indexado Google y que no quieras que desaparezca de forma natural, puedes utilizar la herramienta de solicitud de eliminación de URL para acelerar el proceso de eliminación de contenido de los resultados de búsqueda, siempre que se cumplan una serie de requisitos, que se indican a continuación.

Hemos escrito algunas entradas de blog en las que explicaremos cómo eliminar correctamente diferentes tipos de contenido, además de hablar sobre errores comunes. En esta primera entrada se tratan algunos aspectos básicos como la eliminación de una única URL, la eliminación de un sitio o de un directorio completos y la reinclusión de contenido eliminado. Te recomendamos que consultes una entrada anterior en la que se explica cómo gestionar la información personal disponible online.


Eliminación de una única URL

En general, para que las solicitudes de eliminación se procesen correctamente, el propietario de las URL en cuestión, ya sea el propio usuario u otra persona, debe confirmar que está de acuerdo con la eliminación de ese contenido. En el caso de una URL individual, el propietario puede realizar alguna de las acciones siguientes para eliminar el contenido:
Antes de enviar una solicitud de eliminación, puedes comprobar que la página esté bloqueada correctamente mediante alguno de los métodos siguientes:
  • Archivo robots.txt: para comprobar si la URL está bloqueada correctamente, utiliza las funciones Explorar como Googlebot o Probar robots.txt disponibles en la página de las Herramientas para webmasters de Google.
  • Metaetiqueta "noindex": puedes utilizar la herramienta Explorar como Googlebot para asegurarte de que la metaetiqueta aparezca entre las etiquetas <head> y </head>. Si quieres consultar una página que no puedes verificar a través de las Herramientas para webmasters de Google, puedes abrir la URL en un navegador, acceder a Ver > Código fuente de la página y asegurarte de que la metaetiqueta aparezca entre las etiquetas <head> y</head>.
  • Código de estado 404 ó 410: puedes utilizar la función Explorar como Googlebot o herramientas como Live HTTP Headers [inglés] o web-sniffer.net [inglés] para comprobar si la URL devuelve el código correcto. A veces las páginas "eliminadas" pueden mostrar un código de estado 404 o "Página no encontrada", aunque en realidad aparece un código de estado 200 en el encabezado de la página, por lo que te recomendamos que utilices una herramienta de comprobación de encabezados adecuada.
Si se ha eliminado el contenido no deseado de una página, pero la página no se ha bloqueado de ninguna de las formas indicadas anteriormente, esa URL no se eliminará por completo de los resultados de búsqueda. Esto suele ocurrir cuando el usuario no es el propietario del sitio que aloja el contenido. Analizaremos con más detalle qué se debe hacer en estos casos en próximas entradas.

Si una URL cumple alguno de los requisitos anteriores, puedes eliminarla a través de la página de solicitudes eliminación. Para ello, introduce la URL que desees eliminar y selecciona la opción "El webmaster ya ha bloqueado la página". Ten en cuenta que debes introducir la URL en la que esté alojado el contenido, y no la URL que aparezca en el resultado de búsqueda de Google. Por ejemplo, introduce la URL

http://www.example.com/embarrassing-stuff.html y no
http://www.google.com/search?q=embarrassing+stuff

En este artículo se ofrece más información sobre cómo especificar la URL adecuada. Recuerda que si no indicas la URL exacta que no quieres que aparezca, no podremos eliminar el contenido problemático.


Eliminación de todo un directorio o de todo un sitio

Para que se elimine correctamente todo un sitio o un directorio, el sitio o el directorio en cuestión debe estar bloqueado en el archivo robots.txt del sitio. Por ejemplo, para eliminar el directorio http://www.example.com/secret/, el archivo robots.txt debe incluir la información siguiente:

User-agent: *
Disallow: /secret/

No basta con que el directorio raíz devuelva un código de estado 404, ya que es posible que un directorio muestre este código y que sigan apareciendo los archivos que contiene. El uso del archivo robots.txt para bloquear un directorio (o todo un sitio) garantiza que también se bloqueen todas las URL incluidas en ese directorio (o en ese sitio). Para comprobar si un directorio se ha bloqueado correctamente, utiliza las funciones Explorar como Googlebot o Probar robots.txt disponibles en la página de las Herramientas para webmasters de Google.

Sólo los propietarios verificados de un sitio pueden solicitar la eliminación de un sitio o de un directorio completos en la página de las Herramientas para webmasters de Google. Para solicitar la eliminación de un sitio o de un directorio, haz clic en el sitio en cuestión y, a continuación, accede a Información del sitio > Acceso de rastreadores > Eliminar URL. Si introduces el directorio raíz del sitio como la URL que quieres eliminar, se te pedirá que confirmes si deseas eliminar todo el sitio. Si introduces un subdirectorio, selecciona la opción "Eliminar directorio" en el menú desplegable.


Reinclusión de contenido

Puedes cancelar las solicitudes de eliminación de un sitio en cualquier momento, incluidas las solicitudes enviadas por otros usuarios. Para ello, debes haber demostrado que eres el propietario del sitio en las Herramientas para webmasters de Google. Una vez que hayas hecho esto, accede a Información del sitio > Acceso de rastreadores > Eliminar URL > URL eliminadas (o >Enviadas por otros) y haz clic en el enlace "Cancelar" situado junto a las solicitudes que desees anular.

Si aún tienes preguntas, mantente atento a la publicación del resto de entradas sobre eliminación de contenido de los resultados de búsqueda de Google. Si no puedes esperar, anteriormente ya hemos publicado artículos relacionados. Además, puedes consultar nuestro Foro de ayuda, donde encontrarás información sobre la eliminación de URL y casos individuales. Si sigues teniendo preguntas tras haber consultado las experiencias de otros usuarios, no dudes en ponerte en enviar tus preguntas. Ten en cuenta que, en la mayoría de los casos, resulta difícil ofrecer consejos adecuados sin conocer el sitio o la URL en cuestión. Te recomendamos que compartas la URL a través de un servicio para acortar URL para que la URL problemática no se indexe como parte de tu pregunta. Algunos de estos servicios te permitirán incluso desactivar la URL acortada una vez que se haya resuelto tu problema.

lunes, 19 de abril de 2010

1 comments:

rigel dijo...

tengo un duda.

si necesito elimninar un directorio, lo bloqueo con noindex en el robots.txt y solicito su eliminacion en Herramientas de Webmaster.

Una vez que se me notifique que fue eliminado puedo eliminar el

Noindex /directorio

del rchivo robots.txt?

Saludos..