Vídeos de Matt Cutts: ¿Cuánto tiempo dejar una redirección en un cambio de dominio?

Las redirecciones 301 siempre generan muchas preguntas, así que esta vez desde Dinamarca, jacob le pregunta a Matt Cutts sobre cuánto tiempo se debe dejar una redirección 301 en un cambio de dominio. ¿Estás en el mismo caso que Jacob y no sabes la respuesta? Pues haz clic en el vídeo y escucha las recommendaciones de Matt.



Nota: Os recuerdo que los vídeos tienen subtítulos en español y estos deberían aparecer por defecto.

Transcripción de: ¿Cuánto tiempo dejar una redirección en un cambio de dominio?

La pregunta de hoy es de Jacob, de Dinamarca. Jacob quiere saber: "Si tengo un nuevo dominio y quiero redirigir www.viejodominio.com a www.nuevodominio.com, ¿cuánto tiempo debo mantener el redireccionamiento antes de comenzar a usar el dominio antiguo para otra cosa? ¿Sólo hasta que se haya rastreado una vez?"

Bien. Esto es algo sobre lo cual las políticas de los motores de búsqueda pueden cambiar con el tiempo, puesto que vemos cómo evoluciona la Web, o vemos que los webmasters tienen problemas... y cosas por el estilo. Puedo contaros mi experiencia al trasladarme de mattcutts.com a dullest.com y de dullest.com de nuevo a mattcutts.com. Al volver, utilicé un redireccionamiento 301. Y tardó un periodo de varias semanas porque, recordad: el redireccionamiento 301 tiene lugar a nivel de página. Así que, solo porque aparezca el 301 en una página del dominio antiguo, no significa que todo el dominio se haya trasladado al completo. 

Lo que hice es ejecutar el redireccionamiento de modo que todas y cada una de las páginas se redirigía de dullest.com a mattcutts.com. así que había sido una transición completa. Y realmente no me preocupé de dullest.com durante varias semanas. Tal vez un par de meses. Cuando volví a consultar Google Analytics, en esos momentos todo el tráfico había cambiado de dullest.com a mattcutts.com.

Por consiguiente, en un plazo de unas cuantas semanas, o varias semanas, tal vez alrededor de un par de meses, por ejemplo, podríamos ver que el sitio se ha movido por completo. Pero si recibimos información contradictoria, como que algunas páginas devuelven un código 200, que es un OK, mientras que otras devuelven un redireccionamiento 301 o permanente, entonces no sabemos a ciencia cierta qué significa eso.

Ciertamente, hace poco he visto algunas situaciones en que un sitio dijo: "Me he cambiado de viejodominio.com a nuevodominio.com", pero se olvidaron de añadir un subdominio. Así que se servían 200 desde el subdominio antiguo. Por consiguiente, no se puede asumir que, oh, todo va a funcionar automáticamente y mágicamente, a la perfección.

Tenemos una herramienta en las Herramientas para webmasters de Google donde es posible indicar que un sitio se ha movido de un lugar a otro. Así que es posible hacer eso para los 301 a nivel de cada página. Pero yo no asumiría que basta con que se rastree una sola vez. Realmente, el robot de Google y Google necesitan ganar la confianza suficiente como para saber que, de veras, un sitio se ha movido completamente del lugar viejo al nuevo. En definitiva, puede llevar un poco de tiempo, pero si todo va bien, al cabo de un tiempo todo acaba por ponerse al día

miércoles, 28 de septiembre de 2011

El rastreo de Google Noticias ahora con Googlebot

Google Noticias ha actualizado recientemente su infraestructura para poder rastrear con Googlebot, el user-agent principal de Google. ¿Qué significa esto? En realidad, este cambio apenas afecta a la mayoría de los editores. Cualquier medio de comunicación que quiera dejar de aparecer en Google Noticias, podrá hacerlo. Google Noticias seguirá respetando la entrada del archivo robots.txt para Googlebot-News, nuestro anterior user-agent, si bien esta entrada es más restrictiva que la entrada de robots.txt para Googlebot.

En nuestro Centro de asistencia, se ofrecen directrices detalladas sobre cómo utilizar el protocolo de exclusión de robots para Google Noticias. Además, los editores pueden ponerse en contacto con el equipo de asistencia de Google Noticias [inglés] si tienen preguntas, pero antes vamos a aclarar lo siguiente:
  • Aunque ahora solo verás el user-agent Googlebot en los registros de tu sitio, no debes preocuparte; el hecho de que aparezca Googlebot en lugar de Googlebot-News es independiente de nuestras políticas de inclusión. (Puedes comprobar en cualquier momento si tu sitio está incluido en Google Noticias realizando una búsqueda con el operador "site:". Por ejemplo, introduce "site:tusitiodenoticias.com" en el campo de búsqueda de Google Noticias y, si aparecen resultados, significa que estamos indexando tu sitio de noticias).
  • Tu herramienta analítica seguirá diferenciando el tráfico de los usuarios que llega a tu sitio web desde la Búsqueda de Google y el tráfico que llega desde Google Noticias, por lo que no deberías detectar ningún cambio. La principal diferencia es que ya no volverás a ver las visitas automatizadas que se realicen ocasionalmente a tu sitio desde el rastreador Googlebot-News.
  • Si actualmente sigues nuestras directrices para Googlebot, no será necesario que realices ningún cambio en el código de tu sitio. Los sitios que hayan implementado suscripciones mediante un modelo "medido" o los que hayan implementado First Click Free no experimentarán ningún cambio. En el caso de los sitios que requieran registro, pago o acceso a la cuenta antes de permitir la lectura de un artículo completo, Google Noticias solo podrá rastrear e indexar el título y el fragmento que se muestren a todos los usuarios que visiten la página. Las directrices para webmasters de Google ofrecen información adicional sobre el "encubrimiento o cloaking" (una práctica que consiste en mostrar a un robot una versión diferente de la que ven los usuarios). Para obtener más información sobre Google Noticias y los editores de suscripción, consulta este artículo del Centro de asistencia [inglés].
  • Puedes respirar tranquilo, ya que tu sitemap se seguirá rastreando. Este cambio no afecta a la forma en que rastreamos los sitemaps de noticias. Si eres editor de Google Noticias y todavía no has configurado un sitemap de noticias, haz clic en este enlace si quieres empezar a crearlo.
  • En el caso de los editores que quieran dejar de aparecer en Google Noticias y permanecer en la Búsqueda de Google, solo es necesario bloquear Googlebot-News y permitir el uso de Googlebot. Para obtener más información sobre cómo realizar esta acción, consulta la página del Centro de asistencia.
Al igual que ocurre con cualquier sitio web, es necesario actualizar nuestra infraestructura cada cierto tiempo. Al mismo tiempo, queremos seguir ofreciendo todo el control posible a los sitios web de noticias. Esperamos haber respondido a todas las preguntas que te hayan podido surgir con relación a esta actualización. Si tienes preguntas adicionales, consulta la página del Centro de asistencia [inglés].

(También publicado en el Blog de Google Noticias [inglés])

Publicado por David Smydra, especialista en productos de Google Noticias

martes, 27 de septiembre de 2011

Archivos PDF en los resultados de búsqueda de Google

Nuestra misión consiste en organizar la información del mundo y hacer que resulte útil y accesible para todos los usuarios. En esta ambiciosa tarea, a veces nos encontramos con archivos que no son HTML, como archivos PDF, hojas de cálculo y presentaciones. Nuestros algoritmos no se detienen ante formatos de archivo diferentes; trabajamos duro para extraer el contenido relevante e indexarlo de forma adecuada para poder incluirlo en los resultados de búsqueda. Pero, si estos formatos de archivo suelen diferenciarse tanto de los archivos HTML estándar, ¿cómo indexamos realmente estos archivos y qué directrices aplicamos? ¿Y si un webmaster no quiere que los indexemos?


Google empezó a indexar archivos PDF en 2001 [inglés] y actualmente cuenta con cientos de millones de archivos PDF indexados. Hemos recopilado las preguntas más frecuentes sobre la indexación de archivos PDF y estas son las respuestas:

P: ¿Google puede indexar cualquier tipo de archivo PDF? 
R: Normalmente, podemos indexar contenido textual (escrito en cualquier idioma) de los archivos PDF que utilizan diferentes tipos de codificación de caracteres, siempre que no estén cifrados ni protegidos por contraseña. Si el texto está insertado en forma de imágenes, podemos procesar las imágenes con algoritmos OCR [inglés] para extraer el texto. La norma general es que si se puede copiar el texto de un documento PDF y pegarlo en un documento de texto estándar, deberíamos ser capaces de indexarlo.

P: ¿Qué ocurre con las imágenes de los archivos PDF? 
R: Actualmente, las imágenes no se indexan. Para que podamos indexarlas, deberías crear páginas HTML para las imágenes. Para aumentar las probabilidades de que podamos incluir tus imágenes en los resultados de búsqueda, consulta las sugerencias que te ofrecemos en el Centro de asistencia.

P: ¿Cómo se tratan los enlaces incluidos en los documentos PDF? 
R: Normalmente, los enlaces incluidos en los documentos PDF se tratan de forma similar a los enlaces que encontramos en los archivos HTML: pueden entrar en la clasificación de PageRank y otras señales de indexación, y podemos seguirlos después de haber rastreado el archivo PDF. Actualmente, no es posible utilizar el atributo "nofollow" en los enlaces de un documento PDF.

P: ¿Cómo puedo evitar que mis archivos PDF aparezcan en los resultados de búsqueda? Y, si ya aparecen, ¿cómo puedo eliminarlos? 
R: La forma más sencilla de evitar que los documentos PDF aparezcan en los resultados de búsqueda es añadir una etiqueta X-Robots "noindex" en la cabecera HTTP utilizada para mostrar el archivo. Si ya se han indexado, dejarán de aparecer con el tiempo si utilizas la etiqueta X-Robots con la directiva "noindex". Para acelerar la eliminación, puedes utilizar la herramienta de solicitud de eliminación de URL de las Herramientas para webmasters de Google.

P: ¿Pueden obtener los archivos PDF una buena clasificación en los resultados de búsqueda? 
R: Por supuesto. Por lo general, estos archivos se clasifican de forma similar a otras páginas web. Por ejemplo, en el momento de esta publicación, [mortgage market review], [irs form 2011] o [paracetamol expert report] devuelven documentos PDF que obtienen una buena posición en los resultados de búsqueda gracias a su contenido y a la forma en la que están insertados y vinculados desde otras páginas web.

P: ¿Se considera contenido duplicado si tengo una copia de mis páginas en formato HTML y PDF? 
R: Siempre que sea posible, te recomendamos que muestres una única copia de tu contenido. Si no es posible, asegúrate de indicar cuál es tu versión preferida. Para ello, puedes incluir la URL que prefieras en tu sitemap o especificar la versión canónica en el archivo HTML o en las cabeceras HTTP del PDF. Para obtener más sugerencias, consulta el artículo del Centro de asistencia sobre canonicalización.

P: ¿Cómo puedo influir en el título que aparece en los resultados de búsqueda de mi documento PDF? 
R: Utilizamos dos elementos principales para determinar el título que mostramos: los metadatos del título que contiene el archivo y el texto de anclaje de los enlaces que dirigen al archivo PDF. Para que nuestros algoritmos capten claramente el título que deben utilizar, te recomendamos que actualices ambos elementos.

Si quieres obtener más información, ve el vídeo de Matt Cutts sobre optimización de archivos PDF para búsquedas y visita la página del Centro de asistencia para obtener información relacionada con los tipos de contenido que podemos indexar.


Si tienes comentarios o sugerencias, comunícanoslo a través del Foro de ayuda para webmasters.

Publicado por Gary Illyes, Webmaster Trends Analyst

sábado, 24 de septiembre de 2011

Reorganización de enlaces de retroceso (backlinks) internos y externos

Hoy queremos hablarles de los cambios que se han producido en la forma en la que categorizamos los datos de enlaces en las Herramientas para webmasters de Google. Como ya sabéis, las Herramientas para webmasters de Google incluyen enlaces dirigidos a tu sitio web en dos categorías diferentes: enlaces procedentes de otros sitios y enlaces procedentes de tu sitio. Esta actualización no cambiará tu número total de enlaces, pero intentaremos que tus enlaces de retroceso (backlinks) se muestren de una forma que se ajuste mejor a tu idea de qué enlaces proceden realmente de tu sitio y cuáles proceden de otros sitios.

Puedes administrar muchos tipos de sitios diferentes en las Herramientas para webmasters de Google: un simple nombre de dominio (example.com), un subdominio (www.example.com o gatos.example.com) o un dominio con la ruta de una subcarpeta (www.example.com/gatos/ www.example.com/usuarios/amantegatos/). Anteriormente, solo los enlaces que empezaban por la URL exacta de tu sitio se categorizaban como enlaces internos: de esta forma, si especificabas www.example.com/usuarios/amantegatos/ como tu sitio, los enlaces procedentes de www.example.com/usuarios/amantegatos/perfil.html se categorizaban como internos, mientras que los enlaces procedentes de www.example.com/usuarios/ o www.example.com se categorizaban como externos. Esto también implicaba que si especificabas www.example.com como tu sitio, los enlaces procedentes de example.com se consideraban externos porque no empezaban por la misma URL que tu sitio (ya que no incluían el prefijo "www").

Hoy en día, la mayoría de la gente piensa que example.com y www.example.com son el mismo sitio, por lo que estamos cambiando eso ahora. Si añades example.com www.example.com como sitio, tanto los enlaces procedentes de la versión con el prefijo "www" como los de la versión sin "www" del dominio se categorizarán como enlaces internos. También estamos ampliando esta idea para incluir otros subdominios, ya que muchos de los propietarios de un dominio también poseen sus subdominios, por lo que los enlaces procedentes de gatos.example.com o mascotas.example.com también se categorizarán como enlaces internos de www.example.com.


Enlaces for www.google.comEnlaces externosEnlaces internos
Anteriormente categorizados como...www.example.com/
www.example.org/stuff.html
scholar.google.com/
sketchup.google.com/
google.com/
www.google.com/
www.google.com/stuff.html
www.google.com/support/webmasters/
Ahora categorizados como...www.example.com/
www.example.org/stuff.html
scholar.google.com/
sketchup.google.com/
google.com/
www.google.com/
www.google.com/stuff.html
www.google.com/support/webmasters/

Del mismo modo, si eres el propietario de un sitio incluido en un subdominio (como googlewebmaster-es.blogspot.com/) o en una subcarpeta (como www.google.com/support/webmasters/) y no posees el dominio raíz, seguirás viendo en tus enlaces internos únicamente los enlaces de las URL que empiecen por ese subdominio o esa subcarpeta, mientras que el resto se categorizará como enlaces externos. Hemos realizado algunos cambios en el servidor para que estos números sean más precisos.

Debes tener en cuenta que, si eres el propietario de un dominio raíz, como example.com o www.example.com, puede parecer que el número de enlaces externos disminuye con este cambio; esto se debe a que, como explicamos anteriormente, algunas de las URL clasificadas anteriormente como enlaces externos se incluirán ahora en el informe de enlaces internos. El número total de enlaces (internos y externos) no debería verse afectado por este cambio. Como siempre, déjanos un comentario o participa en el Foro de ayuda para webmasters si tienes alguna pregunta.

Publicado por , Webmaster Trends Analyst

viernes, 23 de septiembre de 2011

Mejoras recientes del botón +1

Es posible que, durante los últimos meses, hayas utilizado el botón +1 para ayudar a los usuarios a recomendar el contenido de tu sitio en la búsqueda de Google y en sus perfiles de Google. Acabamos de presentar algunos cambios [inglés] que convierten el botón +1 en una herramienta aún más útil.

En primer lugar, ahora el botón +1 permite a los visitantes compartir enlaces a tus páginas de Google+. Si un usuario quiere comenzar una conversación sobre tu contenido, le resultará muy fácil hacerlo. En segundo lugar, puedes utilizar +Snippets para personalizar el nombre, la imagen y la descripción que aparece al compartir tu contenido. Por último, las nuevas anotaciones entre líneas permiten aumentar la participación cuando los usuarios observan la recomendación de un amigo en tu página.

A continuación, te ofrecemos algunos consejos que te ayudarán a aprovechar al máximo estas mejoras:

+Snippets
El botón +1 ofrece a tu sitio una nueva y valiosa fuente de tráfico al compartirlo en Google+. +Snippets te permite personalizar las opciones que aparecen al compartir tu contenido para ofrecer lo mejor de tu sitio.

Por ejemplo, si tienes un sitio de críticas de películas, puede que quieras que los visitantes compartan entradas con el título, el cartel y una breve sinopsis de la película:


Es posible que ya hayas utilizado este marcado para crear anotaciones completas para tus páginas en la búsqueda de Google. En caso contrario, te resultará fácil marcar tus páginas. Solo tienes que añadir los atributos schema.org [inglés] correctos a los datos que ya se encuentren en tus páginas. En el código, debes establecer un nombre, una imagen y una descripción:

<body itemscope itemtype="http://schema.org/Article">
<h1 itemprop="name">Este es el nombre del artículo.</h1>
<img itemprop="image" src="thumbnail.jpg" />
<p itemprop="description">
Esta es la descripción del artículo.</p>
</body>
 
Código de ejemplo con los atributos de +Snippet

Para obtener más información sobre otros tipos de marcado, consulta nuestra documentación técnica [inglés].

Anotaciones entre líneas
Ahora, cuando un usuario accede a una página que otro usuario que conoce ha marcado con el botón +1, puede ver el nombre y la cara recordándole que debe prestar especial atención a tu contenido. A continuación, se muestra su aspecto:

Las anotaciones entre líneas permiten a los usuarios consultar los amigos que han marcado tu contenido con el botón +1.

Para añadir anotaciones entre líneas, debes actualizar el código del botón +1. Consulta la herramienta de configuración, selecciona la anotación entre líneas en el menú de anotación y establece un nuevo fragmento de código.

Los sitios compartidos mediante el botón +1 y las anotaciones entre líneas se implementarán completamente durante los próximos días. Para probar estas mejoras ahora mismo, únete a nuestro grupo de la plataforma Preview. Si quieres compartir tus opiniones o tus comentarios, continúa la conversación en Google+

Publicado por Daniel Dulitz, Product Manager de Google Groups

jueves, 22 de septiembre de 2011

Mejoras en los enlaces de sitio

Muchos habréis notado ya la última actualización de los enlaces de sitio que se lanzó a mediados del mes pasado con el fin de mejorar la organización y la calidad de los resultados de las búsquedas. Los enlaces de sitio son dos columnas de enlaces que aparecen debajo de algunos resultados de búsqueda y que ayudan a los usuarios a navegar más fácilmente hacia el interior de un sitio. Esencialmente, los enlaces de sitio siguen siendo iguales: se generan y se clasifican mediante algoritmos basados en la estructura de enlaces del sitio, y solamente aparecen cuando son útiles para una búsqueda en particular.
Los enlaces de sitio antes de la última actualización 

Con este lanzamiento se han introducido las siguientes mejoras en los enlaces de sitio:
  • Visibilidad. El tamaño de los enlaces se ha ampliado hasta el del texto normal y se ha añadido una URL verde y un fragmento de texto de una línea, de forma muy parecida a los resultados normales de las búsquedas. Esto aumenta la prominencia tanto de los enlaces de sitio individuales como del sitio web principal en general, facilitando así su localización.
  • Flexibilidad. Hasta ahora, cada sitio tenía una lista fija de enlaces de sitio que podía aparecer o no por completo. No se hacía ninguna clasificación de los enlaces en función de la consulta en particular. Con el lanzamiento de hoy, la selección y clasificación de los enlaces de sitio puede variar de una consulta a otra, lo cual permite obtener mejores resultados. Además, el número máximo de enlaces de sitio que pueden aparecer en un sitio ha aumentado de ocho a 12, y el número que se muestra también depende de la consulta.
  • Claridad. Anteriormente, las páginas de un sitio podían aparecer en los enlaces de sitio, en los resultados de las búsquedas, o en ambos lugares. Ahora la distinción entre el dominio principal y otros dominios es un poco más clara. Si el resultado principal tiene enlaces de sitio, entonces el resto de resultados por debajo de ellos será de otros dominios. La excepción a esta regla es que el resultado de nivel principal de una consulta sea una subparte de un dominio. Por ejemplo, la consulta [the met exhibitions] da www.metmuseum.org/special/ como resultado principal y sus enlaces de sitio pertenecen todos a la sección www.metmuseum.org/special del sitio. No obstante, los resultados restantes pueden proceder de otras partes del dominio metmuseum.org, como store.metmuseum.org o blog.metmuseum.org/alexandermcqueen/about.
  • Calidad. Estos cambios visibles para el usuario van acompañados de mejoras en la calidad realizadas entre bastidores. La mejora principal es que hemos combinado los indicadores que usamos para la generación y clasificación de los enlaces de sitio (como la estructura de enlaces del sitio) con nuestro sistema más tradicional de clasificación, para obtener un algoritmo mejor y unificado. Desde el punto de vista de la clasificación ha dejado de existir toda separación real entre resultados "normales" y enlaces de sitio.
Los enlaces de sitio a partir de los cambios introducidos

Estos cambios también se reflejan en las Herramientas para webmasters de Google, desde donde es posible gestionar los enlaces de sitio que aparecen de un sitio. Ahora es posible sugerir la degradación de un enlace de sitio si resulta inadecuado o incorrecto. Los algoritmos tendrán en cuenta esas sugerencias a la hora de clasificar los enlaces (aunque no se puede garantizar su eliminación). Puesto que los enlaces de sitio pueden variar con el tiempo y en función de las consultas realizadas, ha dejado de tener sentido seleccionarlos de una lista de enlaces. Ahora se puede sugerir la degradación de cualquier URL de cualquier página de nivel superior. Para cada sitio se permite sugerir la degradación de hasta 100 elementos. Finalmente, todos los bloques de enlaces de sitio actualmente presentes en las Herramientas para webmasters de Google se convertirán automáticamente al sistema de degradaciones. Para obtener más información sobre este tema se puede consultar el Centro de asistencia de las Herramientas para webmasters de Google.

También merece la pena mencionar algunos elementos que no han cambiado, como los enlaces de sitio de una sola línea, en que los enlaces de sitio pueden aparecer como una sola línea de enlaces en múltiples resultados, y los enlaces de sitio en anuncios [inglés] que tampoco se ven afectados. Las prácticas recomendadas existentes en cuanto se refiere a la estructura de enlaces de un sitio siguen siendo relevantes, tanto para generar enlaces de sitio de buena calidad como para facilitar la labor de los visitantes del sitio. Como siempre, podéis plantear todas vuestras dudas y comentarios en el Foro de ayuda para webmasters.

Publicado por Harvey Jones, Ingeniero de software, y Raj Krishnan, Product Manager, equipo de Enlaces de sitio

Mejoras en el manejo de las URL con parámetros

Es posible que ya hayáis notado que la función Organización de parámetros ha desaparecido de la sección Configuración del sitio > Configuración de las Herramientas para webmasters de Google. Pero no temáis; ahora podéis encontrarla bajo un nuevo nombre: ¡Parámetros de URL! Además de cambiarle el nombre, hemos actualizado y mejorado esta función. Esperamos que la encontréis todavía más útil. La configuración de los parámetros de URL realizada con la versión anterior se verá automáticamente en la versión nueva. Antes de desvelar todas las cosas interesantes que es posible hacer ahora con Parámetros de URL, os recordamos (o presentamos, si no conocíais esta función) el propósito de esta función y cuándo resulta útil emplearla.

Cuándo se utiliza
Parámetros de URL ayuda a controlar qué URL de un sitio deben ser rastreadas por el robot de Google, en función de los parámetros que aparecen en dichas URL. Esta función proporciona un método sencillo para evitar que se rastree contenido de un sitio por duplicado. Ahora es posible rastrear un sitio más eficientemente, reduciendo el uso de ancho de banda y probablemente permitiendo la indexación de más contenido único del sitio. Usar esta función puede ser una buena idea en aquellos casos en que se sospecha que la cobertura de un sitio por parte del robot de Google no es todo lo buena que podría ser. ¡Pero una gran capacidad conlleva una gran responsabilidad! Esta función solo se debe usar cuando se esté seguro del comportamiento de los parámetros de URL del sitio. En caso contrario, se podría impedir, por error, el rastreo de algunas URL, con lo cual el contenido dejaría de estar accesible para el robot de Google.



Mucho por hacer
Muy bien, pues; ahora podemos hablar de las novedades y mejoras. En primer lugar, además de asignar una acción de rastreo a un parámetro individual, ahora se puede describir el comportamiento del parámetro. Para comenzar, se indica si el parámetro sirve para alterar el contenido de la página o no. Si el parámetro no afecta al contenido de la página, entonces ya está todo hecho. El robot Google seleccionará URL con un valor representativo de ese parámetro y rastreará las URL con ese valor. Cualquier valor elegido es válido, ya que el parámetro no altera el contenido. No obstante, si el parámetro sí que cambia el contenido de una página, ahora es posible asignar una de cuatro estrategias de rastreo para que Google la utilice con ese parámetro:
  • Dejar que Googlebot decida,
  • Todas las URL
  • Solo URL con el valor = x
  • Ninguna URL
También hemos añadido la posibilidad de indicar el valor específico que se desea usar, con la opción "Solo URL con el valor = x". Ya no es necesario ceñirse a la lista que proporcionábamos nosotros. Opcionalmente, también es posible indicar qué hace exactamente el parámetro (si ordena, separa en páginas, determina el contenido, etc.). Una última mejora es que, para cada parámetro, intentamos mostrar una muestra de URL de ejemplo del sitio que el robot de Google haya rastreado con ese parámetro en particular.

De las cuatro opciones de la lista anterior, la opción "Ninguna URL" es nueva y merece una atención especial. Esta opción es la más restrictiva y, para una URL en particular, tiene precedencia sobre la configuración de otros parámetros que pueda contener esa URL. Esto significa que si esa URL contiene un parámetro para el cual se ha configurado la opción "Ninguna URL", esa URL no se rastreará nunca, incluso aunque para otros parámetros de URL se haya seleccionado "Todas las URL". Esta opción se debe usar con cuidado. El segundo ajuste más restrictivo es "Solo URL con el valor = x".

Veámoslo en acción
Ahora vamos a hacer algo divertido y ejercitar las neuronas con un ejemplo:
- - -
Había una vez una tienda online, modaencantada.example.com. El sitio web empleaba parámetros de URL y se podía acceder al mismo contenido a través de múltiples URL. Un día, el propietario de la tienda pensó que, con tantas URL redundantes, tal vez el robot de Google no podía rastrear su sitio a fondo. Así que envió a su asistente CuriosoPreguntón a ver al GranMagoWeb para obtener su consejo sobre cómo usar la función Parámetros de URL para reducir el contenido duplicado rastreado por el robot de Google. El GranMagoWeb era famoso por su sabiduría. Echó un vistazo a los parámetros de la URL y de inmediato propuso la siguiente configuración:


Nombre del parámetro¿Influencia en el contenido?¿Qué debería Googlebot rastrear?
trackingIdNingunaUna URL de representación
sortOrderOrdena el contenidoSolo URL con el valor = ‘lowToHigh’
sortByOrdena el contenidoSolo URL con el valor = ‘price’
filterByColorRestringe el contenidoNinguna URL
itemIdEspecifica el contenidoTodas las URL
pagePagina el contenidoTodas las URL

Como era de esperar por su naturaleza, CuriosoPreguntón no pudo evitar empezar a hacer preguntas:

CuriosoPreguntón: le has indicado al robot de Google que elija una URL de representación para trackingId (un valor elegido por el robot de Google). ¿Por qué no seleccionar "Solo URL con el valor = x" y elegir yo mismo el valor?
GranMagoWeb: mientras rastreaba la Web, el robot de Google ha descubierto las URL siguientes enlazando a vuestro sitio:
  1. modaencantada.example.com/faldas/?trackingId=aaa123
  2. modaencantada.example.com/faldas/?trackingId=aaa124
  3. modaencantada.example.com/pantalones/?trackingId=aaa125
Imagínate que tuvieses que indicar al robot de Google que solo rastrease las URL con “trackingId=aaa125”. En ese caso, el robot de Google no rastrearía las URL 1 y 2, porque ninguna de ellas tiene el valor aaa125 para trackingId. Su contenido no se rastrearía ni se indexaría y ninguna de las elegantes faldas para hadas de vuestro inventario aparecería en los resultados de las búsquedas de Google. No. En este caso, elegir una URL de representación es la opción adecuada. ¿Por qué? Porque le indica al robot de Google que, si encuentra dos URL en la Web que solo se diferencien por este parámetro (como pasa con las URL 1 y 2 de arriba), entonces solamente necesita rastrear una de ellas (cualquiera servirá), y con eso bastará para obtener todo el contenido. En el ejemplo de arriba, se rastrearán las dos URL anteriores, ya sean 1 y 3, como 2 y 3. Así no se perderá ninguna falda ni pantalón.

CuriosoPreguntón: ¿Qué hay del parámetro sortOrder? No me importa que los elementos aparezcan en la lista en orden ascendente o descendente. Por qué no dejamos que Google decida un valor representativo?
GranMagoWeb: A medida que el robot de Google rastree podría encontrar las URL siguientes:
  1. modaencantada.example.com/faldas/?pagina=1&sortOrder=price&sortOrder=’lowToHigh’
  2. modaencantada.example.com/faldas/?pagina=1&sortOrder=price&sortOrder=’HighToLow’
  3. modaencantada.example.com/faldas/?pagina=2&sortOrder=price&sortOrder=’lowToHigh’
  4. modaencantada.example.com/faldas/?pagina=2&sortOrder=price&sortOrder=’HighToLow’
Fíjate en cómo el primer par de URL (1 y 2) solo se distinguen por el valor del parámetro sortOrder, tal como sucede con las URL del segundo par (3 y 4). Sin embargo, las URL 1 y 2 generarán contenidos distintos: la primera de ellas mostrará las faldas más baratas y la segunda las más caras. Esto sirve como primer indicio de que usar un único valor representativo no es una buena opción en este caso. Además, si dejas que el robot de Google elija un único valor representativo entre un conjunto de URL que solo difieran en el parámetro sortOrder, podría elegir un valor distinto cada vez. En el ejemplo anterior, del primer par de URL se podría elegir la URL 1 (sortOrder=’lowToHigh’). Mientras que, del segundo par, se podría elegir la URL 4 (sortOrder=’HighToLow’). En tal caso, el robot de Google rastrearía solo las faldas más económicas (dos veces):
  • modaencantada.example.com/faldas/?pagina=1&sortBy=price&sortOrder=’lowToHigh’
  • modaencantada.example.com/faldas/?pagina=2&sortBy=price&sortOrder=’HighToLow’
Las faldas más caras no se rastrearían de ningún modo. Al tratar con parámetros de ordenación, la consistencia es esencial. Se debe ordenar siempre del mismo modo.

CuriosoPreguntón: ¿Qué hay del valor de sortBy?
GranMagoWeb: es un caso muy parecido al atributo sortOrder. Te interesa que las URL que se rastreen de tus listados estén ordenadas de forma consistente en todas las páginas, ya que de lo contrario, algunos artículos podrían quedar fuera del alcance del robot de Google. Sin embargo, debes ir con cuidado al elegir un valor. Si en tu tienda se venden libros y zapatos, sería mejor no seleccionar el valor "title" porque las URL que apunten a zapatos nunca contendrán "sortBy=title" y, en consecuencia, no se rastrearán. De forma parecida, "sortBy=size" funciona bien para rastrear los zapatos, pero no para los libros. Ten en cuenta que la configuración de los parámetros afecta a todo el sitio web.

CuriosoPreguntón: ¿Por qué no rastrear las URL con el parámetro filterByColor?
GranMagoWeb: imagínate que tienes una lista de faldas de tres páginas. Unas cuantas son azules, otras son rojas y otras son verdes.
  • modaencantada.example.com/faldas/?pagina=1
  • modaencantada.example.com/faldas/?pagina=2
  • modaencantada.example.com/faldas/?pagina=3
Esta lista se puede filtrar. Cuando un usuario selecciona un color, obtiene dos páginas de faldas azules:
  • modaencantada.example.com/faldas/?pagina=1&filterByColor=azul
  • modaencantada.example.com/faldas/?pagina=2&filterByColor=azul
Parecen páginas nuevas (el conjunto de artículos es distinto de todas las demás páginas), pero realmente no hay contenido nuevo en ellas, puesto que todas las faldas azules ya aparecían en las tres páginas originales. No es necesario rastrear las URL que delimitan el contenido por color, puesto que el contenido que se sirve en esas URL ya ha sido rastreado. Hay una cuestión importante a tener en cuenta aquí: antes de desactivar el rastreo de URL seleccionando la opción "Ninguna URL", asegúrate de que el robot de Google pueda acceder a ese contenido de algún otro modo. Si pensamos en nuestro ejemplo, el robot de Google necesita poder encontrar los tres primeros enlaces en tu sitio y no debería haber nada que impidiese rastrearlos.
- - -

Si un sitio tiene parámetros de URL que puedan generar incidencias de duplicación de contenido, deberíais probar la nueva función Parámetros de URL de las Herramientas para webmasters de Google. Os invitamos a contarnos vuestras opiniones y, si tenéis alguna pregunta, no dudéis en enviarla al Foro de ayuda para webmasters.

Publicado por Kamila Primke, Ingeniero de software, equipo de Herramientas para webmasters de Google

miércoles, 21 de septiembre de 2011

Cara a cara: Colaboradores principales de los foros de Google viajan a California

Las comunidades de los productos y servicios de Google han crecido enormemente en los últimos dos años. Es muy inspirador y motivador ver cúantos usuarios como tú contribuyen en nuestros foros. Por algún tiempo hemos estado pensando en cómo podríamos dar las gracias a nuestros Colaboradores principales. Los colaboradores son nuestros usuarios más útiles, amables y activos. Estos Cps han demostrado un increíble compromiso con nuestras comunidades y continuan compartiendo su profundo conocimiento respondiendo a las preguntas que los usuarios hacen en los foros.

Colaboradores de todo el mundo se darán cita en nuestro primer evento mundial en California.

Así que hemos decidido darle un descanso por un rato al mundo en línea y conocerlos cara a cara para celebrar nuestros éxitos y trabajar por los futuros proyectos. Los guías de los Foros de Google, empleados de Google que participan en los foros, y los Colaboradores principales se reunirán el próximo 13 y 14 de septiembre en la primera Cumbre Mundial de Colaboradores principales que se celebrará en Santa Clara y Mountain View, California. Durante este evento, de dos días, organizado por Google, los Colaboradores principales conocerán a los guías, ingenieros y jefes de producto para dar su opinión y compartir nuevas ideas. Y algunas de estas nuevas ideas también las compartiremos con todos vosotros, así que estar atentos. Si deseas seguir lo que ocurre durante este evento, busca el hashtag #TCsummit en Twitter y nuestras actualizaciones en Google+.

Publicado por Esperanza Navas y Kaspar Szymanski, equipo de Calidad de búsqueda

miércoles, 7 de septiembre de 2011

Envío de URL a Google mediante Explorar como Googlebot

La función Explorar como Googlebot de las Herramientas para webmasters de Google cuenta ahora con una nueva forma de enviar URL nuevas y actualizadas a Google para ser indexadas. Después de explorar la URL como Googlebot, verás la opción de enviar la URL a nuestro índice. Cuando envias una URL de esta forma Googlebot rastreará la URL, generalmente en un día. Entonces nosotros la consideraremos para incluirla en nuestro índice. Ten en cuenta que no garantizamos que cada una de las URL enviadas de esta forma vaya a ser indexada, seguimos utilizando nuestros procesos normales, los mismos que se utilizan cuando descubrimos una URL y en los que se evaluan si la una URL debe pertenece a nuestro íncide.

Esta nueva funcionalidad puede ayudarte en varias situaciones, por ejemplo: si acabas de lanzar un nuevo sitio web o  si has añadido nuevas páginas que son claves. En estos casos puedes preguntar a Googlebot que las busque y las rastree inmediatamente en lugar de esperar que las encontremos nosotros de forma natural. También puedes enviar las URL que ya han sido indexadas para que se actualicen; digamos que has actualizado contenido importante para un evento que va a realizar ese fin de semana y quieres que lo veamos a tiempo. También puede pasar que hayas publicado información de forma accidental y quieres actualizar la versión cache después de haber eliminado esa información de tu sitio web.

Cómo enviar una URL
En primer lugar, usa la función Explorar como Googlebot (que se encuentra en Diagnósticos) para recuperar la URL que desees añadir a Google. Si la URL se recupera correctamente, verás aparecer un nuevo enlace "Enviar al índice" junto a la URL recuperada.


Al hacer clic en "Enviar al índice", aparece un cuadro de diálogo que permite elegir si se desea enviar solo esa URL o esa URL y todas las páginas enlazadas.


Al enviar URL individuales, se permite realizar un máximo de 50 envíos por semana, y al enviar URL con sus páginas enlazadas, el límite es de 10 envíos al mes. En la página Explorar como Googlebot se muestra cuantos envíos quedan. Todas las URL enviadas deben apuntar hacia contenido adecuado para la búsqueda web de Google, así que para enviar imágenes o vídeos deberías enviar Sitemaps.

Enviar URL que no son de tu propiedad a Google
Junto con esta actualización de la función Explorar como Googlebot, también hemos actualizado el formulario público para incluir tu URL en Googl". Ahora se llama formulario "Crawl URL". Se le aplican los mismos límites de cuota de envío de páginas al índice que a la función Explorar como Googlebot, pero no es necesario verificar la propiedad, así que permite enviar cualquier URL que se desee rastrear e indexar.


Si tienes alguna URL que desees que Google rastree e indexe de inmediato, piensa en la posibilidad de enviar la URL mediante el formulario "Crawl URL" o la función Explorar como Googlebot actualizada de las Herramientas para webmasters de Google. No dudes en dejar tus comentarios aquí o visitar el Foro de ayuda para webmasters si necesitas respuestas más detalladas.

publicado por Written by & , Webmaster Trends Analysts

viernes, 2 de septiembre de 2011