URL con permisos de redirección abiertos: ¿Están abusando de tu sitio?

Nadie desea malware o URL con spam en su dominio, por eso intentamos seguir las prácticas de seguridad recomendadas [inglés].  Pero,  ¿y si hubiera una manera de que los spammers se aprovechen de tu sitio, sin ni  siquiera poner un pie en tu servidor? 

Existe una manera, y es mediante el abuso de URL con permisos de redirección abiertos.

Los webmasters se enfrentan a una serie de situaciones en las que es útil redirigir usuarios a otra página. Lamentablemente, se puede abusar de las redirecciones abiertas. Es una forma de abuso particularmente molesta, ya que se aprovecha una funcionalidad del sitio en lugar de abusar de un error o un defecto de seguridad. Los spammers esperan usar tu dominio como página de inicio de forma temporal para engañar a usuarios de las búsquedas y del correo electrónico,  así como a motores de búsqueda, para que vayan a enlaces que aparentemente apuntan a tu sitio, pero que en realidad redirigen a sitios de spam. 
 
En Google trabajamos duro para mantener esas URL fuera de nuestro índice, pero es importante que, por tu parte, te asegures de que no están abusando de tu sitio. Probablemente no quieras que los usuarios encuentren en tu dominio esas URL, que los llevan a pantallas llenas de porno no deseado, virus y malware desagradables, o intentos de phishing. Los spammers generarán enlaces para hacer que esas redirecciones aparezcan en los resultados de búsqueda y éstos suelen provenir de malos vecindarios, con los que no quieres que se te asocie.

Últimamente, este tipo de abuso se ha convertido en algo relativamente común.  A continuación vamos a dar algunos ejemplos de redirección, luego hablaremos de cómo saber si están abusando de tu sitio y qué hacer al respecto. 

Abusos en las redirecciones por parte de los spammers

Hemos observado que los spammers han atacado una amplia gama de sitios web, desde grandes empresas bien conocidas a pequeños organismos de gobiernos locales. La siguiente lista es una muestra de los tipos de redirecciones que hemos visto. Son todas técnicas perfectamente legítimas, pero debes vigilarlas si se utilizan en tu sitio web. 
  • Los scripts que redireccionan usuarios hacia un archivo en el servidor,  como un documento PDF, pueden ser vulnerables. Si utilizas un sistema de gestión de contenidos (CMS) que te permite cargar archivos, puede que quieras asegurarte de que los enlaces van directamente al archivo, en lugar de ir a través de una redirección. Esto incluye cualquier redirección que puedas tener en la sección de descargas de tu sitio. Ten  cuidado con enlaces como estos:
example.com/go.php?url=
example.com/ie/ie40/download/?
  • Las páginas de resultados de búsqueda internos a veces tienen opciones de redirección automática que podrían ser vulnerables. Busca patrones como este, en el que se envía automáticamente a los usuarios a cualquier página que figure tras el parámetro "url=":
 example.com/search?q=user+search+keywords&url=
  • Los sistemas de seguimiento de clics  de programas de afiliación, programas de anuncios o estadísticas podrían estar abiertos también. Algunos ejemplos son:
example.com/coupon.jsp?code=ABCDEF&url=
example.com/cs.html?url=
  • Los sitios proxy, aunque no redirijan siempre, están diseñados para enviar a los usuarios a otros sitios y, por lo tanto, pueden resultar vulnerables a este abuso. Esto incluye los que utilizan las escuelas y las bibliotecas. Por ejemplo:
proxy.example.com/?url=
  • En algunos casos, las páginas de inicio de sesión redirigirán a los usuarios a la página que intentaban acceder. Presta atención a parámetros de URL como:
example.com/login?url=
  • Los scripts que ponen una página intermedia cuando los usuarios salen de un sitio pueden ser objeto de abusos. Muchos sitios web de instituciones educativas, gubernamentales o de grandes empresas hacen esto para que los usuarios sepan que la información encontrada en los enlaces salientes no está bajo su control. Echa un vistazo a URL con patrones como: 
example.com/redirect/
example.com/out?
example.com/cgi-bin/redirect.cgi?

¿Están abusando de mi sitio?

Aunque ninguno de los patrones mencionados arriba te parezcan familiares, puede que tengas redirecciones abiertas que vigilar. Hay varias formas de ver si éstas son vulnerables, y no es necesario que seas desarrollador.
  • Comprueba si las URL atacadas se muestran en Google. Prueba la búsqueda con el operador site: [inglés] en tu sitio para ver si algo raro se muestra en los resultados de Google para tu sitio. Puedes añadir palabras que sean poco probables que aparezcan en tu contenido habitualmente, como por ejemplo contenido para adultos. Si la consulta [site:example.com viagra] no debería ofrecer resultados pero sí lo hace, eso podría ser un problema. Puedes automatizar estas búsquedas con las Alertas de Google.
  •  Presta atención a consultas extrañas que aparezcan en el apartado de Consultas de búsqueda más habituales en las Herramientas para webmasters. Si tienes un sitio dedicado a la genealogía de la aristocracia terrateniente, un gran número de consultas sobre porno, pastillas o casinos podrían ser algo por lo que preocuparte. Por otro lado, si lo que tienes es un sitio con información sobre medicamentos,  no esperarás ver nombres de famosos en las consultas más frecuentes. Vigila  si recibes mensajes de Google en el centro de mensajes de las Herramientas para webmasters. 
  • Comprueba los registros del servidor web o de analytics para parámetros de URL desconocidos (como "= http:" o "=//"), o picos de tráfico para redirigir URL en tu sitio. También puedes comprobar las páginas con enlaces externos en las Herramientas para webmasters. 
  • Vigila las quejas de los usuarios sobre contenido o software malicioso que sabes con certeza que no se encuentra en tu sitio. Tus usuarios pueden haber visto tu dominio en la URL, antes de haber sido redirigidos, y pueden suponer que siguen en tu sitio. 
¿Qué puedes hacer?

Desafortunadamente, no hay una manera fácil de asegurarse de que nadie abusa de tus redirecciones. Una redirección no es un error o un defecto de seguridad en sí. Algunos usos requieren que éstas sean bastante abiertas. Pero hay algo que puedes hacer para evitar el abuso o, por lo menos, hacer que resulten menos llamativas. Algunos de estos no son banales, es posible que tengas que escribir un código personalizado o consultar a tu proveedor sobre parches de seguridad.
  • Cambia el código de redirección para que compruebe el referrer; ya que en la mayoría de los casos todo el mundo llega a tu script de redirección de manera legítima desde tu sitio, no desde un motor de búsqueda o cualquier otro lugar. Probablemente tengas que ser permisivo, ya que algunos navegadores no informan del referrer, pero si se detecta que un usuario viene de un sitio externo, puedes detenerlo o avisarlo. 
  • Si el script sólo debe enviar a los usuarios a páginas internas o archivos (por ejemplo, a una página para descargar archivos), debes desactivar específicamente las redirecciones externas
  • Considera la posibilidad de utilizar una lista de destinos seguros. En este caso, el código debe mantener un registro de todos los enlaces salientes y asegurarse de que reorienta al usuario hacia un destino legítimo. 
  • Considera la posibilidad de firmar tus redirecciones. Si tu sitio realmente necesita proporcionar redirecciones, puedes codificar [inglés] correctamente la URL de destino y, a continuación, incluir la firma encriptada como parámetro al hacer la redirección. Esto permite que tu propio sitio redireccione URL sin abrir el elemento que redirige URL al público. 
  • Si tu sitio no necesita redirecciones, deshabilítalas o elimínalas. Hemos observado un gran número de sitios en los que los únicos usuarios de las redirecciones son los spammers. Probablemente se trata de una opción activada de forma predeterminada. 
  • Utiliza robots.txt  para excluir a los motores de búsqueda de las redirecciones de tu sitio. Esto no resolverá el problema del todo, ya que los spammers podrían utilizar tu dominio en correos electrónicos spam. Tu sitio les parecerá menos atractivo, y al menos no se engañará a los usuarios mediante los resultados de búsqueda. Si tus scripts se encuentran en una subcarpeta junto con otros scripts que no necesitan aparecer en los resultados de búsqueda, puedes excluir toda la subcarpeta con el fin de que les resulte más difícil el simple hecho de encontrarlos.
El abuso de redirecciones abiertas es un gran problema ahora mismo, pero creemos que cuanto mayor sea el número de webmasters que conocen el problema, más difícil les será a los chicos malos sacar provecho de los sitios incautos. No dudes en dejarnos tus sugerencias en los comentarios o compartirlas en el Foro de Google para webmasters

viernes, 27 de febrero de 2009

Especifica tu URL canónica

No te preocupes más por posible contenido duplicado: Google dispone ahora de un formato que permite especificar públicamente la versión que prefieres de una URL. Si tu sitio web tiene contenido idéntico o muy similar y es accesible a través de varias URL, este formato te da más control sobre la URL que se devuelve en los resultados de búsqueda. Esto además nos asegura que la popularidad del enlace se mantiene en la versión elegida.

Tomemos nuestro ejemplo de un sitio que vende caramelos Swedish Fish. Imagínate que la URL que prefieres y su contenido se parece a esto:

http://www.example.com/product.php?item=swedish-fishSin embargo, los usuarios (y Googlebot) pueden acceder a través de diferentes URL. Aunque la información más importante de esas URL sea la misma que la que hay en la versión que tu prefieres, puede que se muestren pequeñas variaciones en el contenido debido a los parámetros o a la categoría de navegación.

http://www.example.com/product.php?item=swedish-fish&category=gummy-candyO puede que tengan contenido completamente idéntico pero con diferente URL, debido a cosas tales como los parámetros de rastreo o el id de sesión:

http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678Ahora, solo hay que añadir esta etiqueta link a la versión que prefieras:

<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish"/>

Dentro de la sección head de las URL con el contenido duplicado:

http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678

y Google entenderá que todos los duplicados se refieren a la URL canónica: http://www.example.com/product.php?item=swedish-fish. Otras propiedades adicionales de la URL, como el PageRank, también se transferirán.

Este estándar puede ser adoptado por cualquier motor de búsqueda cuando rastree e indexe tu sitio web.

Por supuesto, puede que tengáis más preguntas. Joachim Kupke [inglés], un ingeniero de nuestro equipo de indexación, está aquí para ofrecernos algunas respuestas:

¿Es el re="canonical" una recomendación o una directiva?
Es una recomendación que apoyamos firmemente. Tomamos en cuenta tu preferencia junto con otras señales cuando calculamos la páginas más relevantes que se muestran en los resultados de búsqueda.

¿Puedo usar una ruta relativa para especificar la URL canónica, como por ejemplo < style="font-weight: bold;" rel="canonical" href="product.php?item=swedish-fish">?
Sí, las rutas relativas son reconocidas con la etiqueta link. Además, si incluyes un enlace base en tu documento, las rutas relativas se resolverán de acuerdo con la URL base.

¿Está bien si la URL canónica no es un duplicado exacto del contenido?
Permitimos pequeñas diferencias, por ejemplo, en el orden de una tabla de productos. Y admitimos que podemos rastrear la URL canónica y páginas duplicadas en diferentes momentos, así que ocasionalmente podemos ver diferentes versiones de tu contenido. Todo esto nos vale.

¿Qué ocurre si el rel="canonical" devuelve un 404?
Continuaremos indexando tu contenido y usaremos la heurística para encontrar la URL canónica, pero recomendamos que especifiques una URL existente como URL canónica.

¿Qué ocurre si el rel="canonical" no ha sido indexado?
Como con todo el contenido público disponible en Internet, nos esforzamos en descubrir y rastrear rápidamente una URL canónica designada. Tan pronto como nosotros lo indexamos tendremos en cuenta el atributo rel="canonical"

¿Puede el rel="canonical" ser una redirección?
Sí, puedes especificar una URL que redirija a una URL canónica. Google procesará la redirección e intentará indexarla.

¿Qué pasa si tengo un rel="canonical" contradictorio?
Nuestro algoritmo es indulgente: podemos seguir cadenas canónicas, pero recomendamos que se actualicen los enlaces que apuntan a una página canónica específica para un resultado óptimo.

¿Puede esta etiqueta de enlace utilizarse para sugerir una URL canónica en un dominio completamente diferente?
No. Para migrar a un dominio completamente diferente, una redirección permanente (301) es más apropiada. Google por el momento tiene en cuenta sugerencias canónicas entre subdominios (o en un mismo dominio), pero no entre dominios diferentes. Así que el dueño de un sitio web puede sugerir www.example.com frente a example.com o help.example.com, pero no example.com frente a example-widgets.com.

Suena bien en teoría, ¿puedo ver algún ejemplo real?
Sí, wikia.com nos ha ayudado a probar el sistema. Por ejemplo, te darás cuenta que el código fuente en la URL http://starwars.wikia.com/wiki/Nelvana_Limited específica su rel="canonical" como: http://starwars.wikia.com/wiki/Nelvana.

Las dos URL son casi idénticas, aunque la primera URL de Nelvana_Limited tiene un pequeño mensaje cerca de su cabecera. Este es un buen ejemplo de cómo usar esta característica. Con el rel="canonical" las propiedades de las dos URL se consolidan en nuestro índice y los resultados de búsqueda muestran la versión que wikia.com especificaba.

Si tienes alguna pregunta más, añádela en la parte de los comentarios y si no eres capaz de implementar un enlace con designación canónica, no te preocupes; vamos a intentar hacerlo lo mejor posible para seleccionar la versión que prefieras de tus URL duplicadas y transferir las propiedades de enlaces, tal y como lo hacíamos antes [inglés].

martes, 24 de febrero de 2009

¿Cómo contactar con Google?

Algunas personas nos preguntan a menudo en nuestro Foro para webmasters cómo pueden contactar con Google. Normalmente estos usuarios están buscando una respuesta a un problema específico. Pues bien, hay tantas preguntas que siempre intentamos encontrar nuevas formas de comunicarnos con todos vosotros a través de diferentes vías, todas ellas de acceso gratuito. Este artículo trata, ni más ni menos, de reunir los recursos que tenemos disponibles en español para todos los webmasters o responsables de sitios web. No importa cuál sea el nivel de conocimiento que tengáis, estos recursos abarcan todos los niveles.

Para empezar contamos con el Centro para webmasters de Google, el cual se divide en dos partes: los enlaces a las herramientas y los enlaces a los recursos de "ayuda". En esta segunda parte contamos con:

  1. Blog para Webmasters, que está activo desde septiembre de 2008 para todos los webmasters de habla hispana.
  2. Foro para webmasters de Google, que recientemente ha cambiado de plataforma con mejoras de forma y fondo. ¡Comprobadlo con vuestros propios ojos!
  3. Centro de Asistencia para webmasters, donde se abordan cuestiones más específicas sobre rastreo, sitemaps, etc. y en el cual además tenemos las Directrices para webmasters de Google (recomendaciones de Google para que los sitios web sean indexados de forma más sencilla y rápida, y así como evitar tropiezos con las técnicas que Google califica manipuladoras.)
Al margen de estos canales de comunicación, hace poco Google publicó la Guía SEO de Google para principiantes, un complemento perfecto, y de lectura muy recomendable para todos los webmasters.

¡Ahora las herramientas!

Y de los recursos de ayuda a las herramientas. Así que de vuelta en el Centro para webmasters encontraremos en la primera columna los enlaces a las herramientas, entre las que destaca: las Herramientas para webmasters. Con estas podréis conocer cómo Google rastrea tu página web, posibles errores en URL, crear sitemaps, y mucho, mucho más, incluso enviar un formulario de revisión de malware (diferente a nuestro formulario de petición de reconsideración [inglés]). De hecho tenemos una serie de video tutoriales sobre las Herramientas para webmasters y que puede que encontréis muy interesantes. Las otras dos herramientas disponibles en este centro son:
  1. Asistente informativo sobre el estado del sitio, a través del cual sabremos si nuestro sitio web está en el índice de Google.
  2. Envíe contenido a Google, una herramienta desde la que enviar contenido a Google (aunque la página se encuentra en inglés podemos utilizar Google translate para ver su traducción)
Pero esto no es todo, Google ofrece otras herramientas a través de las cuales te puedes comunicar con Google dependiendo de lo que necesites:
  1. Herramienta de solicitud de eliminación de página web, disponible para todos los usuarios y desde la que se puede pedir la eliminación de una determinada página web por algún motivo determinado.
  2. Solicitud de reconsideración, para pedir la reconsideración de tu sitio web si piensas que este podría haber violado nuestras directrices.
  3. Spam Report o Informe de spam, si piensas que un sitio está violando nuestras directrices háznoslo saber. Contamos con dos versiones de este informe; uno autentificado a través de las Herramientas para webmasters y los cuales son revisados sin excepción. Y la versión pública cuyos informes se revisan basándose en su impacto.
  4. Contacto legal con Google, es un punto de contacto con Google si piensas que algunos resultados o sitios web pueden ser ilegales.
Sitemaps, APIs y otros recursos

Google continua con su trabajo y sigue así desarrollando nuevas herramientas útiles y gratuitas para los webmasters, hace poco lanzaba su nuevo Generador de sitemaps, que ofrece mejores técnicas para encontrar URL y del que tenéis más información en este artículo. Por otra parte hay disponibles generadores de sitemaps desarrollados por terceras compañías, (estos generadores no están disponibles en español, pero creemos que son herramientas a tener en cuenta). También en nuestro foro algunos webmasters recomendaron algunas de sus herramientas favoritas. Por otra parte, los webmasters con múltiples sitios web cuentan con el API de Herramientas para webmasters, el cual puede ser utilizado en tu aplicación cliente para ver y organizar tus sitios web desde tu cuenta de las Herramientas para webmasters.

Son muchas las páginas en Internet que son realmente útiles, pero no es posible nombrarlas todas y tampoco es esa nuestra intención. Aquí os mostramos algunas herramientas que en algún momento se han hecho referencia en nuestros artículos del blog, aunque recuerda que ahí fuera hay un montón de herramientas muy similares a estas. Desafortunadamente la mayoría de ellas no tienen versión en español, aun así seguimos pensando que pueden ser útiles:
  • Stopbadware.org (para los casos en los que sitios web se han hackeados)
  • W3.org (hay una versión española de la página pero la herramienta de validación esta solo en inglés)
  • Sitemaps.org (todo lo referente a sitemaps para cualquier buscador, esta sí con versión en español)
  • Recaptcha.net (CAPTCHA, muy útil para frenar el spam en ciertos servicios web)
  • Akismet (API para evitar spam)
  • TypePad AntiSpam (servicio antispam)
Desde nuestro foro

Por último, recordaros que si a pesar de todos estos recursos y herramientas seguís sin vuestra respuesta, nuestro Foro para webmasters puede ser el mejor lugar donde compartirlo con los demás usuarios y encontrar soluciones entre todos. ¡De eso se trata el foro!. Y es cierto que hay veces que ni las preguntas ni las respuestas son sencillas. Aquí os ofrecemos algunos ejemplos de nuestro archivo del foro: el primero es el caso de un usuario que tenía problemas con la indexación de su sitio web y al que se le recomendó utilizar cURL para ver mejor el problema. Y un segundo caso un ejemplo de como la colaboración de nuestra comunidad dio con la respuesta que un usuario necesitaba. Como estos muchos más, pero no os preocupéis ahora con nuestro "nuevo" foro esperamos que todo sea mucho más fácil. Nos vemos allí.

jueves, 19 de febrero de 2009

¿Hasta el infinito y más allá? ¡No!

Cuando Googlebot va rastreando la web, a veces encuentra lo que llamamos un "espacio infinito". Estos son un gran número de enlaces que normalmente ofrecen poco o ningún contenido nuevo a Googlebot. Si esto ocurre en tu sitio web, puede que se esté utilizando un ancho de banda innecesario para rastrear estas URL y puede ocurrir que Googlebot no indexe por completo el contenido real de tu sitio web.

Algunos webmasters han detectado este problema en sus páginas web. Este tipo de avisos, como la mayoría de los avisos que enviamos, los puedes encontrar en el Centro de Mensajes de las Herramientas para webmasters. Probablemente quieras saber enseguida si Googlebot tiene este problema, o cualquier otro, cuando rastrea tu sitio web. Así que verifica tu sitio web en las Herramientas para webmasters y mira el Centro de mensajes de vez en cuando.

Ejemplos de espacio infinito

El típico ejemplo de un espacio infinito es el calendario con el enlace al "Siguiente Mes". ¡Podría ser posible seguir esos enlaces hasta el infinito! Estamos seguros de que eso no es lo que tú quieres que Googlebot haga. Googlebot es suficientemente inteligente para encontrar algunos de estos enlaces sin necesidad de ayuda, pero existen muchas formas de crear espacios infinitos y puede que no las hayamos detectado todas.

Otra situación muy común se da en los sitios web que ofrecen, a través de filtros, diferentes grupos de resultados de búsqueda. Una tienda online puede ofrecer una búsqueda de artículos de ropa filtrándolos por categorías, precio, color, marca, estilo, etc. El número de posibles combinaciones con estos filtros puede crecer exponencialmente. Esto puede producir miles de URL, y todas tendrán algún subgrupo de artículos vendidos. Esto puede ser útil para tus usuarios, aunque no lo será mucho para Googlebot, que sólo quiere encontrar todo el contenido de una sola vez.

Corregir problemas con los espacios infinitos

Este artículo sobre las Herramientas para webmasters describe más formas sobre cómo los espacios infinitos pueden aparecer y da recomendaciones para evitar el problema. Una solución es eliminar todas las categorías de enlaces generados dinámicamente con ayuda del archivo robots.txt. El Centro de asistencia para webmasters tiene mucha de información sobre cómo usar el robots.txt. Si vas a hacer esto, no olvides asegurarte de que Googlebot pueda encontrar todo tu contenido de otra forma. Otra opción es bloquear esos enlaces problemáticos con un atributo de enlace "nofollow". Si deseas más información sobre los enlaces "nofollow" pásate por el Centro de asistencia para webmasters.

martes, 17 de febrero de 2009

Nuevo Foro de Ayuda de Google

En los últimos años hemos tenido el Foro de ayuda a webmasters, que creemos ha ayudado a muchos webmasters a resolver sus dudas y también les ha permitido aprender un poco sobre cómo funciona el motor de búsqueda de Google. Ahora ha llegado el momento de presentar el nuevo Foro de Google para webmasters en español. No es solo un lavado de cara, sino que el nuevo foro hará más fácil encontrar respuestas, compartir recursos con los demás y obtener reconocimiento por participar. Estas son algunas de las nuevas características:

- resultados de búsqueda mejorados, incluyendo entradas del foro antiguo y del nuevo
- un sistema de reputación, con la posibilidad de designar a los miembros que más ayudan como colaboradores principales (o super usuarios, como nos gusta llamarles)
- la posibilidad de que los usuarios, colaboradores principales y Googlers marquen las preguntas como contestadas
- fácil acceso al contenido del Centro de ayuda.

Estas son algunas preguntas y respuestas que seguramente te serán útiles:

P: ¿Qué pasará con el antiguo Grupo de ayuda para webmasters?
R: Aunque el grupo no permitirá nuevas entradas, aún estará disponible en formato de sólo lectura por si quieres hacer referencia a alguna de tus entradas favoritas. Muchas de las preguntas (¡y respuestas!) más frecuentes ya han sido transferidas a nuestro nuevo foro de ayuda.

P: Si yo era un miembro del grupo antiguo, voy a ser automáticamente miembro del nuevo foro?
R: No vamos a transferir miembros del grupo antiguo al nuevo, así que aunque fueras parte del foro en Google Groups, tendrás que registrarte en el nuevo foro para poder participar. Los perfiles y nombres de usuario también se gestionan por separado, así que te invitamos a que recrees tu perfil de Google Groups o te reinventes en nuestro nuevo foro :)

También podrás encontrar nuevos foros en español para los siguientes productos: AdWords, Gmail, AdSense, Google Apps, y Otros productos.

¡No te olvides de hacer clic en el siguiente enlace antes de irte! :)
http://www.google.com/support/forum/p/webmasters?hl=es

miércoles, 11 de febrero de 2009

Contenido duplicado debido a scrapers

Teniendo en cuenta que el contenido duplicado es un tema candente entre los webmasters, pensamos que es un buen momento para tratar preguntas que nos hacen con regularidad en las conferencias y en el Foro de ayuda para webmasters de Google.

Antes de entrar de lleno en ellas me gustaría referirme rápidamente a un tema que preocupa a los webmasters: en la mayoría de casos un webmaster no tiene ninguna influencia sobre el contenido que terceras partes copian y redistribuyen sin permiso del webmaster. Nos damos cuenta de que no es culpa del webmaster en cuestión, lo que significa que un contenido idéntico se mostrará a la vez en varios sitios web aunque no se considerará en sí una violación de nuestras directrices para webmasters. Esto simplemente lleva a otro proceso con el que se intenta determinar la fuente original del contenido, algo en lo que Google es bastante bueno ya que en la mayoría de casos el contenido original puede ser correctamente identificado y sin tener efectos negativos para el sitio web que ha originado el contenido.

Generalmente, podemos diferenciar entre dos situaciones relacionadas con contenido duplicado:
  • Contenido duplicado en tu propio dominio, por ejemplo contenido idéntico que aparece involuntariamente en más de un lugar en tu sitio web.
  • Contenido duplicado en varios dominios, por ejemplo contenido idéntico el cual aparece, de nuevo involuntariamente, en diferentes sitios web.
En el primer caso, puedes tomar partido y evitar que Google indexe el contenido duplicado de tus sitios web. Échale un vistazo a este artículo de Adam Lasnik, "Deftly dealing with duplicate content" [inglés] y este otro de Vanessa Fox, "Duplicate content summit at SMX Advanced" [inglés]. Ambos ofrecen buenos trucos sobre cómo resolver problemas con el contenido duplicado en tu sitio web. Otro truco más que te puede ayudar a evitar que el contenido de tu página web sea rastreada como contenido duplicado es incluir la URL de la versión que prefiramos en el archivo de sitemap. Esto nos puede ayudar a aumentar las probabilidades de ofrecer la versión que el usuario prefiere cuando encontramos diferentes páginas con el mismo contenido. En el Centro de asistencia se puede encontrar este artículo con información adicional sobre el contenido duplicado.

En el segundo caso, quizás se de la situación en la que alguien está copiando tu contenido y poniéndolo en un sitio web diferente y a menudo sacándole partido económicamente. Es además normal que muchos proxys en Internet indexen partes de los sitios web a los que se han accedido desde el mismo proxy. Si nos encontramos este contenido duplicado en diferentes sitios web, miramos las diferentes señales para determinar cuál es el sitio original, que por regla general suele funcionar muy bien. Así que no deberías estar preocupado por los efectos negativos de la presencia de contenido copiado de tu sitio web en Google.

Si se da el caso que estas distribuyendo tu contenido pero además quieres estar seguro de que tu sitio se identifica como fuente original, es muy útil pedirle a tus "distribuidores" de contenido que incluyan un enlace de vuelta al contenido original. Puedes encontrar más información sobre cómo tratar este tipo de contenido en un artículo de Vanessa Fox, "Ranking as the original source for content you syndicate" [inglés].

Algunos webmasters han preguntado qué puede originar que un contenido copiado tenga una mejor posicionamiento que la fuente original. Este no debería pasar a menudo, pero si te sucediese:
  • Comprueba si tu contenido es accesible a nuestros robots. Puede que sin querer hayas bloqueado el acceso a parte de tu contenido a través de tu archivo robots.txt.
  • Puedes mirar en el archivo Sitemap por si hubieses hecho cambios en ese contenido que ha sido copiado.
  • Comprueba que tu sitio web siga las Directrices para webmasters de Google.
Por último me gustaría señalar que en la mayoría de casos, tener contenido duplicado no tiene efectos negativos en la presencia de tu sitio web en el índice de Google, ya que este se filtra. Si te fijas en algunos de los consejos mencionados más arriba, lo que estás aprendiendo es a controlar mejor lo que rastreamos e indexamos, así como las versiones que tienen más probabilidades de aparecer en el índice. Solo cuando hay señales que apuntan a un uso deliberado y malintencionado, puede ocurrir que consideremos que el contenido duplicado está violando las directrices para webmasters.

Si deseas comentar algo sobre este tema no dudes en visitar nuestro Foro de ayuda para webmasters.

martes, 10 de febrero de 2009

Nuevo blog oficial sobre los productos de Google en español

Se acaba de lanzar el Blog oficial de los productos de Google en español. En este nuevo blog podrás conocer los productos de Google desde el punto de vista de distintos googlers especializados. El objetivo de este blog es ofrecer información sobre novedades y sugerencias de uso que te puedan ayudar tanto a descubrir nuevas funciones, como a estar al tanto de lanzamientos en nuestro idioma que te puedan interesar.

Encontrarás, al menos, una nueva entrada cada semana y puedes participar con comentarios y sugerencias en el Grupo de Ayuda.

¡Gracias!

jueves, 5 de febrero de 2009

¿"Este sitio puede dañar su equipo" para cada resultado de búsqueda?

Si has realizado una búsqueda en Google el 31 de enero entre las 14:30 p.m. y las 15:25 p.m. GMT (por ejemplo a partir de las 8:30 a.m. en México, 11:30 a.m. en Argentina o las 15:30 p.m. en España), es probable que hayas visto el aviso "Este sitio puede dañar su equipo" acompañando a cada resultado de búsqueda. Esto claramente fue un error y sentimos mucho las molestias causada a nuestros usuarios.

¿Qué pasó? Simplemente fue un error humano. Google marca resultados de búsqueda con el mensaje "Este sitio puede dañar su equipo" si sabemos que el sitio instala código malicioso clandestinamente. Hacemos esto para evitar que nuestros usuarios visiten sitios que puedan causar daño a sus computadoras. Recopilamos una lista de tales sitios a través de métodos manuales y automáticos. Trabajamos con una ONG que se llama StopBadware.org para establecer criterios que regulan esta lista y definir procesos sencillos que permiten a los webmasters sacar su sitio de la lista.

Actualizamos la lista frecuentemente y este sábado por la mañana hicimos un cambio. Desafortunadamente (y aquí fue donde cometimos el error), la URL "/" fue enviada como un valor más a la lista y el símbolo "/" es común a todas las URL. Por suerte, nuestro equipo de fiabilidad del sitio encontró el problema y lo corrigió rápidamente.

Debido a que hacemos las actualizaciones de manera periódica durante una hora, los errores empezaron entre las 14:27 y 14:40 GMT y terminaron entre las 15:10 y 15:25 GMT. Por eso, el problema duró aproximadamente 40 minutos para cualquier usuario.

Queremos dar las gracias a nuestro equipo por corregir el problema rápidamente. Lamentamos mucho las molestias causadas a todos los que sufrieron esta complicación el sábado y a los dueños de sitios web que fueron incorrectamente clasificados.

Vamos a investigar este episodio cuidadosamente para implementar nuevas medidas de seguridad y evitar que se repita.

Muchas gracias por su comprensión.

lunes, 2 de febrero de 2009