Nuestro enfoque a la búsqueda internacional

En entradas anteriores de esta serie [inglés], hablamos de los desafíos que conlleva crear un motor de búsqueda a nivel internacional. Nuestro objetivo es hacer que la búsqueda de Google sea relevante para todas las personas, sin importar su idioma o su país. Como mi compañero Amit Singhal dijo [inglés], usamos datos estadísticos como base para hacer cambios algorítmicos generales. Muchos de estos cambios se pueden llevar a cabo en todos los idiomas a los que damos soporte, pero en algunos casos las características específicas de algunos de esos idiomas requieren de ajustes y consideraciones algorítmicas. Y para hacer las cosas aún más interesantes, también se dan casos en los que la misma lengua cambia según el país. Ejemplos claros son "color" en los EE.UU. y "colour" en el Reino Unido, o "carro" en Latino América y "coche" en España.

Soy Daphne Dembo y mi objetivo es mejorar la búsqueda internacional de Google. Es un gran desafío, ya que la búsqueda de Google se utiliza en muchos países con diferentes lenguas, que nuestros ingenieros conocen poco. Inicialmente, las mejoras en búsqueda internacional las realizaban los ingenieros de Calidad de búsqueda, apasionados por sus idiomas y sus países: Lina, de Suecia, mejoró nuestro análisis de palabras compuestas en alemán y sueco; Dimitra, de Grecia, creó el soporte para las marcas diacríticas; Ishai, de Israel, trabajó en correcciones de transliteración del hebreo y el árabe; Trystan, de Australia, creó métodos para identificar resultados de búsqueda locales y clasificarlos junto con resultados extranjeros; Alex, bilingüe en ruso y ucraniano, creó la comprensión morfológica para estas lenguas. Como aumentó la importancia de la búsqueda internacional, tuvimos que pedir ayuda a todas nuestras oficinas. Por último, disponemos de una red internacional de especialistas en búsqueda que nos ayudan a comprender la búsqueda dentro de la combinación única que forman idioma y país.

El primer paso para poder ofrecer búsquedas en un idioma concreto es educar a nuestro modelo de lenguaje con una amplia colección de documentos en ese idioma. Esto asegura que nuestro modelo de idioma sea el más amplio y preciso. Por ejemplo, incorpora los nombres, modismos, usos coloquiales y palabras recién acuñadas pero que se usan con frecuencia y que no se encuentran en los diccionarios tradicionales. Recientemente hemos iniciado la identificación de swahili, y para ello se utilizan páginas como la del Parlamento de Tanzania para enseñar a nuestro sistema los matices del idioma. Tener un modelo de lenguaje ayuda a clasificar los documentos durante el rastreo y la indexación de la web, así como a analizar las consultas de los usuarios. Una vez que se completa esta fase, se pone en marcha la búsqueda en swahili para países como Tanzania y Kenia, permitiendo así búsquedas locales como "bolsa de valores Dar es Salaam" [Soko la HISA Dar es Salaam ], o "cura para la malaria" [TIBA ya malaria]. (Como siempre, utilizamos los corchetes para indicar una consulta de búsqueda. Por ejemplo, para buscar "fútbol" en Hamburgo (Alemania), haz clic en [fußball in hamburg]).

Aprendemos cosas de nuestros usuarios, de manera que cuando la gente empieza a usar nuestro motor de búsqueda, podemos mejorar en ese idioma. Aquí tienes algunos ejemplos:

  • Correcciones ortográficas: Hace poco que hemos puesto en marcha las correcciones ortográficas para estonio. Si tu estonio está oxidado y no te acuerdas de cómo se escribe "detector de humo", nosotros podemos sugerirte la corrección ortográfica para [suitsuantur], que lleva a mejorar los resultados de búsqueda.
  • Marcas diacríticas: Muchas lenguas tienen signos diacríticos, que alteran la pronunciación. Nuestros algoritmos están construidos para darles soporte, e incluso ayudar a los usuarios que cometan errores, aunque también pueden ignorarlos por completo. Por ejemplo, si vives en Quebec (Canadá) y quieres saber la previsión meteorológica para Quebec, te ofreceremos buenos resultados tanto si escribes con acentos [Météo Quebec] o sin ellos [meteo Quebec]. Los usuarios checos pueden obtener los mismos resultados para una popular serie de dibujos animados para niños tanto si buscan [krtecek] como [krteček]. Sin embargo, a veces las marcas diacríticas cambian el significado de una palabra y entonces deben utilizarse correctamente. Por ejemplo, en tailandés, [ข้าว] es "arroz", con resultados totalmente diferentes para [ข่าว], que son "noticias". O en Eslovaquia, los resultados para "niño" [dieťa] son diferentes a los resultados para "dieta" [diéta].

  • Sinónimos: Un caso general de soporte a marcas diacríticas es la manipulación de sinónimos en distintos idiomas. Determinadas búsquedas en Corea pusieron de manifiesto que "Samsung" puede ser un sinónimo de "삼성", de manera que cuando los usuarios buscaban [samsung], encontraban resultados con el nombre de la compañía escrito en coreano.

  • Compuestos: Algunos idiomas permiten la composición, es decir, la formación de nuevas palabras a partir de la combinación de dos palabras juntas. Un buen ejemplo puede ser cuando en sueco obtenemos resultados sobre tarjetas de crédito tanto para las consultas [Visakort] como [visa kort].

  • Derivados: Google ha desarrollado modelos morfológicos que pueden recibir palabras compuestas como consultas, y ofrecer como resultados páginas que contienen un derivado de éstas, posiblemente como parte de un compuesto diferente. Por ejemplo, cuando buscas coches en Arabia Saudita, puedes buscar [سيارة] o [سيارات], ya que ambas son variantes de la misma raíz y se obtienen resultados comunes para ambas. Un usuario polaco puede buscar "película" [film] y obtener resultados que contienen otras variantes de la raíz, tales como "filmów", "filmu", "filmie", "Filmy". Un usuario de Bielorrusia obtendrá resultados para todas las formas de la palabra "capital", Minsk [Мінск]: "Мінску", "Мінска", "Мінскага".

Además de estos factores semánticos, Google también analiza los documentos y las consultas. Entender los detalles de cómo se usa un idioma dentro de un país es importante. La anotación de acrónimos se realiza de forma diferente en cada idioma: En hebreo se utilizan comillas dobles antes del último carácter (que está a la izquierda), como en "primer ministro" [רה"מ]. En tailandés, se usa un punto al final de la palabra, como en "estación de policía" [สน.]. Mientras que en los EE.UU. se usan puntos después de cada carácter, como sucede con [I.B.M.]. Los usuarios chinos se refieren a las obras de arte con "《", como por ejemplo en [《手机》剧情] y designan fechas con un "日", como por ejemplo [2006年1月13日].

Más allá de los elementos lingüísticos de una lengua, tenemos en cuenta cómo se realizan las consultas hechas por los usuarios. Por ejemplo, algunas lenguas no latinas requieren teclados con teclas alfanuméricas dobles. El usuario puede cambiar los idiomas marcando una combinación de teclas. Si el usuario olvida marcar dicha combinación de teclas, las consultas realizadas no tienen sentido. Te damos un ejemplo de una correcta manipulación de estos errores en árabe: [hgsuv] corregido como [السعر] y [حقثسهيثىفهشم ثممثؤفهخىس] corregido como [presidential elections ]. O en hebreo: [vdrk, kuyu] corregido como [הגרלת לוטו]. O en cirílico: [rehc ljkffhf] corregido como [курс доллара].

Otra forma de evitar las molestias de tener que marcar una combinación de teclas para cambiar el idioma es utilizar la transcripción fonética en caracteres latinos de la consulta. Reproducir la búsqueda correcta en la lengua de destino no es fácil, ya que existen muchas posibilidades distintas. Aquí tienes varios ejemplos de este tipo: En ruso ([biskvitnyi rulet] pasa a ser [бисквитный рулет]). En chino, "películas" ([dianying] pasa a ser [电影]). Y en griego, para "Banco de Attica", [trapeza attikhs] ofrece buenos resultados para "Τράπεζα Αττικής". Los usuarios de 8 idiomas indios (como hindi, gujarati o telugu) pueden escribir el sonido fonético de la consulta y elegir las palabras en hindi:




El lenguaje utilizado también influye en la facilidad para escribir y leer. Puesto que cada palabra en chino requiere de varias combinaciones de teclas en un teclado estándar, nosotros ofrecemos la navegación por categorías para imágenes y las búsquedas relacionadas, para que la gente no necesite escribir tanto. Ahora también hemos lanzado Google Suggest, o finalización de consultas en tiempo real [inglés], en muchos idiomas.

Hasta ahora he descrito cómo mejoramos la calidad de búsqueda en un idioma. No obstante, influye mucho la ubicación del usuario, incluso si se trata sólo de aproximación al país, ya que en muchos casos el contenido local es más relevante que la información mundial. Por ejemplo, la búsqueda de las Páginas Amarillas en Español [Páginas Amarillas] se traducirá en varios documentos de interés global y varios resultados locales para Perú, México y España. De manera parecida, la búsqueda de [Côte d'Or] en Francia devolverá resultados para esa región del país, mientras que las búsquedas en Bélgica devolverán resultados sobre el fabricante de chocolate.

Hay que tener en cuenta que la visualización de información debe ajustarse a los estándares de cada país, por eso mostramos la marca decimal "," para los usuarios croatas que quieren saber cúantos milímetros hay en una pulgada [inč u milimetrima], o para los usuarios italianos interesados en los tipos de cambio de divisas [50 euro in dollari]. Del mismo modo, las temperaturas en Noruega [Været i Oslo] se mostrarán en grados Celsius, mientras que en los EE.UU. se hará en grados Fahrenheit [weather Boston].

Si todo lo demás falla, también proporcionamos traducciones basadas en la tecnología de traducción de Google, que ya se ha comentado en una entrada de este blog [inglés]. Traduciremos tu consulta al inglés, buscaremos documentos en inglés en la web y traduciremos los resultados del inglés al idioma original de consulta. Por ejemplo, los usuarios japoneses interesados en ilustraciones sobre Halloween (Halloween es una fiesta que se originó en Irlanda) pueden buscar [ハロウィン イラスト]. A continuación, puedes solicitar una traducción al japonés de las páginas en inglés (en la parte inferior de la página), que te traerá la traducción de la página, como en la captura de pantalla a continuación. Del mismo modo, los usuarios coreanos pueden buscar lo último de Harry Potter [해리 포터], y los lectores árabes pueden buscar la apertura de la Ópera de Sydney [افتتاح دار الاوبرا في سيدني] (Haz clic en la imagen para ver una versión ampliada).



En total, Google Search se está desarrollando actualmente en más de 100 idiomas, para más de 150 países, con docenas de mejoras puestas en marcha cada mes. Hasta ahora he hablado del funcionamiento básico de la búsqueda internacional, pero esto es tan sólo la superficie de todo el trabajo internacional que llevamos a cabo. Hay muchos otros temas de interés con impacto en los mercados internacionales, como la usabilidad,las páginas de inicio, el diseño de la página de resultados y la conectividad. La comprensión de los factores humanos y culturales es esencial para la creación de un motor de búsqueda relevante para las personas que lo utilizan (Haz clic en la imagen para ver una versión ampliada).






viernes, 28 de noviembre de 2008

Mejora la indexación y rendimiento de tu página web en los resultados de búsqueda

Hay muchos datos que ofrecemos en nuestras Herramientas para Webmasters que pueden ser de gran utilidad para tener una mejor presencia en los resultados de búsqueda. En este video hablamos de las secciones de Estadísticas y Diagnósticos, además de explorar cómo utilizar esta información.

Aquí aprenderás lo que significan los diferentes errores de rastreo, lo que te ayudará a retocar tu página web para hacerla más accesible.

Verás cómo otros te enlazan y qué páginas han sido enlazadas más veces, información con la cual podrás saber qué contenido es el más popular.

También hablaremos de los iGadgets, información de enlaces y el análisis de contenido.

Versión latinoamericana



Versión castellana



martes, 25 de noviembre de 2008

Guía SEO de Google para principiantes

Los webmasters suelen hacernos esta pregunta cuando vamos a conferencias o en el Foro de ayuda para webmasters: "¿Qué maneras fáciles hay para mejorar mi posicionamiento en Google?". Hay un montón de respuestas posibles a esta pregunta y, de hecho, hay tanta información en la web sobre optimización para buscadores que hasta puede intimidar a los nuevos webmasters que no estén familiarizados con el tema. Pensamos que sería útil crear una guía compacta repasando mejores prácticas que tanto equipos dentro de Google como webmasters externos puedan seguir para mejorar el rastreo y la indexación de sus páginas web.

Nuestra Guía de Google para Principiantes sobre Optimización en Motores de Búsqueda trata sobre diferentes áreas en las que los webmasters pueden optimizar sus sitios. Creemos que estos temas (como mejorar las metaetiquetas title y description, estructura de las URL, navegación del sitio, creación de contenido, textos ancla y más) podrán ser de utilidad para webmasters de todos los niveles y sitios de cualquier tamaño. También podrás encontrar muchas ilustraciones, aclaraciones sobre errores comunes a evitar y enlaces a otros recursos que ayudan a ampliar nuestras explicaciones. Tenemos intención de actualizar la guía periódicamente con nuevas sugerencias y mantener los consejos técnicos al día.

Así que la próxima vez que nos hagan la pregunta "Soy nuevo en SEO, ¿cómo puedo mejorar mi sitio?" podemos decir "Bueno, aquí tienes una lista de mejores prácticas que usamos en Google que te puede interesar".

viernes, 21 de noviembre de 2008

Diagnóstico avanzado de páginas web con las Herramientas para Webmasters de Google

Mantener una página web puede ser complicado, por eso ofrecemos las Herramientas para Webmasters que ayudan a los webmasters a reconocer supuestas incidencias antes de que se conviertan en problemas reales. Algunas de las incidencias puede que sean relativamente pequeñas (como la duplicación en títulos y descripciones) [inglés], otras pueden ser mayores (como que tu sitio web no pueda ser rastreado). Aunque las Herramientas para Webmasters de Google no pueden decirte exactamente lo que tienes que cambiar, pueden ayudarte a ver que hay un problema al que necesitas prestar atención.

Vamos a echar un vistazo a varios ejemplos que nos hemos encontrado en los Grupos de Ayuda para Webmasters de Google:

¿Trata tu servidor como a un visitante normal y corriente?

Mientras Googlebot intenta funcionar como un usuario normal y corriente, algunos servidores pueden confundirse y funcionar de formas muy extrañas. Por ejemplo, aunque tu servidor funcione de forma impecable la mayor parte del tiempo, algunos servidores bajo IIS pueden responder con un error de servidor (u otras respuestas relacionadas con un error en el servidor) cuando es visitado por un usuario con el user-agent de Googlebot. En el Centro de Ayuda para Webmasters, hemos visto servidores IIS dando un código 500 (Error en servidor) [inglés] y 404 (Archivo no encontrado) [inglés] en la sección de "Rastreo Web" de Diagnósticos, así como también un código 302 cuando se ha enviado un archivo de Sitemaps [inglés]. Si tu servidor redirige a una página de error, deberías comprobar que podemos rastrear esta página de error y que devuelve el código correcto. Una vez que hayas hecho esto, nosotros también podremos enseñarte esos errores en las Herramientas para Webmasters. Para más información sobre este problema y sus posibles soluciones, consulta http://todotnet.com/archive/0001/01/01/7472.aspx [inglés] y http://www.kowitz.net/archive/2006/12/11/asp.net-2.0-mozilla-browser-detection-hole.aspx [inglés].

Si tu página web está alojada en servidores Microsoft IIS, recuerda también que por defecto las URLs distinguen entre mayúsculas y minúsculas [inglés] (y nosotros también). Esto incluye las URLs en el archivo robots.txt, y es algo con lo que deberías tener cuidado si tu servidor está usando URLs que distinguen entre mayúsculas y minúsculas. Por ejemplo, "disallow: /paris" bloqueará /paris pero no /Paris.

¿Tiene tu sitio web enlaces rotos de forma sistemática?

Los sistemas de gestión de contenido actuales pueden crear de forma muy sencilla problemas que afectan a un gran número de páginas. Algunas veces estos problemas son muy sencillos de encontrar cuando estas visualizando las páginas; otras veces son un poco más difíciles de encontrarlos por ti mismo. Si uno de estos problemas crea un gran número de enlaces rotos, por lo general podrás verlo en la sección "Rastreo Web" de Diagnósticos en tu cuenta de las Herramientas para Webmasters (siempre que esos enlaces rotos devuelvan un código de error 404). En una caso reciente, una página web tenía un pequeño problema de código en su feed RSS [inglés], que daba como resultado unas 60.000 URLs erróneas encontradas y que se mostraban en su cuenta de las Herramientas para Webmasters. Como puedes imaginar, nosotros preferimos estar rastreando contenido en lugar de esos errores 404 :-).

¿Redirige tu sitio web a los usuarios hacia otra parte?

Para algunos sitios web, tiene sentido concentrarse en un grupo de usuarios de una determinada área geográfica. Una forma de hacer esto es redirigir usuarios de otra zona geográfica a una página diferente. Sin embargo, ten en cuenta que Googlebot puede que no rastree dentro del área seleccionada, así que puede que éste también sea redireccionado. Esto significaría que Googlebot no será capaz de acceder a tu página de inicio. Si esto ocurriese, lo más probable es que las Herramientas para Webmasters tengan problemas cuando traten de verificar el código en tu sitio web y cuyo resultado sería un sitio sin verificar [inglés]. Esta no es la única razón por la que un sitio pueda estar sin verificar, pero si notas que esto ocurre habitualmente, es una buena idea investigarlo. Sobre este tema, debes estar seguro de que siempre se trata a Googlebot como a un usuario de esa zona geográfica, sino podría verse como una técnica de encubrimiento [inglés].

¿Está tu servidor no disponible cuando tratamos de rastrear tu web?

Esto puede ocurrirle a los mejores sitios (los servidores pueden caerse y los cortafuegos pueden proteger demasiado). Si esto ocurre cuando Googlebot intenta acceder a tu sitio, no seremos capaces de rastrearlo e incluso notarás que ni lo hemos intentado. Afortunadamente, nosotros hacemos seguimiento de estos problemas y podrás verlo como errores "Red no encontrada" and "robots.txt no encontrado" [inglés] en tu cuenta de las Herramientas para Webmasters cuando no podamos acceder a tu web.

¿Han hackeado tu sitio?

Algunas veces los hackers esconden contenido extraño, no relacionado y con enlaces a páginas web de dudosa calidad. Si está escondido, puede que no lo hayas notado enseguida, pero no obstante, esto puede ser un gran problema. Aunque el Centro de Mensajes puede ofrecerte una advertencia sobre cierto tipo de texto escondido, lo mejor es que además tu le eches un ojo. Las Herramientas para Webmaster de Google pueden enseñarte las palabras clave para tus páginas en la sección "Estadísticas detectadas por Googlebot" [inglés], así que a menudo puedes ver que ha sido hackeado desde esa sección. Si ves que hay palabras clave completamente irrelevantes, puede ser una buena idea investigar qué está pasando. Además puedes configurar Alertas Google o mirar búsquedas como: [site:example.com palabras spam], donde "palabras spam" pueden ser palabras como porn, viagra, tramadol, sex u otras palabras que tu sitio web normalmente no mostraría. Si descubres que tu sitio web ha sido hackeado, te recomiendo revisar nuestro post sobre qué hay que hacer después de haber sido hackeado [inglés].

Hay un motón de problemas que pueden ser encontrados con las Herramientas para Webmasters: estos son algunos de los más comunes que hemos visto últimamente. Y puesto que puede ser realmente difícil reconocer algunos de esos problemas, es una buena idea revisar tu cuenta de las Herramientas para Webamsters y estar seguro de que puedes ver las incidencias antes de que ellas se conviertan en un problema real. Si encuentras algo que no puedes precisar, por qué no publicarlo en el Grupo de discusión y pedir ayuda a los expertos.

¿Has revisado tu sitio últimamente?

jueves, 13 de noviembre de 2008

¿Y si no quiero que salga en Google?

Lo más normal es que las personas quieran que sus páginas web salgan en los resultados de búsqueda de Google. Pero ¿qué se debe hacer cuando uno no quiere que se rastree cierto contenido? ¿Qué pasa si publicaste algo que ahora no quieres que salga en los resultados? Si quieres saber más sobre los métodos para bloquear el rastreo de tu contenido o entender mejor tus opciones para eliminar contenido ya indexado, no te pierdas nuestro cuarto video en la serie sobre las Herramientas para Webmasters.

Cómo prevenir el rastreo de contenido en tu página web (Video IV A)

Versión latinoamericana



Versión castellana



Cómo eliminar contenido de los resultados de búsqueda de Google (Video IV B)

Versión latinoamericana



Versión castellana



Hacemos referencia a los siguientes recursos:

Solicitud de eliminación de contenido.

Artículos en el Centro de Asistencia sobre la prevención y eliminación de contenido en los resultados.

lunes, 10 de noviembre de 2008

Desmitificar la "penalización por contenido duplicado"

Algo está pasando con el contenido duplicado. Seguimos escribiendo sobre esto [inglés], y la gente sigue preguntando. En concreto, sigo escuchando que un montón de webmasters se preocupan por una posible "penalización por contenido duplicado".

Vamos a poner las cartas sobre la mesa de una vez por todas, amigos: No existe una "penalización por contenido duplicado". Al menos, no de la forma en la que la mayoría de la gente habla.

Hay algunas penalizaciones relacionadas con la idea de tener el mismo contenido que otros sitios. Por ejemplo, si estás copiando contenido de otros sitios para volverlo a publicar en el tuyo, o si publicas contenido que no aporta ningún valor añadido. Estas técnicas están claramente definidas (y desaconsejadas) en nuestras Directrices para webmasters:

  • No cree varias páginas, subdominios o dominios que presenten básicamente contenido duplicado.
  • Evite prácticas extendidas como los programas de afiliación con poco o ningún contenido original.
  • Si su sitio participa en un programa de afiliación, asegúrese de que aporte un valor añadido. Proporcione contenido único y relevante que ofrezca a los usuarios una razón para visitar su sitio.

(Ten en cuenta que, si bien no se aconseja copiar contenido, el hecho de que otros te copien a ti es otra historia. Consulta esta entrada [inglés] si estás preocupado por que alguien te pueda copiar).

Pero la mayoría de los propietarios de sitios web que se preocupan por el contenido duplicado no hablan de contenido copiado ni de granjas de dominios, si no de cosas como tener varias URL en un mismo dominio que apuntan a un mismo contenido. Como www.example.com/patines.asp?color=negro&marca=riedell y www.example.com/patines.asp?marca=riedell&color=negro. Tener este tipo de contenido duplicado en tu sitio web puede afectar al rendimiento del mismo, pero no causará su penalización. De acuerdo con nuestro artículo sobre contenido duplicado:

El contenido duplicado de un sitio no implica que deban tomarse medidas al respecto a menos que aparentemente el objetivo sea engañar y manipular los resultados de los motores de búsqueda. Si su sitio tiene problemas relacionados con contenido duplicado y no sigue nuestros consejos anteriores, conocemos muy bien la manera de elegir la versión adecuada para mostrarla en los resultados de la búsqueda.

Este tipo de copia no maliciosa es bastante común, sobre todo porque muchos sistemas de gestión de contenidos (CMS) no las manejan muy bien por defecto. Así que cuando se dice que tener este tipo de contenido duplicado en tu sitio puede afectarte, no es porque vayan a penalizarlo, sino que es simplemente por la forma en la que trabajan los sitios web y los motores de búsqueda.

La mayoría de los motores de búsqueda se esfuerzan por conseguir un cierto nivel de variedad, y quieren mostrar diez resultados diferentes en la página de resultados de búsqueda, no quieren diez URL diferentes con el mismo contenido en cada una de ellas. Con este fin, Google trata de filtrar los documentos duplicados de modo que los usuarios experimenten una menor redundancia. Puedes encontrar más información en esta entrada [inglés], que dice lo siguiente:

  1. Cuando detectamos contenido duplicado, por ejemplo a través de variaciones en los parámetros de la URL, agrupamos las URL duplicadas en un grupo.
  2. Seleccionamos lo que creemos es la "mejor" URL para representar a dicho grupo en los resultados de búsqueda.
  3. A continuación, se consolidan todas las propiedades de las URL del grupo, como por ejemplo la popularidad de los enlaces, para la URL que las representa.

Como webmaster, esto podría afectarte de la siguiente manera:

  • En el paso 2, puede que la URL "más adecuada" para Google no sea la que tu deseas. Si quieres controlar si www.example.com/patines.asp?color=negro&marca=riedell o www.example.com/patines.asp?marca=riedell&color=negro se muestran en nuestros resultados de búsqueda, entonces querrás tomar las medidas necesarias para mitigar los duplicados. Una manera de comunicarnos qué URL prefieres es mediante la inclusión de "URL preferidas" en tu sitemap.
  • En el paso 3, si no somos capaces de detectar todos los duplicados de una página en concreto, tampoco vamos a ser capaces de consolidar todas sus propiedades. Esto puede diluir la fuerza de las señales de ese contenido para su posicionamiento, ya que se va a dividir en varias URL.

En la mayoría de los casos, Google sabe cómo tratar este tipo de duplicados. También hay que tener en cuenta el duplicado de contenido entre dominios. En concreto, no es aconsejable construir un sitio cuya finalidad implique duplicar contenido, si lo que pretendes es establecer un modelo de negocio basado en el tráfico de las búsquedas, a no ser que además vayas a agregar una gran cantidad de contenido con valor añadido para los usuarios. Por ejemplo, es el caso de afiliados de Amazon.com con dificultades para posicionarse, ofreciendo contenido de Amazon únicamente. ¿Se debe esto a que Google no quiere que se venda "Todos hacemos caca"? No, se debe a que no podrán posicionarse mejor que Amazon cuando lo único que proporcionan es el contenido de Amazon. Amazon tiene mucha autoridad en cuanto a ventas en línea (probablemente más autoridad que la de un típico afiliado de Amazon) y, probablemente, los usuarios que utilizan el buscador de Google prefieran la información original en Amazon, a menos que el sitio afiliado haya añadido, además, mucho contenido con valor añadido.

Por último, considera el efecto que puede causar a tu sitio el duplicar contenido. Duplicar contenido puede llevar a que éste se rastree de un modo poco eficiente: cuando Googlebot descubre diez URL en tu sitio, éste tiene que rastrear cada una de ellas antes de saber si tienen el mismo contenido (antes de que podamos agruparlas tal y como se ha descrito antes). Cuanto más tiempo y recursos gaste Googlebot rastreando contenido duplicado en varias URL, menos tiempo tendrá para llegar al resto de tu contenido.

En resumen: Tener contenido duplicado puede afectar a tu sitio de muchas formas pero, a menos que se haya duplicado contenido deliberadamente, es poco probable que el sitio reciba una penalización. Esto significa que:

  • Normalmente no es necesario presentar una solicitud de reconsideración cuando eliminas contenido duplicado.
  • Si eres un webmaster con un nivel de experiencia entre principiante e intermedio, probablemente no es necesario que dediques demasiados esfuerzos al contenido duplicado, ya que la mayoría de los motores de búsqueda tienen los medios necesarios para tratarlo por si mismos.
  • Puedes ayudar a tus colegas webmasters acabando con el mito de las penalizaciones por contenido duplicado. Los remedios para tratar el contenido duplicado están completamente a tu alcance. Esto es una buena
    manera de empezar [inglés].

jueves, 6 de noviembre de 2008

Funcionando en todos los navegadores

Para los internautas, Google Chrome es un nuevo navegador rápido e interesante. Para los webmasters es un buen recordatorio de que, independientemente del navegador que los usuarios utilicen para acceder a tu sitio web (Firefox, Internet Explorer, Google Chrome, Safari, etc.), la compatibilidad con los navegadores tenga una prioridad alta. Cuando tu web carga muy lentamente, o es difícil de usar en diferentes navegadores, corres el riesgo de perder el interés de los usuarios y, si tu web está hecha con fines económicos, quizás también su inversión. Aquí te ofrecemos una lista de puntos básicos para estar seguro de que no se te escapa nada:

Paso 1: Estar seguro de la compatibilidad de los navegadores enfocándose en la accesibilidad

Las mismas técnicas que hacen que tu página web sea más accesible a los motores de búsqueda, como páginas HTML estáticas frente a avanzadas características más avanzadas que tiene AJAX, a menudo también ayudan a la compatibilidad de tu sitio en distintos navegadores y en sus numerosas versiones. A menudo más sencillo hacer compatible un simple HMTL con varios navegadores que las últimas técnicas de diseño web.

Paso 2: Considera validar tu código

Si tu código pasa la validación, ya has eliminado un posible problema en la compatibilidad de los navegadores. Con el código validado [inglés], ya no necesitarás depender de las diferentes formas de tratar los errores que tiene cada navegador. Hay una mayor probabilidad de que tu código funcione en diferentes navegadores y es más sencillo arreglar posibles problemas.

Paso 3: Comprueba que sea usable (además de mostrarse bien)

Es importante que tu sitio web se muestre bien; pero además es igual de importante asegurarse de que los usuarios pueden hacer uso de los servicios de tu sitio desde su navegador. En lugar de dedicarte a mirar las fotos que hay en tu sitio, intenta navegar por las páginas en diferentes navegadores o añadir productos al carrito de la compra. Es posible que el botón o área donde se hace clic puede cambiar de un navegador a otro. Además, si usas JavaScript para componentes como el carrito de la compra, puede que funcione en un navegador pero no en otro.

Paso 4: Elimina los errores

Este paso requiere un poco de "ensayo y error", pero hay algunos buenos sitios que te pueden ayudar a reducir los "ensayos" al mismo tiempo que haces que tu sitio sea compatible en varios navegadores. Doctype es un código abierto de referencia con el que se puede probar la compatibilidad en varios navegadores y además te da pistas y trucos para CSS.

Por ejemplo, digamos que te preguntas cómo encontrar el desplazamiento de un elemento en tu página y te das cuenta de que el código funciona en Internet Explorer, pero no en Firefox y en Safari. Resulta que ciertos navegadores exigen ciertos requisitos en lo que se refiere a encontrar determinar el desplazamiento (menos mal que los colaboradores de Doctype ofrecen un código [inglés] que evita este problema).

Paso 5: ¡Comparte recursos y trucos para la compatibilidad de navegadores!

Nos encanta escuchar los pasos que sigues para asegurarte que tu sitio funciona para la mayoría de tus visitantes. Hemos escrito un artículo más avanzado sobre este tema en el Centro de Ayuda en el que hablamos sobre cosas tan específicas como la codificación de caracteres. Si tienes algún truco adicional, por favor compártelo. Y si tienes alguna duda, ¡por favor pregunta!

lunes, 3 de noviembre de 2008