CSS versus tablas en SEO. Vídeos de Matt Cutts

La pregunta en esta ocasión es CSS o tablas en el diseño de nuestra página web, desde el punto de vista de la optimización para motores de búsqueda (SEO). Matt Cutts os reponde muy rápidamente a esta pregunta, así que tomaros un minutillo porque puede que os hayáis preguntado esto antes. Por supuesto, el vídeo cuenta con los subtítulos en español.



Transcripción de diseño CSS versus tablas:

Thomas desde Cincinnati pregunta, "¿Es una página web diseñada con CSS mejor para SEO que una basada en tablas?"

Francamente, no preocuparía de esto. Vemos las tablas y el CSS, trabajamos con ambos. Así que intentamos evaluarlas, ya sabes, no importa qué tipo de diseño utilices. Francamente, utiliza lo que sea mejor para ti. Mucha gente tiende a utilizar CSS ahora ya que es fácil para cambiar tu sitio web. Es fácil para cambiar el diseño. Muy modular. Mientras que las tablas, tiene algo de, ya sabes, connotaciones web 1.0. Pero si tienes la mejor web, intentaremos encontrarla e intentaremos colocarla arriba sin importar si está basada en tablas o en CSS


lunes, 30 de noviembre de 2009

Usos recomendados de Flash

De vez en cuando recibimos preguntas sobre cuál es la mejor manera de trabajar con Adobe Flash. Pensé que valdría la pena escribir unas cuantas líneas sobre consideraciones a tener en cuenta a la hora de construir un sitio con mucho Flash, de cara a la búsqueda web.

Como muchos ya sabéis, Flash es de por sí un medio visual, y Googlebot no tiene ojos. Googlebot puede leer archivos Flash y extraer el texto y los enlaces, pero faltará estructura y contexto. Por otra parte, el contenido del texto a veces se almacena en Flash como gráficos y, como Googlebot a día de hoy no detecta algorítmicamente estos gráficos, estas palabras claves importantes pueden pasarse por alto completamente. Todo esto significa que incluso si tenemos contenido en Flash en nuestro índice, es posible que falte algo de texto, contenido o enlaces. O peor aún, Googlebot puede entender algunos archivos de Flash, pero no todas las arañas pueden.

Entonces, ¿qué debe hacer un diseñador de páginas web honesto? La única regla es mostrar a Googlebot exactamente lo mismo que a sus usuarios. Si no, tu sitio corre el riesgo de aparecer como sospechoso a los ojos de nuestros algoritmos de búsqueda. Esta regla simple abarca una gran cantidad de casos distintos, como el encubrimiento o cloaking, las redirecciones JavaScript, el texto oculto y las páginas puerta o doorways. Y nuestros ingenieros han reunido algunas otras sugerencias:

1. Trata de usar Flash sólo cuando sea necesario. Muchos sitios con contenidos ricos, como YouTube de Google, usan Flash para contenidos ricos, pero se basan en HTML para el contenido y la navegación. Tú también puedes hacerlo, limitando el contenido en Flash a estos elementos, y no usándolo para contenido y navegación. Además de hacer que tu sitio sea amigable para Googlebot, esto hace también que tu sitio esté accesible a una audiencia más amplia, incluyendo, por ejemplo, las personas con discapacidades que utilizan lectores de pantalla, o usuarios de navegadores antiguos o no estándar, así como los que disponen de conexiones de baja velocidad, como teléfonos o PDA. Además, los usuarios pueden utilizar los favoritos de manera eficaz, y enviar enlaces de tu página a tus amigos.

2. sIFR: Algunos sitios web utilizan Flash para forzar al navegador a mostrar cabeceras, citas u otros elementos textuales de una fuente que el usuario no tiene instalada en su ordenador. Una técnica como sIFR todavía permite leer el contenido aunque no se reconozca Flash, ya que el contenido o la navegación se encuentran en realidad en el código HTML (que se muestra en un objeto de Flash incrustado).

3. Versiones que no están en Flash: Vemos que una forma común de usar Flash es a modo de portada, colocada en la URL principal de un sitio web. Esta introducción Flash enlaza con el contenido en HTML dentro del sitio. En este caso, asegúrate de que existe un enlace HTML normal hacia una página que no sea flash, donde el usuario pueda navegar a través del sitio sin necesitar Flash.

Si tienes otras ideas que respetan las directrices y por las que te gustaría preguntar, no dudes en acudir al Foro de ayuda para webmasters, a la sección de Rastreo, Indexación y ranking. Allí encontrarás muchos usuarios expertos, además de algunos empleados de Google, y entre todos intentaremos aclarar cualquier confusión que pueda haber.

viernes, 27 de noviembre de 2009

Notificación de "nueva versión de software" para tu sitio web

Una de las mejores cosas que tiene trabajar en Google es que nos podemos aprovechar del enorme potencial de la computación para hacer cosas muy interesantes. Una idea que probamos fue la de comunicar a los webmasters sobre los riesgos de que sus sitios web fuesen hackeados [inglés]. Este esfuerzo inicial tuvo el suficiente éxito como para que diésemos un paso más y extendiésemos nuestros esfuerzos para cubrir otro tipo de aplicaciones web, por ejemplo, más sistemas de gestión de contenidos (CMSs), foros/aplicaciones de tablones de anuncios, servicios de estadísticas y muchos más.

Esta vez, sin embargo, nuestro objetivo no sólo es aislar software con vulnerabilidades o que pueden ser pirateados, si no que también queremos notificar a los webmasters de la existencia de nuevas versiones de los software o plugins que utilizan en sus páginas web. Por ejemplo, puede haber un módulo [inglés] de Drupal [inglés] o una actualización de Joomlaextension [inglés] disponible, pero quizás alguien no la haya actualizado todavía. Hay varias razones por la que un webmaster podría no actualizar una nueva versión y una de ellas puede ser que simplemente no sabe que existe. Aquí es donde creemos que podemos ayudar. Esperamos hacer saber a los webmasters sobre las nuevas versiones de sus software enviándoles un mensaje a través de las Herramientas para webmasters. De esta forma pueden tomar una decisión sobre si quieren actualizarlos o no.

Una de las formas de identificar los sitios web a los que avisamos es analizando el código fuente de las páginas web que rastreamos. Por ejemplo, WordPress y otras aplicaciones CMS incluyen un generador de metaetiquetas que especifica el número de versión. Esto ha demostrado ser tremendamente útil en nuestros esfuerzos para notificar a los webmasters. Así que, si eres un desarrollador de software, y quieres que te ayudemos a notificar a tus usuarios sobre nuevas versiones de tu software, una buena forma de empezar podría ser incluir un generador de metaetiquetas que diga el número de versión de tu software. Si eres un desarrollador de plugins o widgets, incluir un número de versión en el código que ofreces a tus usuarios es también una buena forma de ayudar.

Con el tiempo, hemos visto opiniones divididas sobre si es una buena práctica incluir el número de versión en el código fuente, ya que deja a los hackers o algunos gusanos (worm writers) conocer si esa página web puede ser vulnerable a un tipo particular de ataque. Pero como bien ha señalado Matt Mullenweg [inglés], "Donde un posible atacante 1.0 [worm writer] está comprobando los números de versión, el atacante 2.0 está ya probando su resistencia [de un sitio web]...". Mientras tanto, la ventaja de tener un número de versión es que se puede alertar al dueño del sitio web cuando necesitan hacer una actualización. Al final, nos inclinamos a pensar que incluir el número de versión puede hacer más bien que mal.

Nuestro plan es empezar a enviar los primeros avisos pronto y ¡esperamos que los webmasters lo encuentren útil!. Si tienes alguna pregunta o comentario, puedes dejarlo aquí.

jueves, 26 de noviembre de 2009

Los enlaces en los blogroll. Vídeos de Matt Cutts

Tras un breve paréntesis, retomamos los vídeos de Matt Cutts, con sus correspondientes subtítulos en español. En esta ocasión aborda la pregunta de un usuario sobre los enlaces en los blogroll y cómo afectan a la reputación de un sitio web con respecto a los resultados de búsqueda de Google. Destaca el caso de un amigo suyo que perdió el PageRank de 5 a 0 por ese motivo. Esperamos que la respuesta de Matt os ayude a despejar dudas sobre blogrolls y enlaces.



Transcripción Blogroll y la reputación en Google:

Remiz Rahnas de Keral, India pregunta, "Yo tengo un 'blogroll' en mi blog con enlaces a todos los blogs de mis amigos. ¿Afectará eso a la reputación de mi blog en Google? Hace poco mi amigo perdió el PR5 a PR0 por eso."

Ciertamente, a quién enlaces puede afectar a tu reputación. Así que, si estás enlazando a sitios spammy, sitios que consideramos malos, o spammy, esto puede afectar la reputación de tu sitio web. Ciertamente, si estás vendiendo enlaces con un blogroll, puede ser muy arriesgado. Pero solo porque tu amigo perdió un PR5 a PR0, no significa necesariamente que fuera por el blogroll y significa que pensásemos que estaba vendiendo enlaces, ya sabes. Podría ser una cosa temporal con la canonización. Así que no asumiría de forma automática que, "Oh, fue el un blogroll el que hizo eso". Si tienes un blogroll, es mejor que contenga enlaces reales, no enlaces que estás vendiendo secretamente, pero que lo estas llamando blogroll o algo así.

Los blogrolls son cosas que está muy bien tener. Yo tengo uno en mi blog. Así, que no te preocupes por tener uno. Pero, ya sabes, si estas enlazando a spam o cosas que piensas que son de baja calidad, ten en cuenta de que eso puede afectar en cómo percibimos la calidad de tu web.

miércoles, 25 de noviembre de 2009

Accede directamente a la información que deseas desde los fragmentos de búsqueda

Para la mayoría de los resultados de búsqueda, Google te muestra unas líneas de texto para que te hagas una idea sobre lo que trata la página, a esto lo llamamos un "fragmento de búsqueda". Recientemente, hemos mejorado estos fragmentos con dos nuevas características que hacen más sencillo encontrar información que está muy enterrada en la página.

Normalmente, un fragmento de búsqueda muestra como una página, como un todo, está relacionada a tu palabra de búsqueda, sacando el contenido que aparece cerca de la palabra clave. Pero, ¿qué ocurre si sólo una parte de la página es relevante para tu búsqueda?

Es aquí cuando estas nuevas funcionalidades pueden ayudarte, ofreciéndote enlaces que se incluyen en los fragmentos o snippets de las secciones relevantes de la página, haciendo más rápido y sencillo encontrar lo que estás búscando. Imagínate, por ejemplo, que estás investigando sobre las grasas artificiales ("trans fats" en inglés) y el colesterol y sus efectos en el cuerpo humano. Si empezamos con una palabra clave genérica como [trans fats], Google devuelve varios resultados con un montón de información sobre las grasas artificiales en general, incluyendo este resultado de Wikipedia:



Ahora, en el fragmento que se incluye hay enlaces a una sección específica dentro de la página con diferentes subtemas sobre las grasas artificiales. Ya que estamos particularmente interesados en lo que es saludable y lo que no, "Nutritional guidelines" [inglés] será probablemente información relevante para nosotros. Si hacemos clic en este enlace, nos llevará directamente a ésa sección, a mitad de la página.

Ahora imagínate que estás interesado en aprender sobre el colesterol bueno y qué niveles de estos son aceptables, entonces intentaremos una palabra clave más específica, [good cholesterol level] (niveles de colesterol bueno). El primer resultado es de la Asociación Americana del Corazón ("American Heart Association"), con muchísima información sobre los niveles de colesterol. La información específica sobre el buen colesterol ("HDL"), sin embargo, está en una sección titulada "Your HDL (good) cholesterol level" ("tu nivel de colesterol bueno")‎. Ya que esta palabra clave era más específica, el fragmento de este resultado ofrece ahora la opción de "saltar a" esta sección de la página web.



Haciendo clic en "Jump to Your HDL (good) cholesterol level‎" puedes acceder directamente a la información de la página:




Si haces clic en el fragmento "What Your Cholesterol Levels Mean" ("Qué significa tu nivel de colesterol"), te seguirá llevando a la parte de arriba del artículo, como siempre.

Si eres un webmaster y te gustaría que estos enlaces apareciesen en tus páginas web, echa un vistazo a nuestro Blog para Webmasters para más información sobre lo que puedes hacer. Y mientras tanto, esperamos que estas mejoras te ayuden a encontrar la información que estás buscando de forma más rápida.

Publicado por Chris Kern, Snippets Team (Traducido por Esperanza, equipo de Calidad de búsqueda)

martes, 24 de noviembre de 2009

Gestiona tu reputación online en los resultados de búsqueda

Hace unos cuantos años no podía ver el momento de casarme. Estaba enamorada, sí, pero lo más importante, iba a ser cuando adoptara el apellido de mi marido y la gente parara de tener como resultado en Google esa imagen ridícula de mí de la universidad cuando buscaban mi nombre.

Después de unos años trabajando aquí, he aprendido que no tienes que cambiar tu nombre sólo porque aparezcan algunos resultados de búsqueda embarazosos. Aquí tienes algunos trucos para "gestionar tu reputación online", es decir sobre la información que está disponible sobre ti online.

Piénsalo dos veces

El primer paso en la "gestión de la reputación online" es la prevención: Piénsatelo dos veces antes de poner información personal online.

Recuerda que aunque algo puede parecer apropiado por el contexto en el que estás publicándolo, los motores de búsqueda pueden hacer muy fácil encontrar esta información más tarde, fuera de contexto, incluyendo a gente a la cual normalmente no visitaría el sitio web donde lo publicaste en un principio. Traducción: no des por hecho que, porque tu madre no lee tu blog, ella nunca verá ese artículo sobre tu nuevo tatuaje que estás escondiéndole.

Ataja el problema desde la fuente

Si algo que no te gusta ha sido ya publicado, el próximo paso es intentar eliminarlo en el sitio donde aparece. En lugar de contactar inmediatamente con Google, es importante eliminarlo primero desde el sitio web donde ha sido publicado. Google no es dueña de Internet; nuestros resultados simplemente reflejan lo que ya esta ahí fuera, en la web. Tanto si el contenido aparece o no en los resultados de Google, la gente todavía cuenta con la posibilidad de poder acceder, desde la fuente original, a través de otros motores de búsqueda, a través de las redes sociales, etc., si no eliminas ése contenido en el sitio web original. Necesitas atajar esto desde la fuente que está generando el contenido.

  • Si el contenido en cuestión está en un sitio web que te pertenece, es fácil, simplemente elimínalo. Este desaparecerá de los resultados de búsqueda de forma natural después de que rastreemos la página y descubramos el cambio.
  • También es fácil a menudo eliminar el contenido de sitios web no te pertenecen pero en los que tu has puesto contenido, tales como fotos que has subido online, o contenido de tus páginas de perfiles.
  • Si no puedes eliminarlo tu mismo, puedes contactar al webmaster del sitio web y pedirle que elimine el contenido o la página en cuestión.

Después de que tú o el webmaster de la página web haya eliminado o modificado la página, puedes solicitar la eliminación de contenido de Google utilizando nuesta herramienta de eliminación de URL.

Publica información de forma proactiva

Algunas veces, sin embargo, puede que no seas capaz de ponerte en contacto con el webmaster del sitio web o puede que rechacen quitar el contendo en cuestión. Por ejemplo, si alguien ha publicado una mala crítica de tu negocio en un sitio web de críticas de restaurantes, o en un sitio web de quejas de usuarios, ese sitio puede que no desee quitar esa crítica. Si no puedes eliminar el contenido del sitio web, probablemente tampoco serás capaz de quitarlo por completo de los resultados de búsqueda de Google. En su lugar, puedes intentar reducir su visibilidad en los resultados de búsqueda publicando de forma activa información útil y positiva sobre ti o sobre tu negocio. Si puedes hacer que las cosas que la gente vea de ti supere a las cosas que no quieres que vean, serás capaz de reducir el daño que ese contenido negativo o embarazoso puede hacer a tu reputación.

Puedes publicar o fomentar contenido positivo de formas muy diferentes:

  • Crear un perfil de Google. Cuando la gente busque por tu nombre, Google puede mostrar un enlace a tu perfil de Google en nuestros resultados de búsqueda [inglés] y la gente puede hacer clic para ver la información que tu hayas elegido publicar en tu perfil.
  • Si un cliente escribe una crítica negativa sobre tu negocio, puedes preguntar a algunos de tus otros clientes, que están satisfechos con tu empresa, para dar una imagen completa de tu negocio.
  • Si un bloguero está publicando fotos tuyas poco favorecedoras, coge algunas de tus fotos preferidas y publícalas en uno o dos artículos de un blog.
  • Si un periódico escribió un artículo sobre un juicio que ofrece una imagen negativa de ti, pero que posteriormente se falló en tu favor, puedes preguntarles que actualicen el artículo o que publiquen una segunda parte sobre tu exoneración. (Esto puede parecer que no te afecta, pero lo creas o no, hemos recibido muchas peticiones de gente en esta situación).

¡Espero que estos consejos os sean útiles! Y haz una parada si quieres en nuestro foro y comparte tus consejos o experiencias [inglés] sobre cómo has gestionado tu reputación online.

Publicado por Susan Moskwa, Webmaster Trends Analyst (Traducido por Esperanza, equipo de Calidad de búsqueda)

lunes, 23 de noviembre de 2009

Las marcas de agua digital: Ventajas e inconvenientes

¿Cuál es nuestra posición sobre las imágenes con marca de agua digital (watermarked images) en la búsqueda de imágenes? Es un tema complicado. He hablado con Peter Linsley, amigo mío del 'plex, estrella de vídeo y Product Manager para la búsqueda de imágenes, para ver su opinión sobre este tema.

Maile: Bueno Peter... "imágenes con marca de agua digital". ¿Puedes darnos detalles?

Peter: Es normal que los webmasters lo encuentren beneficioso.

Ventajas de las imágenes con marca de agua digital
  • Los fotógrafos pueden pedir reconocimiento por su arte.
  • Disuade del uso desconocido de las imágenes.
Si el tráfico que proviene de la búsqueda web es importante para un webmaster, entonces puede tener en cuenta alguno de estos puntos:

Conclusiones relevantes sobre las imágenes con marca de agua digital

  • Los usuarios prefieren imágenes de gran tamaño y alta resolución.
  • Es más probable que los usuarios hagan clic en miniaturas de calidad en los resultados de búsqueda. Las imágenes de calidad a menudo se presentan mejor en tamaño miniatura.
  • Una marca de agua digital muy fuerte, como texto sobre la imagen o márgenes, son técnicas que pueden distraer mucho y con más probabilidad de hacer que la imagen parezca desordenada cuando se reduzca a tamaño de miniatura.
En resumen, si la funcionalidad de la marca de agua digital reduce la percepción del usuario de la imagen de calidad o de la miniatura de tu imagen, entonces puede los usuarios seleccionen menos tu imagen. Previsualiza tu imagen a tamaño de miniatura para tener una idea de cómo el usuario podría verla.

Maile: Ah, ya veo. Los webmasters preocupados con el tráfico que viene de la búsqueda web probablemente quieran buscar un equilibrio entre lo positivo de la marca de agua digital y las preferencias de los usuarios. Tener en cuenta que los sitios web que utilizan imágenes limpias sin ninguna marca que distraiga tienden a ser más populares y, además, esto puede influir en el posicionamiento. ¿Posicionará Google una imagen de forma diferente sólo porque tiene una marca de agua digital?

Peter: No. La presencia de una marca de agua digital por si misma no hace que una imagen se posicione más arriba o más abajo.

¿Tienes alguna pregunta u opinión sobre este tema? Charlemos en el foro para webmasters.

viernes, 20 de noviembre de 2009

Site Clinic II. Página de inicio, títulos y contenido duplicado


Bienvenidos a la segunda parte del Site Clinic. Esperamos que hayas disfrutado de la primera parte en la que analizamos el sitio web argentino Fundación Huésped. En esta ocasión hemos seleccionado a la organización gubernamental colombiana "Computadores para Educar". Efectuaremos un análisis similar al que ya se hizo en la primera parte.

Nuevamente esperamos que los temas discutidos en estos artículos sean útiles tanto para los webmasters que nos enviaron sus sitios web como para todos los lectores de este blog que deseen mejorar la rastreabilidad e indexación de sus páginas web por los distintos motores de búsqueda. En esta entrada discutiremos errores de DNS, las descripciones y los títulos, contenido duplicado y otros temas relacionados con este sitio web. Esperamos que lo disfrutes y recuerda que tus comentarios son siempre bienvenidos. ¡Así que manos a la obra!

Versión sin www

Una de las primeras pruebas que se deben hacer al analizar un sitio web es determinar si se puede acceder al sitio por la versión con www del dominio y por su versión sin www (por ejemplo si la versión sin www redirige a la versión con www). En el caso de Computadores para Educar, el primer problema que se observa es que la versión sin www del dominio computadoresparaeducar.gov.co no resuelve a ningún servidor. Es interesante porque parece que el registro de DNS que apunta a la dirección IP donde se encuentran los contenidos del sitio está asociado únicamente a la versión www. En esta imagen se puede ver el error que se obtiene al cargar la versión sin www en el navegador Chrome:



Por otra parte, a través de la utilidad ping podemos comprobar la conexión entre mi computador y el dominio que apunta al servidor que aloja el sitio que deseo revisar. Al colocar la línea de comandos "ping -c www.computadoresparaeducar.gov.co" obtenemos una respuesta, mientras que con la versión sin www se obtiene un error:



No todos los visitantes añadirán el prefijo www al nombre del dominio cuando lo colocan en el navegador. Además, tener distintos subdominios para distintos tipos de contenido puede ser útil.

Normalmente, el registro del dominio se hace directamente ante el NIC, en este caso el NIC Colombiano, pero las DNS se configuran normalmente con el servicio de hospedaje. Así que recomendamos comprobar que ambas versiones apuntan al servidor donde se encuentra alojado el contenido con el servicio de alojamiento que ofrece la configuración de las DNS. Es importante tener en cuenta que esto no va a afectar al rastreo o la indexación, sino que se trata más de una cuestión de usabilidad del sitio web.

Metaetiquetas de título de página y de descripción

La segunda prueba que realizamos sobre el sitio web fue determinar que tan descriptivos eran los títulos de las diferentes páginas, así como el contenido de las metaetiquetas "description". Como explicamos en el artículo "Cambio del título y la descripción del sitio en los resultados de búsqueda", normalmente preferimos mostrar las descripciones provenientes de las metaetiquetas para generar los snippets o fragmentos que aparecen en los resultados de búsqueda. Asimismo, un buen título ayuda a sus visitantes a entender rápidamente de qué se trata el contenido de cada página.

En este caso, observamos que algunos títulos son descriptivos, como la página de "Testimonios" que tiene un título muy útil: "Testimonios - PORTAL COMPUTADORES PARA EDUCAR". Sin embargo, al examinar otras páginas en los resultados de búsqueda, encontramos que hay varias páginas con el mismo título y algunas descripciones no son tan útiles, como por ejemplo: "Inicio Arrow CENTRO DE RECURSOS". La imagen a continuación es lo que se ve en este momento:



Y al revisar el código fuente de un par de páginas como las mencionadas anteriormente, nos dimos cuenta de que en ellas, tanto la etiqueta "title" como la metaetiqueta "description" son bastantes genéricas:



Recomendaríamos revisar las distintas páginas que componen el sitio para asegurarse de que cada página contiene un título y una descripción única y adecuada. Como hemos señalado antes, un título adecuado para cada página ayuda tanto a los motores de búsqueda como a los usuarios a entender de qué trata una página. También es útil asegurarse de que se combinan mayúsculas y minúsculas, ya que el uso exclusivo de mayúsculas dificulta la lectura. En la gran mayoría de sistemas de administración de contenidos (CMS) se pueden configurar estas funciones automáticamente.

Indexación del foro

Algo que nos llamó la atención en los resultados de búsqueda de Computadores para Educar fue que el sitio ofrece un foro y algunos recursos multimedia como archivos de audio y de vídeo. Un foro puede ser útil, ya que permite a sus visitantes interactuar con otros usuarios y discutir los contenidos que encuentran, así como tener respuestas a sus preguntas. Sin embargo, es necesario administrar estos foros y evitar que sean abusados por spammers. Una buena estrategia para determinar si este fenómeno ha ocurrido en el foro es efectuar una consulta en Google utilizando el operador site:, acompañado de alguna palabra "sospechosa".

Por ejemplo, utilicemos la abreviatura wow (World of Warcraft). Al efectuar la búsqueda [site:computadoresparaeducar.gov.co wow], aparecen unos resultados sospechosos:



Es probable que algunos usuarios falsos hayan abusado de este foro para colocar enlaces hacia sus sitios web. Me imagino que el webmaster se dio cuenta de este problema porque estos temas han sido eliminados y ya no se encuentran en el foro, pues aparece un mensaje que dice "El tema requerido no existe". Esto está muy bien, pero dado que estos temas ya no se encuentran disponibles es importante que el servidor devuelva un código de estado HTTP 404, para informar a los rastreadores de los motores que búsqueda que estas páginas ya no existen. Existen ciertas herramientas en línea, como http://web-sniffer.net/, que permiten comprobar qué respuesta devuelve el servidor ante una petición HTTP.

Al iniciar sesión en el foro, también hemos visto que está vacío y no hay temas disponibles en este momento. Es importante decidir si deseas mantener el foro o no. Si no deseas continuar teniendo un foro, recomendamos eliminar la instalación phpBB sin contenido. Si deseas mantenerlo, recomendamos crear contenido relevante, así como actualizar a la última versión disponible, para evitar posibles problemas de pirateo (y esto se puede aplicar a cualquier sistema de gestión de contenidos). En general, es importante evitar los perfiles spam.

Contenido duplicado, robots.txt y sitemaps

El siguiente paso en el análisis del sitio Computadores para Educar fue comprobar si existía contenido duplicado y si se le indicaba a los rastreadores qué partes del sitio deberían ser rastreadas o indexadas.

La utilización del operador [site:] es una de las formas de tener una indicación aproximada del volumen de páginas indexadas por los motores de búsqueda para un sitio determinado. En ese caso, efectuamos la búsqueda [site:computadoresparaeducar.gov.co]. Los resultados muestran que, en el caso del buscador Google, hay cientos de miles de documentos indexados. Sin embargo, desde la página principal, da la impresión que el sitio no contenía tantas páginas diferentes. Así que una de las preguntas que surgen es si el webmaster desea que alguna de las páginas no sea indexada.

Al hacer clic en algunos de los resultados, encontramos que daba un error "No está autorizado para ver este recurso. Necesita conectarse." Al hacer una búsqueda exacta con esta frase [site:computadoresparaeducar.gov.co "No está autorizado para ver este recurso"], se puede observar que hay unas 42.000 páginas de este tipo que no deberían ser indexadas, dado que el usuario se encuentra con un error cada vez que intenta acceder a estos recursos desde los resultados de búsqueda:



Una solución a este problema sería colocar una metaetiqueta "noindex" en cada una de estas páginas. Otro buen consejo es asegurarse de que este tipo de contenido devuelve un código de estado 403 cuando los usuarios o los robots acceden a estas páginas.

También es importante comprobar si este sitio dispone de un archivo robots.txt y cómo está configurado (si existe se debe hallar en la raíz del dominio). Al analizar el archivo robots.txt de Computadores para Educar encontramos:

User-Agent: *
Allow: /

Este archivo le dice a todos los rastreadores de todos los motores de búsqueda (*) que pueden rastrear e indexar TODO el contenido de este sitio web (/). Una buena recomendación sería modificar este archivo robots.txt y añadir un enlace al archivo sitemap "Sitemap: ".

Por otra parte, es conveniente crear un archivo Sitemap [inglés] para informar a los rastreadores de las URL que se encuentran disponibles. El protocolo Sitemap [inglés] permite especificar cierta información, como por ejemplo cuándo fueron actualizadas las URL, que tan frecuentemente cambian o la prioridad que deberían tener en relación al sitio completo.

Un punto final que nos gustaría destacar en esta sección es que hay algún problema con el calendario situado al final de la página de inicio. Debido a que el calendario está generado automáticamente y enlaza día a día y mes a mes en un bucle infinito, está generando muchas páginas que no deberían ser ni rastreadas ni indexadas. Si quieren conocer la magnitud del problema, recomendaría utilizar la búsqueda [site:computadoresparaeducar.gov.co inurl:date]. Encontraremos más de 180.000 páginas y la mayoría de ellas, vacías. Nuestra recomendación sería añadir el atributo HTML "nofollow" a los enlaces que salen del calendario, o como alternativa, añadir la metaetiqueta "noindex" a las páginas del calendario. Si ninguna de estas dos soluciones es conveniente, se podría añadir la siguiente línea al archivo robots.txt:

Disallow: /*&date=

Sitio en inglés 100% en Flash

Es útil ofrecer una versión en inglés del sitio para los visitantes que no comprenden la lengua española. Sin embargo, una de las diferencias que existen entre la versión original y la versión en inglés de este sitio web es que esta última versión fue desarrollada completamente en Flash. Si bien es cierto que Google ha mejorado la indexación de este tipo de sitios, en general es recomendable usar texto para los contenidos y usar Flash para animaciones y elementos gráficos. Por ejemplo, con el operador "cache:", es posible observar la versión que Googlebot ha almacenado de esta página Flash. Como se puede ver, la versión de texto está desocupada.

La solución ideal sería traducir el mismo contenido de la versión española al inglés. Otra solución más rápida y efectiva para resolver este problema es utilizar la etiqueta <noembed>. Esta etiqueta permite especificar un contenido alternativo para los navegadores que no son capaces de interpretar objetos incrustados en las páginas. En este caso sería conveniente colocar en esta etiqueta el mismo contenido que se encuentra en Flash, pero en modo de texto.

No sé si ya conoces esto, pero nos gustaría recordar que Google ofrece la posibilidad de instalar un widget para realizar traducciones automáticas en la misma página. Esto puede ser una alternativa a la versión inglesa tan sólo en Flash. Puedes usar esta función para crear opciones multilingües.

Un par de consejos acerca de las imágenes

Para finalizar el Site Clinic de Computadores para Educar, quisiéramos hablar de las imágenes. Por ejemplo, las que se utilizan en páginas como:

http://www.computadoresparaeducar.gov.co/website/es/index.php?option=com_content&task=view&id=258&Itemid=1

El tamaño de las fotografías que se publican es de alrededor de 400 x 300 pixeles, pero su tamaño original es de casi 3000 x 2000 pixeles y de 1.5 megabytes. Dado que hay un par de fotos en esta página con este tamaño, si éstas estuvieran en la página principal, el navegador debería cargar más de 3 megabytes tan sólo parar mostrar estos dos elementos gráficos. Con un editor gráfico gratuito como GIMP [inglés] es posible reducir el tamaño en pixeles de la imagen al espacio que se desea que ocupe en la página y su tamaño en bytes se reducirá también (seguramente pesará menos de 100 kilobytes). Este consejo es útil para reducir ostensiblemente la latencia que experimentan sus visitantes en este tipo de páginas.

Un punto final acerca de las imágenes es que sería conveniente añadir contenido alternativo para los visitantes que utilizan lectores de texto a través del atributo alt. Este texto debería ser tan descriptivo como sea posible de acuerdo al contenido de la imagen.

Texto actual en alguna de las imágenes: alt="Orlando Ayala en CPE"

Hasta aquí llega la segunda parte de nuestro proyecto Site Clinic. Nuevamente, quisiéramos recalcar que estas publicaciones no son un estudio detallado de todos los puntos relacionados con el sitio, sino una serie de recomendaciones generales que podrían ser útiles para muchos webmasters. Si deseas realizar alguna sugerencia, por favor dirígela a nuestro foro, o escríbela en nuestros comentarios.

Publicado por Juan Convers, equipo de Calidad de búsqueda.

jueves, 19 de noviembre de 2009

Traduce tu sitio web con Google y amplia tu audiencia

¿Cuánto tiempo se tardaría en traducir todo el contenido web del mundo en 50 idiomas? Si tuviéramos a todos los traductores del mundo entero trabajando durante todo el día, con la tasa actual de crecimiento de contenido en línea y la enorme cantidad de datos de la web, se necesitarían cientos de años para conseguir tan solo una pequeña parte del total.

Estamos encantados de anunciar un nuevo gadget para traducción de webs de Google Traductor que permite que el contenido de tu web esté disponible en 51 idiomas. Cuando la gente visita tu página, si el idioma (según lo determinado por la configuración del navegador) es diferente al de la lengua de la página, se le pedirá que se traduzca la página automáticamente en su propio idioma. Si el idioma del visitante es el mismo que el idioma de su página, el banner de traducción no aparecerá.

Un usuario de China que visite tu página debería ver este aviso para traducirla al chino.

Después de hacer clic en el botón Traducir, las traducciones automáticas se muestran directamente en la página.

El contenido de la página se traducirá de manera automática a chino
para ese usuario.

Es fácil de instalar. Todo lo que tienes que hacer es cortar y pegar un fragmento en tu página web. Así aumentarás el alcance global de tu blog o página web.

Copia y pega ese fragmento de código en tu web

La traducción automática es práctica y ayuda a ver la esencia de la página que se visita de una forma rápida. Sin embargo, no es el sustituto de la traducción profesional. Esperamos que los traductores profesionales, junto con herramientas de traducción, como Google Translator Toolkit [inglés] y este gadget, seguirán ayudando a hacer el contenidos más accesibles para todos.

miércoles, 18 de noviembre de 2009

Mantente alejado de estafas

Estoy acostumbrado a recibir llamadas de mi familia con preguntas sobre navegadores que se bloquean o sobre sitios web confusos. Sin embargo, recientemente mi madre llamó para preguntar sobre algo que vió en línea, que decía que Google le pagaría miles de dólares por trabajar desde casa y sin tener experiencia. No se lo creyó, pero quería preguntar si era algo verídico.

Mi madre hizo lo correcto siendo escéptica. Con la situación económica actual, muchas personas están buscando maneras de ganar un dinero extra. Lamentablemente, algunos personajes indeseables utilizan esta tendencia como una oportunidad para engañar a gente inocente con estafas y elaborar planes para hacerse rico rápidamente. Estamos viendo casos preocupantes en los que sitios web, correos electrónicos y anuncios afirman que se puede hacer grandes cantidades de dinero desde su casa con muy poco esfuerzo, utilizando los productos y los servicios de Google. Todo esto está diseñado para que parezca que fue escrito por una persona normal, como tú, que tropezó con una increíble oportunidad para hacer sus sueños realidad. Lo que no dicen claramente es que Google no está asociado con estos sitios, ni que pueden añadir cargos extra a tu tarjeta de crédito o hacer un mal uso de tu información personal.

Estamos orgullosos de decir que muchas empresas y personas ganan dinero de forma legítima colocando anuncios en sus sitios web, con Google AdSense, o participando en programas como la Red de Afiliados de Google. Crear un sitio web popular es un trabajo duro: los sitios de éxito ganan dinero escribiendo contenido atractivo, desarrollando aplicaciones útiles y manteniendo activas comunidades de usuarios. Se debe tratar con mucho escepticismo toda afirmación de que se puede pasar de todo esto y hacer mucho dinero mediante la publicación de enlaces, la utilización de sistemas secretos o la ejecución de kits para generar sitios web.

Los spammers intentan llegar a los usuarios mediante la generación de cientos de páginas web y el envío de una avalancha de correos spam, a veces incluso compran anuncios en sitios web de confianza. También se dirigen a otras compañías de Internet populares. Pueden incluir fotos de una familia robadas de otro sitio, o una imagen de un cheque que supuestamente recibieron. Los spammers utilizan una amplia gama de técnicas que tratan de burlar los filtros automáticos para poder llegar a los usuarios. En Google, trabajamos para proteger a los usuarios de estos sistemas mediante el uso de una combinación de herramientas manuales y automatizadas para sacarlos de nuestro índice de búsqueda y de nuestra red de anuncios. Sin embargo, esas estafas tienen como objetivo a muchas empresas y aparecen en diversos lugares de la web, de modo que todos tenemos que colaborar. Google colabora con diversos gobiernos y organismos no gubernamentales de protección al consumidor, tales como la Federal Trade Comission (Comisión Federal de Comercio), que realizan investigaciones detalladas de estos tipos de sistemas.

Cómo identificar estafas:

En general, si parece demasiado bueno para ser verdad, probablemente sea así. A continuación ofrecemos algunos consejos a tener en cuenta:
  • Antes de llenar un formulario o darle a alguien la tarjeta de crédito, haz una búsqueda en la web para ver lo que dicen los demás sobre la empresa y sus prácticas.
  • Ten cuidado con las empresas que realizan cargos iniciales por servicios que Google ofrece en realidad de forma gratuita. Echa un vistazo a nuestra página de soluciones de negocio antes de escribir un cheque.
  • Lee siempre la letra pequeña. Cuidado con los planes para hacerse rico rápidamente, que cobran una cuota inicial muy baja, pero que esconden grandes cargos recurrentes en su tarjeta de crédito o cuenta bancaria.
  • Google no garantiza la primera posición en los resultados de búsqueda o de AdWords. Cuidado con las compañías que dicen garantizar el posicionamiento, que afirman tener una relación especial con Google o realizar un "envío prioritario" a Google. No hay ningún envío con prioridad para Google. De hecho, la única manera de enviar un sitio directamente a Google es a través de nuestra página Incluye tu URL en Google o mediante Sitemaps. Y puedes hacer estas tareas tu mismo, sin costo alguno.
  • A veces se utiliza la palabra "Google" o cualquier otra marca junto con frases específicas, como "efectivo", "día de pago", "dinero", "secretos", "trabajar desde casa", etc. Si no puedes encontrar este servicio en nuestra lista de productos de Google o en la página de soluciones de negocio, no confíes en él.
  • Verifica la información con terceros. Los estafadores pueden cortar y pegar imágenes en un sitio para añadir "Visto en TV", "opiniones con 5 estrellas" o añadir los logotipos de los canales de noticias conocidos. Los productos que realmente han sido recomendadas por los expertos y otros usuarios suelen contener enlaces a sitios de noticias legítimos y sitios de opinión con las opiniones de muchos usuarios.
  • Sé tan escéptico con el correo no deseado sobre cómo hacer dinero con Google AdWords, como lo eres con la dieta a base de píldoras para "quemar la grasa por la noche", o las solicitudes para ayudar a transferir fondos de antiguos dictadores. En general, desconfía de ofertas de empresas que surgen de la nada. Sorprendentemente, nosotros también recibimos este tipo de mensajes:
"He visitado su sitio web y hemos comprobado que no figuran en la mayoría de los principales motores de búsqueda y directorios ..."
  • Google no está llevando a cabo una lotería, y no hemos elegido tu dirección de correo electrónico para ganar millones de dólares. No proporciones datos bancarios a través de correo electrónico esperando un gran premio.

Qué puedes hacer:
  • Si te encuentras con muchos sitios con contenido duplicado o plantillas comunes destinados a los usuarios, con un mismo producto o sistema, por favor háznoslo saber con un informe de spam.
  • Si te han contactado para que coloques enlaces sospechosos a cambio de dinero, háznoslo saber mediante el informe de enlaces pagados. Si estás a cargo de tu propio sitio web o de anunciarte en un sitio, piensa detenidamente antes de aceptar anuncios o entrar en programas de afiliación que permitirán el acceso de tus usuarios a programas como los mencionados anteriormente.
  • Si en los foros de tu sitio web o en las secciones de comentarios se han difundido falsas ofertas de lucro, puede que debas tomar medidas contra el spam en los comentarios de tu sitio. Los spammers aprovechan cualquier sección de contenido generado por usuarios, e incluso pueden generar miles de perfiles de usuarios falsos para tratar de colarse.
  • Si recibes mensajes sospechosos que dicen ser de Google, puede tratarse de un intento de phishing. Puedes informarnos enviando un mensaje a phishing@google.com.

lunes, 16 de noviembre de 2009

Nueva interfaz de palabras claves

Nuestro equipo pasó un Halloween estupendo y esperamos que tu también lo hayas hecho. Sí, la foto de debajo es de nuestro equipo, nos tomamos los disfraces de Halloween muy seriamente :)



Como regalo de después de Halloween , estamos encantados de anunciar una nueva interfaz de palabras claves para nuestros usuarios. Ahora, actualizaremos la información diariamente, ofreciendo detalles sobre la frecuencia con la que nos encontramos una palabra clave específica y mostrando un puñado de URL que las contienen. En la columna de "Importancia" compara la frecuencia de una palabra calve con la frecuencia de la palabra más popular en tu sitio web. Cuando haces clic en una palabra clave para ver más información, verás una lista de 10 URL que contienen esa palabra clave.

Esto será útil cuando reimplementes tu sitio web con una nueva tecnología o necesites identificar qué URL han podido ser hackeadas. Por ejemplo, si notas que tu sitio web aparece en resultados de búsqueda para términos totalmente fuera de contexto al tema de tu sitio web (por ejemplo, "Viagra" o "casino"), puedes utilizar esta funcionalidad para encontrar esas palabras claves e identificar las páginas que las contienen. Esto te permitirá eliminar el contenido hackeado más rápidamente.





¡Haznos saber qué opinas!

Publicado por Kurt Dresner, Tanya Gupta, y Sagar Kamdar, Webmaster Tools team (Traducido por Esperanza, equipo de Calidad de Búsqueda)

viernes, 13 de noviembre de 2009

Utilización de feeds de RSS/Atom para descubrir URL nuevas

Google usa muchas fuentes diferentes para encontrar páginas web nuevas, como enlaces que encontramos en la web o URL que nos envían. Queremos descubrir esas nuevas páginas lo más rápidamente posible, para que nuestros usuarios puedan encontrar contenido nuevo en los resultados de búsqueda poco tiempo después de que éste se haya generado. Recientemente estrenamos una función que utiliza feeds de RSS/Atom para descubrir nuevas páginas web.

Los feeds de RSS/Atom han sido muy populares estos últimos años como mecanismo de publicación de contenido. Permiten a los lectores a comprobar si hay nuevo contenido publicado. La utilización de feeds para descubrimiento de contenido nuevo nos permite obtener estas nuevas páginas e indexarlas de una forma más rápida que con los métodos de rastreo tradicionales. Podemos usar muchas fuentes para acceder a las actualizaciones de feeds como Reader, servicios de notificación o rastreos de feeds. Además, en el futuro también podríamos explorar mecanismos como PubSubHubbub con el fin de identificar elementos actualizados.

Para poder utilizar los feeds de RSS/Atom para descubrir nuevo contenido, es importante que se rastreen los archivos (no debe estar desactivada la función de rastreo en el archivo robots.txt). Para saber si Googlebot puede rastrear tus feeds y encontrar tus páginas de la manera más rápida posible, prueba las URL de tu feed con la herramienta de prueba de robots.txt en las Herramientas para webmasters de Google.

jueves, 12 de noviembre de 2009

¡A ver dónde está ese malware!

Este artículo se publicó como parte del Cyber Security Awareness Month (Mes de la seguridad en Internet) en Google Online Security Blog [inglés]. En él se destacan trucos de seguridad en Internet para ayudarte a tomar las medidas necesarias para proteger tu ordenador, tu sitio web y tu información personal. Para trucos generales de seguridad en Internet también puedes consultar nuestra serie sobre seguridad online [inglés] o visitar el sitio http://www.staysafeonline.org/ [inglés]. Además, anteriormente ya publicamos en este blog una entrada sobre malware en las Herramientas para webmasters.

Para proteger a los usuarios de las amenazas del malware, Google ha creado escáneres [inglés] que detectan malware en los sitios que hemos indexado de forma automática. Se colocan avisos en los resultados de búsqueda de Google para las páginas web que se identifican como peligrosas. Navegadores como Google Chrome, Firefox y Safari también utilizan nuestra información para mostrar avisos similares a los usuarios que intentan visitar sitios sospechosos.

Por una parte es importante proteger a los usuarios, pero también sabemos que la mayoría de estos sitios no están distribuyendo malware de forma intencionada. Entendemos la frustración de aquellos webmasters cuyos sitios web se han visto expuestos, sin ellos saberlo, y que descubren que sus sitios web han sido marcados con estos avisos. Ofrecemos activamente ayuda a estos webmasters: enviamos emails a los administradores de los sitios web cuando encontramos contenido sospechoso, ofrecemos una lista de páginas infectadas a través de las Herramientas para webmasters y contamos con un servicio que permite a los webmasters notificarnos cuando han limpiado sus sitios web.

Estamos contentos de anunciar que hemos lanzando unas funcionalidades que permiten a Google ofrecer incluso más ayuda a los webmasters. Ahora las Herramientas para webmasters ofrecen a estos con muestras del código malicioso que los escáneres de Google detectan en sus sitios web de forma automática. Estas muestras, que normalmente tienen la forma de etiquetas de HTML inyectado, JavaScript o archivos Flash incrustados, están disponibles en “Detalles de Malware” dentro de la sección Labs en las Herramientas para webmasters. Los webmasters registrados (este registro es gratuito) de los sitios web infectados no necesitan activar la funcionalidad de detección de malware, ya que se encontrarán con esos enlaces en la consola de las Herramientas para webmasters. Los webmasters verán una lista de las páginas web que están relacionadas con la distribución de malware y muestras del contenido malicioso que los escáneres de Google encontraron en cada página infectada. En algunas ocasiones podemos identificar las causas de este código malicioso y ofrecemos detalles cuando es posible. Esperamos que esta información adicional ayude a los webmasters, así como a los visitantes de dichos sitios.

Detalles de malware en tu sitio web

Detalles de malware para una página en concreto

Y aunque estamos muy contentos de ofrecer esta nueva funcionalidad, avisamos a los webmasters que utilicen esta herramienta sólo como punto de partida en el proceso de limpieza. Los escáneres de Google quizás no sean capaces de ofrecer muestras de malware en todos los casos y estas muestras pueden que no sean todas las muestras de malware que puede haber en una página. Incluso más importante, avisamos que no sólo se limpie los ejemplos que se muestran en las Herramientas para webmasters. Si la vulnerabilidad existente no se identifica y se arregla, es posible que el sitio web se vea atacado de nuevo.

Además de ayudar a los webmasters con los avisos de malware, esta nueva información detallada está diseñada para promover la salud general de la web. En algunos casos, nuestros escáneres encuentran contenidos de dudosa fiabilidad en un sitio web, pero no tenemos suficiente información para añadirlo a la lista de malware. Esta nueva funcionalidad de “Detalles de Malware” avisará de estos a los webmasters por anticipado para ayudarles a identificar y abordar vulnerabilidades de seguridad de una forma más rápida.

Esperamos que no tengas que utilizar nunca esta funcionalidad, pero si lo haces, esto puede ayudarte a limpiar el malware de tu sitio web de forma más rápida, así como a proteger a tus usuarios. Estamos planeando mejorar nuestros algoritmos en los próximos meses para ofrecer mayor cobertura y precisión para la identificación de las vulnerabilidades, así como más rapidez a la hora de informar a los webmasters.

martes, 10 de noviembre de 2009

Una actualización sobre los "Rich Snippets"

En primavera anunciamos los "Rich Snippets" los cuales hacen posible mostrar información estructurada de tus páginas en los resultados de Google.


Estamos convencidos que esta información estructurada hace la web mejor y estamos trabajando duro para expandir los "Rich Snippets" a más resultados de búsqueda y recoger tus opiniones en este proceso. Si tienes contenido como reseñas [inglés] o información sobre gente o redes sociales [inglés] en tu sitio web, es más fácil que nunca marcar este contenido con los microformatos o RDFa, así Google puede entenderlos mejor para generar "Rich Snippets" útiles. Os mostramos algunas mejoras de nuestra parte que permitirán marcar tu contenido:

Herramienta de prueba. Mira lo que Google es capaz de extraer y previsualiza como las páginas con microformatos o RDFa se mostrarían en los resultados de Google. Prueba tus URL en la Herramienta de prueba de los "Rich Snippets" [inglés].


Los usuarios del motor de búsqueda personalizado de Google, Google Custom Search, pueden además usar la Herramienta de prueba de los "Rich Snippets" para probar los marcadores usados en sus Motores de búsqueda personalizados [inglés].

Mejor documentación. Estamos ampliando nuestra documentación para incluir nuevas secciones de Trucos y Consejos [inglés] y Preguntas frecuentes [inglés]. Ahí responderemos a los puntos que crean más confusión y ofreceremos instrucciones sobre cómo aumentar la posibilidad de tener "Rich Snippets" en tu sitio web.

Ampliar el soporte RDFa. Como complemento al formato RDFa Person [inglés], hemos añadido soporte a los campos correspondientes de los vocabularios de FOAF [inglés] y vCard [inglés], para todos aquellos que han preguntado por esto.

Vídeos. Si tienes vídeos en tu página web, ahora puedes marcar este contenido para que ayude a Google a encontrarlos.

Como ya hemos dicho antes, marcar tu contenido no garantiza que vayamos a mostrar los "Rich Snippets" para tu sitio web. Continuaremos ampliando esta funcionalidad de forma gradual para asegurar una buena experiencia al usuario cuando los "Rich Snippets" se muestran en los resultados de búsqueda.

lunes, 9 de noviembre de 2009

Propuesta para hacer AJAX rastreable

Estamos entusiasmados de poder proponer un nuevo estándar para poder hacer rastreables los sitios web basados en AJAX. Esto beneficiará a webmasters y usuarios, por hacer que contenidos ricos e interactivos basados en AJAX estén disponibles de manera universal a través de los resultados de búsqueda o de cualquier motor de búsqueda que participe. Creemos que hacer disponible este contenido para rastreo e indexación puede mejorar de manera significativa la web.

Si bien las páginas web basadas en AJAX son populares entre los usuarios, los motores de búsqueda tradicionales no son capaces de acceder a este tipo de contenido. La última vez que revisamos, casi el 70% de los sitios web que conocemos utilizaban JavaScript de alguna manera. Por supuesto, la mayoría de ese JavaScript no es AJAX, pero cuanto mejor se pueda rastrear e indexar AJAX, más desarrolladores podrán añadir características más completas a sus sitios web y seguir apareciendo en los motores de búsqueda.

Algunos de los objetivos que queremos alcanzar con esta propuesta son:
  • Realizar cambios mínimos que son necesarios conforme crece la web.
  • Visualización de un mismo contenido por parte de usuarios y motores de búsqueda (no encubrimiento o cloaking).
  • Posibilidad por parte de los motores de búsqueda de enviar a los usuarios directamente a la URL de AJAX (no a una copia estática).
  • Verificación de sitios web en AJAX por parte de los propietarios de una forma correcta, de manera que el rastreador tenga acceso a todo el contenido.
Así es como los motores de búsqueda rastrean e indexan AJAX de acuerdo con nuestra propuesta inicial:
  • Modificar ligeramente los fragmentos de URL para obtener páginas AJAX con estado: Las páginas en AJAX con estado muestran el mismo contenido cada vez que se accede a éste directamente. Se trata de páginas que podrían aparecer en los resultados de búsqueda. En lugar de una URL como http://example.com/page?query#state, nos gustaría añadir una marca para poder reconocer estas URL: http://example.com/page?query#[FRAGMENTTOKEN]state. Basándonos en una revisión de las URL que actualmente hay en la web, se propone utilizar "!" (Un signo de exclamación) para marcarlas. La URL propuesta que podría mostrarse en los resultados de búsqueda sería entonces: http://example.com/page?query#!state.
  • Utilizar un navegador sin interfaz gráfica que produzca una instantánea en HTML en el servidor web: El navegador sin interfaz gráfica se utiliza para acceder a la página AJAX y genera el código HTML basado en el estado final del navegador. Sólo las URL especialmente etiquetadas se pasan al navegador sin interfaz gráfica para que se procesen. Al hacer esto, por parte del servidor, el propietario del sitio web controla el código HTML que se genera y se puede verificar fácilmente que el JavaScript se está ejecutando correctamente. Un ejemplo de navegadores de este tipo es HtmlUnit, un navegador de código abierto para programas Java sin interfaz gráfica.
  • Permitir que los rastreadores de los motores de búsqueda accedan a estas URL omitiendo el estado: Como los fragmentos de URL no se envían con las solicitudes a los servidores, es necesario modificar ligeramente la dirección URL utilizada para acceder a la página. Al mismo tiempo, esto indica al servidor que utilice el navegador sin interfaz gráfica para generar código HTML en lugar de devolver una página con JavaScript. Otras URL existentes (como las que utilizan los usuarios) se procesan con normalidad, evitando el navegador sin interfaz gráfica. Proponemos omitir la información de estado y agregarla a los parámetros de consulta con un símbolo. Utilizando el ejemplo anterior, una URL sería http://example.com/page?query&[QUERYTOKEN]=estado. Basándonos en nuestro análisis actual de las URL en la web, proponemos utilizar "_escaped_fragment_" como fragmento. La dirección URL propuesta sería entonces http://example.com/page?query&_escaped_fragment_=state.
  • Mostrar la URL original a los usuarios en los resultados de búsqueda: Para mejorar la experiencia del usuario, tiene sentido enviar a los usuarios directamente a las páginas en AJAX. Esto se puede lograr mostrando la URL original (como http://example.com/page?query#!state de nuestro ejemplo anterior) en los resultados de búsqueda. Los motores de búsqueda pueden comprobar que el texto indexable devuelto a Googlebot es el mismo o un fragmento de texto que se devuelve a los usuarios.

En resumen, a partir de una URL con estado como http://example.com/dictionary.html#AJAX, podría estar disponible tanto para los rastreadores como para los usuarios http://example.com/dictionary.html#!AJAX, que podría ser rastreado como http://example.com/dictionary.html?_escaped_fragment_=AJAX, que a su vez se mostraría a los usuarios y sería accesible como http://example.com/dictionary.html#!AJAX


Actualmente estamos trabajando en una propuesta y un prototipo de aplicación. Se agradecerán todos los comentarios que nos hagáis. No dudéis en añadir vuestras opiniones en la sección de comentarios a continuación, o en nuestro Foro para webmasters. ¡Gracias por vuestro interés en hacer una web basada en AJAX accesible y útil a través de los motores de búsqueda!

viernes, 6 de noviembre de 2009

Verificación de blogs de Blogger en las Herramientas para webmasters


Quizás estés al tanto de nuestro comunicado reciente sobre cambios en el sistema de verificación en las Herramientas para webmasters. Uno de los efectos secundarios de este cambio es que algunos blogs de Blogger, que no han sido verificados todavía, tendrán que usar la verificación mediante metaetiquetas en lugar del método integrado en la plataforma de Blogger. El enlace de autoverificación de las Herramientas para webmasters en la plataforma de Blogger no está operativo y desaparecerá pronto. Estamos trabajando para reintegrar, en un futuro, un sistema de verificación automático para los blogs de Blogger, pero mientras tanto queremos que estés al tanto de los pasos necesarios para verificar tu blog de Blogger en las Herramientas para webmasters.

Instrucciones, paso a paso:

En las Herramientas para webmasters:
  • Haz clic en el botón “Añadir un sitio...” en la página de inicio de las Herramientas para webmasters.
  • Añade la URL de tu blog (por ejemplo, googlewebmaster-es.blogspot.com) y haz clic en el botón "Continuar" para acceder a la página en la que podrás verificarlo.
  • Selecciona el método de verificación "Metaetiqueta" y copia la metaetiqueta que se ofrece.
En Blogger:
  • Accede a tu blog e inicia sesión.
  • Desde la plataforma de Blogger, haz clic en el enlace “Diseño” del blog que estás verificando.
  • Haz clic en el enlace “Edición de HTML”, en la pestaña “Diseño”, que te permite editar el HTML de la plantilla de tu blog.
  • Pega la metaetiqueta (copiado en el paso 3) inmediatamente después del elemento que encontrarás en la plantilla HTML y haz clic en el botón “GUARDAR".
En las Herramientas para webmasters:
  • En la página de verificación, confirma que se ha seleccionado "Metaetiqueta" como método de verificación y haz clic en el botón “Verificar”.
Tu blog debería estar verificado ahora. ¡Ya estás listo para empezar a utilizar las Herramientas para webmasters!

jueves, 5 de noviembre de 2009

Contenido duplicado y problemas de sitios múltiples

Durante el último Search Engine Strategies en la conferencia de San José presenté Contenido duplicado y problemas de sitios múltiples [inglés]. Para aquellos que no pudieron asistir a la conferencia vamos a reproducir la charla en este vídeo en el canal de Google Webmaster Central de YouTube. Este vídeo cuenta con los subtítulos en español:


Y aquí puedes consultar la presentación, también disponible en español.

lunes, 2 de noviembre de 2009