Prácticas recomendadas contra el hacking

Hoy en día la mayoría de las páginas web se construyen en torno a aplicaciones que proporcionan servicios de calidad a los usuarios. En concreto, se utilizan mucho para crear, editar y administrar el contenido. Debido a la naturaleza interactiva de estos sistemas, donde el contenido de los usuarios es fundamental, es importante pensar en la seguridad a fin de evitar ataques por parte de terceros, así como para garantizar una buena experiencia a los usuarios.

Algunos tipos de intentos de hacking y cómo prevenirlos

Hay muchos tipos diferentes de ataques que los hackers pueden llevar a cabo para controlar total o parcialmente un sitio web. En general, los más comunes y peligrosos son los de inyección de SQL y de cross-site scripting (XSS).

La inyección de SQL es una técnica que inyecta código malicioso en una aplicación web, aprovechando una vulnerabilidad en seguridad a nivel de base de datos, con la intención de cambiar su funcionamiento. Es una técnica poderosa, ya que puede manipular tanto las URL (cadenas de consulta) como cualquier otra formulario (registro de correo electrónico, inicio de sesión, búsqueda) para inyectar código malicioso. Puedes encontrar algunos ejemplos de inyección de SQL en el Web Application Security Consortium [inglés].

Hay algunas precauciones que pueden tomarse para evitar este tipo de ataques. Por ejemplo, es una buena práctica agregar una capa entre un formulario visible y la base de datos. En PHP, la extensión PDO [inglés] se usa a menudo para trabajar con parámetros (a veces llamados variables bind o placeholder) en lugar de incrustar el contenido del usuario en la declaración. Otra técnica muy fácil es escapar caracteres, donde todos los caracteres peligrosos que pueden tener un efecto directo sobre la estructura de base de datos se escapan. Por ejemplo, cada comilla simple ['] en un parámetro se debe sustituir por dos comillas simples [''] para formar una cadena literal de SQL válida. Estas son sólo dos de las acciones más comunes que puedes tomar para mejorar la seguridad de un sitio web y evitar las inyecciones SQL. En Internet puedes encontrar muchos recursos que se ajustan a tus necesidades (lenguajes de programación, aplicaciones web específicas, etc).

La otra técnica de la que vamos a hablar aquí es cross-site scripting (XSS). XSS es una técnica que inyecta código malicioso en una página web, aprovechando una vulnerabilidad de seguridad de las aplicaciones. Este tipo de ataque es posible cuando una aplicación web procesa datos obtenidos a través del contenido introducido por los usuarios y sin ningún tipo de verificación o validación antes de devolver datos al usuario final. Puedes encontrar algunos ejemplos de cross-site scripting en el Web Application Security Consortium [inglés].

Hay muchas maneras de proteger una aplicación web de esta técnica. Algunas de las acciones más sencillas que se pueden llevar a cabo son:
  • Extracción de los datos que se pueden insertar en un formulario (por ejemplo, consulta la función strip tags [inglés] en PHP);
  • Utilización de los datos de codificación para evitar la inyección directa de caracteres potencialmente maliciosos (por ejemplo, véase la función htmlspecialchars [inglés] en PHP);
  • Creación de una capa entre la entrada de datos y el final del proceso (back-end) para evitar la inyección directa de código en la aplicación.
Algunos recursos sobre seguridad en CMS

La inyección de SQL y de cross-site scripting son sólo dos de las muchas técnicas utilizadas por los hackers para atacar y explotar sitios inocentes. Como norma general en materia de seguridad, es importante estar siempre actualizado sobre estas cuestiones y, en particular, cuando se utiliza software de terceros, para asegurarte de que has instalado la última versión disponible. Muchas aplicaciones web están construidas en torno a las grandes comunidades, que ofrecen apoyo y actualizaciones constantes.

Por ejemplo, cuatro de las mayores comunidades de sistemas de gestión de contenidos de código abierto (Joomla, Wordpress, PHP-Nuke y Drupal) ofrecen indicaciones de seguridad en sus sitios web y albergan una gran comunidad de foros en los que los usuarios pueden exponer sus problemas así como buscar ayuda. Por ejemplo, en la sección Hardening WordPress [inglés] de su sitio web, WordPress ofrece una amplia documentación sobre cómo fortalecer la seguridad de tu CMS. Joomla ofrece muchos recursos de seguridad, en particular, una lista completa de tareas [inglés] que los webmasters deberían realizar para mejorar la seguridad de un sitio web basado en Joomla. En el sitio de Drupal, tienes acceso a información sobre seguridad en la sección Security [inglés]. También puedes suscribirte a su lista de correo sobre seguridad que se actualiza constantemente con temas actuales. PHP-Nuke ofrece documentación sobre seguridad [inglés] en el capítulo 23 de su sección How to, dedicada a la gestión del sistema de esta plataforma CMS. También tienen una sección llamada Hacked - Now what? [inglés], con directrices para resolver los problemas relacionados con el hacking.

Algunas formas de identificar el pirateo de su sitio

Como ya se ha mencionado, existen muchos tipos diferentes de ataques que hackers informáticos pueden realizar en un sitio web y hay diferentes métodos para aprovecharse de un sitio web inocente.

Cuando los hackers son capaces de tomar el control completo de un sitio, lo pueden desfigurar (cambiando la página de inicio), borrar todo el contenido (bajando las tablas de tu base de datos), o insertar un programa malicioso o un roba cookies. También pueden utilizar un sitio para web spam, ocultando los enlaces que apuntan a recursos spam o la creación de las páginas que redireccionan a sitios con malware. Cuando estos cambios son evidentes (como cuando las desfiguran), puedes darte cuenta fácilmente de esta actividad, pero hay otros tipos de ataques, en particular aquellos con intención de spam, que no serán tan evidentes. Google, a través de algunos de sus productos, ofrece a los webmasters algunas formas de detectar si un sitio web ha sido hackeado o modificado por un tercero sin autorización. Por ejemplo, mediante el uso de Google Search puedes detectar las típicas palabras claves añadidas por los hackers a tu sitio web e identificar las páginas afectadas. Simplemente abre google.com y busca con site: en tu sitio web, buscando por palabras clave comerciales que utilizan los hackers para spam (como viagra, porno, mp3, apuestas, etc):

[site:example.com viagra]

Si no estás familiarizado con el operador de búsqueda site:, esta es una forma de consulta en Google que restringe tu búsqueda a un sitio web específico. Por ejemplo, la búsqueda site:googleblog.blogspot.com sólo devolverá los resultados del blog oficial de Google. Al añadir palabras clave spam a este tipo de consulta, Google mostrará todas las páginas indexadas de tu sitio web que contienen las palabras clave spam y que están, muy probablemente, hackeadas.

Para comprobar estas páginas sospechosas, simplemente abre la versión caché propuesta por Google y serás capaz de detectarlas, si es que las hubiese. Entonces, podrás limpiar tus páginas afectadas y además mirar si existe alguna anomalía en los archivos de configuración de tu servidor web (por ejemplo, en servidores web Apache: .htaccess y httpd.conf). Si tu sitio no aparece en los resultados de búsqueda de Google, podría significar que Google ya ha descubierto las malas prácticas en tu sitio web como consecuencia del ataque y podría haberlo quitado temporalmente de nuestro índice, debido a la violación de nuestras directrices de calidad para webmasters.

A fin de mantener siempre un ojo en la presencia de palabras clave sospechosas en tu sitio web, puedes también utilizar las alertas de Google para supervisar búsquedas como: site:example.com viagra O casino O porno O tonos web: recibirás un aviso por correo electrónico siempre que estas palabras clave se encuentren en el contenido de tu sitio.

También puedes utilizar las Herramientas para webmasters de Google para detectar cualquier actividad hacking en tu sitio web. Las Herramientas para webmasters proporcionar estadísticas sobre las búsqueda más habituales de tu sitio. Esta información te ayudará a controlar si tu sitio web está mostrándose por palabras claves sospechosas no vinculadas con este.

La información en la sección "Lo que Googlebot ve" es también muy útil, ya que verás si Google detecta cualquier palabra clave inusual en tu sitio web, independientemente de si está mostrándose en los resultados por estas o no. Si tienes una cuenta de las Herramientas para webmasters y Google considera que tu sitio ha sido hackeado, a menudo se te notifica de acuerdo con el tipo de ataque que haya sufrido tu sitio web:
  • Si un tercero está utilizando tu sitio web para comportamientos spam (como la ocultación de enlaces o la creación páginas spam) y ha sido detectado por nuestro rastreador, a menudo se te notificará en el Centro de mensajes con información detallada (una de las URL hackeadas o texto ancla de los enlaces ocultos);
  • Si tu sitio es utilizado para colocar un programas maliciosos, como el malware, verás un aviso de malware en la página de "Vista general" en tu cuenta de las Herramientas para webmasters.
Comportamiento hackeado eliminado, ¿ahora qué?

¿Tu sitio web ha sido hackeado o está ofreciendo malware? Primero, limpia el malware y, a continuación, haz alguna de las siguientes cosas:
  • Si tu sitio web fue hackeado por razones de spam, por favor visita nuestra solicitud de reconsideración a través de las Herramientas para webmasters para solicitar la reconsideración de tu sitio;
  • Si tu sitio estaba sirviendo malware a los usuarios, por favor, envia una solicitud de reconsideración de malware desde la página "Visión general" de las Herramientas para webmasters.
Esperamos que encuentres estos consejos útiles. Si deseas compartir tus propios consejos o experiencias, te invitamos a dejar un comentario aquí. ¡Gracias!

lunes, 30 de marzo de 2009

Elemento enlace canónico: presentación en el SMX West

Hace un tiempo, Google y otros motores de búsqueda [inglés] anunciaron el respaldo al elemento enlace canónico que puede ayudar a los dueños de sitios web con problemas con contenido duplicado. He recreado mi presentación del SMX West [inglés] y puedes verla aquí abajo (con subtítulos en inglés y en español):



Puedes acceder a las diapositivas de la presentación directamente o seguirlas abajo:



Por cierto, Ask también ha anunciado que apoyarán el elemento enlace canónico. Para saber más lee la entrada del blog de Ask.com [inglés].

Gracias de nuevo a Wysz [inglés] por convertir esto en un gran vídeo.

Por otra parte, puede que no se hayan enterado pero hemos estrenado recientemente el canal de vídeos para webmasters en Youtube. Si estás interesado puedes ver este nuevo canal. Si te suscribes, siempre estarás al tanto de los nuevos vídeos sobre webmasters de Google.

jueves, 26 de marzo de 2009

Presentamos el Canal de YouTube de Google Webmaster Central

En su presentación State of the Index [inglés], Matt Cutts dijo que una de las cosas en las que Google seguiría trabajando en el 2009 era en la comunicación con los webmasters. En el equipo de Webmaster Central hemos descubierto que los vídeos son una gran forma de llegar a la gente. Y así, hemos dado instrucciones paso a paso [inglés] de cómo utilizar las Herramientas para webmasters (también tenemos disponible una serie entera en español) y hemos compartido nuestras presentaciones [inglés] con aquellos que no pudieron asistir a las conferencias.

Estamos planeando lanzar más vídeos como estos en un futuro, así que hemos abierto nuestro propio canal de Youtube para subir los vídeos relacionados con temas de webmasters. Este canal alberga principalmente vídeos en inglés, pero las buenas noticias para los que hablamos español es que habrá disponible una Lista de reproducción con todos los vídeos de webmasters en español. Además estamos trabajando para crear los subtítulos en español de los vídeos en inglés más importantes. Estad atentos porque hay algunas traducciones en camino. Mientras tanto otra opción para los vídeos que tienen subtítulos sólo en inglés es utilizar el sistema automático de traducción de Youtube [inglés]. Está en fase beta pero si no hablas inglés te ayudará a entender la idea principal.

Nuestro primer vídeo está ya disponible y cada día contamos con más y más vídeos para compartir contigo. ¡Así que no te los pierdas! Si quieres ser el primero en saber cuándo hay un nuevo lanzamiento, puedes suscribirte utilizando tu cuenta de Youtube o utilizar este feed RSS si prefieres seguirlo desde tu feed. Por favor, haznos saber si te gusta este canal y utiliza los comentarios en este post para compratir ideas sobre futuros vídeos.

jueves, 19 de marzo de 2009

Enlaces pagados: efectos y opciones

Los enlaces son, junto a otros cientos de factores más, parte del famoso algoritmo de Google. El enlace se puede considerar como un voto de una página web a otra. Si el dueño de un sitio web enlaza a una página web es en principio porque cree que esa página puede ser de utilidad o de valor añadido para sus lectores o usuarios.
 
Ahora bien si alguien ofrece dinero por enlazarle se está entrando en otro terreno con diferentes efectos, no solo para los usuarios (los cuales deberían ser advertidos) sino para el propio sitio web en cuanto su posición en los resultados de un determinado motor de búsqueda, digamos Google. De tanto en tanto escribimos algunos artículos sobre enlaces pagados que pasan Pagerank [inglés], pero siempre con el mismo mensaje: estos enlaces no están en línea con las Directrices para webmasters de Google y así lo remarcamos desde nuestro Centro de asistencia, por lo tanto Google tomará acción sobre estos sin ningún miramiento. 
 
Aun así los webmasters que decidan tener enlaces pagados en sus sitios web tienen varias formas de tratarlos para evitar los efectos negativos de estos en los resultados de Google. Entre estas opciones está rel="nofollow" en la etiqueta <a>, como se 
muestra más abajo, o con una redirección a una página intermedia, bloqueada a los motores de búsqueda vía el archivo robots.txt.

Bueno, como ejemplo os mostramos la forma que algunos blogs enlazaron a Google.co.jp recientemente:

<a href="http://www.google.co.jp/artist2008/">http://www.google.co.jp/artist2008/</a>

En circunstancias normales no habría nada malo en este enlace y no habría que añadir nada, pero esta situación era diferente: había pago de enlaces por medio sin ninguna redirección o "nofollow" en la etiqueta. Los efectos se notaron rápidamente: Google Japan vio como su PageRank bajaba dramáticamente por esta razón. Es algo de lo que no estamos orgullosos y nos hemos disculpado públicamente por ello, pero queremos mostraros con este ejemplo cómo de serio nos tomamos los enlaces pagados.

Así que aquí os mostramos la buena y la mala forma de enlazar bajo esta situación:

Mal ejemplo:
<a href="http://www.google.co.jp/artist2008/">http://www.google.co.jp/artist2008/</a>

Buen ejemplo:
<a href="http://www.google.co.jp/artist2008/" rel="nofollow">http://www.google.co.jp/artist2008/</a>

Así que si creéis que Google ha notado el uso de estos enlaces en vuestro sitio web, sólo tenéis que solucionarlo y enviar un formulario de reconsideración desde las Herramientas para webmasters.

martes, 17 de marzo de 2009

Utilización de los datos del archivo sitemap y de la búsqueda con el operador site:

De vez en cuando, en los foros y la blogosfera, surge esta cuestión: cuando uno realiza una búsqueda [site: example.com] sobre su sitio, el número de resultados indexados no concuerda con lo que se muestra en el informe del sitemap en las Herramientas para webmasters. Esta diferencia puede parecer un error, pero no lo es. Tu informe del sitemap sólo refleja las URL que has puesto en el archivo sitemap. Por otra parte, la búsqueda con el operador site: tiene en cuenta cualquier cosa que Google haya rastreado, incluyendo URL que no están en tu sitemap, como por ejemplo URL recién añadidas o descubiertas a través de enlaces.

Piensa en el operador site: como un diagnóstico rápido de la salud general de tu sitio en el índice de Google. Los resultados pueden mostrarte:
  • una estimación aproximada de cuántas páginas se han indexado
  • si han hackeado tu sitio
  • si tiene títulos o fragmentos duplicados
Un ejemplo de consulta utilizando el operador site:


Tu informe del sitemap ofrece estadísticas más detalladas sobre las URL que has enviado, como por ejemplo el número de URL indexadas en comparación con el número de URL enviadas para que se rastreen, así como avisos o errores específicos del sitemap que puedan haberse producido cuando Google ha intentado acceder a tus URL.



No dudes en consultar nuestro Centro de asistencia para obtener más información sobre el operador site: y el sitemap. Si tienes más preguntas, envíalas a nuestro Foro para webmasters, donde tanto Google como webmasters experimentados estarán encantados de ayudarte.

jueves, 12 de marzo de 2009

Mejorando la indexacion de Flash

Hemos recibido muchas peticiones para mejorar nuestro índice de archivos Flash Adobe. Ron Adler y Janis Stipins, ingenieros de software en nuestro equipo de indexación nos ofrecerán más información sobre nuestro comunicado en el que anunciábamos mejoras en la indexación de Flash [inglés].

P: ¿Qué archivos Flash indexa Google mejor ahora?
Hemos mejorado nuestra habilidad para indexar texto en archivos SWF de todo tipo. Esto incluye "gadgets" en Flash como botones o menus, páginas web hechas con Flash y todo lo demás.

P: ¿Qué contenido indexa Google mejor de estos archivos Flash?
Todo el texto que los usuarios pueden ver cuando interactúan con tu sitio web en Flash. Si tu sitio web contiene Flash, el texto de los archivos Flash puede utilizarse cuando Google crea las descripciones (snippets) de tu sitio web. Además, las palabras que aparecen en tus archivos Flash se pueden usar para las búsquedas de Google.

Además de encontrar e indexar el contenido de texto en los archivos Flash, descubrimos URL que aparecen en los archivos Flash y las rastreamos, tal y como hacemos con las URL que aparecen en páginas que no son Flash. Por ejemplo, si tu aplicación Flash tiene enlaces a páginas internas de tu sitio web, Google puede ser capaz de encontrar y rastrear mejor tu sitio web.

P: ¿Qué ocurre con contenido no textual, como las imágenes?
Por el momento, sólo estamos buscando e indexando contenido de texto en archivos Flash. Si tus archivos Flash tan solo incluyen imágenes, no leeremos o indexaremos el texto que pueda aparecer en estas imágenes. De la misma forma que no generaremos texto ancla para los botones Flash que tengan alguna URL, pero que no tengan asociado ningún texto.

Además no indexaremos archivos FLV, tales como los videos de Youtube porque esos archivos no contienen elementos de texto.

P: ¿Cómo ve Google el contenido de los archivos Flash?
Hemos desarrollado un algoritmo que explora los archivos Flash de la misma forma que lo haría una persona: haciendo clic en los botones, introduciendo contenido y demás. Nuestro algoritmo recuerda todo el texto que encuentra en el camino y que luego estará disponible para ser indexado. No podemos contarte todos los detalles, pero podemos decirte que la efectividad del algoritmo ha sido mejorada utilizando la nueva librería para búsqueda SWF de Adobe.

P: ¿Qué necesito hacer para que Google indexe el texto de mis archivos Flash?
Pues realmente nada. Las mejoras que hemos realizado no requieren ninguna acción especial por parte de diseñadores web o webmasters. Si tienes contenido Flash en tu página web empezaremos a indexarlo automáticamente con las limitaciones que nuestra tecnología tiene (ver siguiente pregunta).

Así que deberías saber que Google es ahora capaz de ver el texto que se muestra a los visitantes de tu sitio web. Si prefieres que Google ignore la parte menos informativa de tu contenido, como el copyright o el aviso de carga, considera remplazar este texto por una imagen, lo cual lo hará invisible para nosotros.

P: ¿Cuáles son las limitaciones técnicas de Google en la indexación Flash?
Hay tres limitaciones principales por el momento y estamos trabajando para resolverlas:
  1. Googlebot no ejecuta algunos tipos de JavaScript. Así que si tu página web carga un archivo Flash vía JavaScript, Google quizás no se de cuenta de ese archivo Flash, en cuyo caso no será indexado.
  2. Por el momento no añadimos contenido de fuentes externas que se carguen a través de tus archivos Flash. Si tus archivos Flash cargan un archivo HTML, otro archivo XML, otro SWF, etc. Google indexará esa fuente (o fuentes), pero no será considerado parte del contenido de tu archivo Flash.
  3. Mientras que sí somos capaces de indexar Flash en casi todos los lenguajes que hay en la web, tenemos por el momento dificultades con el contenido Flash escrito en lenguajes bidireccionales. Hasta que esto no se arregle, no seremos capaces de indexar contenido en hebreo o en árabe de archivos Flash.
¡Estamos trabajando en ello, así que estad atentos!

Actualización: A todos, gracias por vuestras preguntas y sugerencias. Nuestro objetivo es mejorar la calidad de búsqueda de todos los usuarios y con mejor indexación de Flash crearemos mejores resultados de búsqueda. Hemos contestado abajo algunas de las preguntas más importantes. Gracias de nuevo.

Un sitio Flash en los resultados de búsqueda antes de las mejoras
Un sitio Flash después de la indexación mejorada, buscando
[nasa deep impact animation]
Ayúdanos a acceder e indexar tus archivos Flash
@fintan: Verificamos con Adobe que el contenido de texto desde sitios legítimos, como por ejemplo los que tienen scripts AS1 y AS2, pueden ser indexados por nuestro nuevo algoritmo.
@andrew, jonny m, erichazann, mike, ledge, stu, rex, blog, dis: En el lanzamiento del 1 de Julio no activamos la indexación Flash para estos archivos incrustados vía SWFObject. Ahora estamos probando una actualización que es compatible con técnicas normales de JavaScript para incrustar Flash, incluyendo SWFObject y SWFObject2.

@mike: Por el momento, el contenido que se carga desde otros archivos no se indexa. Hemos apuntado la petición de esta característica por parte de varios webmasters. Trabajamos en esto en una futura actualización.
Interacción entre páginas HTML y Flash
@captain cuisine: El texto que encontramos en archivos Flash se trata de la misma manera que el texto encontrado en otros archivos, como HMTL, PDF, etc. Si el archivo Flash se encuentra incrustado en HMTL (como muchos de los archivos que estamos encontrando), su contenido se asocia con la URL padre (parent) e indexada como una entidad separada.

@jeroen: Mostrar el mismo contenido Flash y una versión alternativa de HTML podría hacer que encontrásemos contenido duplicado. Esto no causaría una penalización, no reducimos la posición de un sitio web por causa del contenido duplicado. Pero estar atentos, ya que los resultados de búsqueda seguramente mostrarán una versión, no ambas.

@All: Estamos intentado mostrar a los usuarios los resultados más relevantes sin tener en cuenta el tipo de archivo. Estos significa que Flash, HTML con Flash incrustado, sólo HTML, PDF, etc., pueden tener la opción de que se sirvan en los resultados de búsqueda.
Indexando una gran cantidad de archivos Flash
@dsfdgsg: Hemos escuchado peticiones de enlaces internos (enlaces a un contenido específico dentro del archivo) no sólo para los resultados Flash, sino también para otros documentos de gran tamaño y presentaciones. En el caso de Flash, la capacidad de enlazar internamente requerirá una funcionalidad adicional en Flash que nosotros integramos.

@All: La mayoría de los archivos Flash existentes en Internet están bien respecto a su tamaño. No debería ser algo por lo que preocuparnos.
Más detalles sobre nuestro algoritmo de indexación Flash
@brian, marcos, bharath: Sobre ActionScript, nosotros somos capaces de encontrar nuevos enlaces que se cargan a través de este. Exploramos Flash como un usuario lo haría, no descompilamos el archivo SWF. A menos que tú hagas el ActionScript visible a los usuarios, Google no mostrará el código ActionScript.
@dlocks: Respetamos el rel="nofollow" donde quiera que lo encontremos en el HTML.

martes, 10 de marzo de 2009

Diseño de patrones para contenidos accesibles, rastreables e indexables

Como seguimiento a una entrada anterior [inglés] sobre accesibilidad, he aquí algunas recomendaciones sobre diseño para la creación de contenido web que pueda ser usado por una audiencia lo más amplia posible y que, a la vez, se indexe y se rastree.

Evita XMLHttpRequests falsos 

Las páginas que permiten a los usuarios buscar información utilizan a menudo XMLHttpRequests para rellenar la página con información una vez que ésta ha cargado. Si utilizas este patrón, asegúrate de que tu página principal contiene información útil. De lo contrario, tanto el Googlebot como los usuarios que tienen desactivados los scripts en el navegador podrían pensar que tu sitio solamente contiene el mensaje "cargando ..." y nada más.

CSS con imágenes precargadas (Sprites CSS) y links de navegación 

Disponer de texto relevante que acompañe a los enlaces de navegación es importante tanto para el Googlebot como para los usuarios que no pueden visualizar imágenes. Al diseñar la apariencia de los enlaces de navegación de tu sitio, puedes haber elegido tener imágenes que funcionan como enlaces, por ejemplo, colocando etiquetas <img> en elementos <a>. Ese diseño te permite colocar texto descriptivo como atributo alt [inglés] para la etiqueta <img>.

¿Y qué pasa si has optado por el uso de imágenes precargadas (sprites CSS) para optimizar el proceso de carga de las páginas? También puedes incluir texto descriptivo relevante. Para ver un ejemplo, mira cómo se ha codificado el logotipo de Google y los distintos enlaces de navegación en la parte inferior de la página de resultados de Google. Resumiendo, hemos puesto el texto descriptivo justo debajo de la imagen con sprites CSS.

Resultados de búsqueda de Google con CSS activado


Resultados de búsqueda de Google con CSS desactivado (Se ha perdido la imagen, pero permanece el enlace descriptivo"Google")



Utiliza JavaScript no intrusivo (unobtrusive JavaScript)

Hemos hablado sobre el concepto de mejora progresiva [inglés] al crear un sitio interactivo. A medida que añades funcionalidades, también vas utilizando técnicas de JavaScript no intrusivo (unobtrusive JavaScript), para crear páginas web basadas en JavaScript que se integran con el resto. Esto garantiza que tu contenido siga siendo accesible para el mayor número posible de usuarios sin la necesidad de sacrificar las funcionalidades interactivas propias de la aplicaciones Web 2.0.

Facilita el acceso a las versiones para imprimir

Los sitios web con diseños visuales muy interactivos proporcionan a menudo su contenido en versión para imprimir. Generadas con el mismo contenido que la versión interactiva, resultan una excelente fuente de contenido de alta calidad, tanto para el Googlebot como para los usuarios con deficiencias visuales que no pueden experimentar las características interactivas de un sitio web. Pero a menudo estas versiones para impresión permanecen ocultas detrás de enlaces en scripts como este:

<a href = "#" onclick = "javascript: print(...)"> Imprimir </ a>

Crear URL para estas versiones para imprimir y enlazarlas mediante anclas HTML simples mejorará mucho la calidad del contenido que se rastrea:

<a href="http://example.com/pagina1-para-imprimir.html" target="_blank">Imprimir</a>

Si estás especialmente preocupado por el contenido duplicado [inglés] de la versión interactiva y de la versión para imprimir, entonces puedes elegir una versión preferida del contenido y enviar un sitemap que contenga la URL preferida, así como enlazar internamente a dicha versión. Esto puede ayudar a Google a aclararse en el caso de que se encontraran partes del mismo texto en URL diferentes.

Crea URL para tu contenido útil

Como webmaster, tienes el poder de acuñar URL con el contenido útil que publicas. Esto es lo que hace que la web se mueva. Crear URL para cada contenido útil que publicas y enlazarlo mediante enlaces HTML simples hará que:
  • El Googlebot aprenda sobre ese contenido
  • Los usuarios puedan encontrar ese contenido
  • Los usuarios puedan guardarlo y volver más tarde.
No hacer esto fuerza a los usuarios a tener que recordar secuencias de clics para llegar al contenido que vieron antes en tu sitio.

jueves, 5 de marzo de 2009