Gestión de sitios web multilingües

Un sitio web multilingüe es cualquier sitio web que ofrece contenido en más de un idioma. Una empresa canadiense con una versión en inglés y otra en francés, o un blog sobre fútbol con contenido en español y en portugués serían ejemplos perfectos de sitios web multilingües.

Por lo general, tiene sentido crear un sitio web multilingüe cuando tu audiencia se compone de hablantes de lenguas diferentes. Si tu blog sobre fútbol latinoamericano tiene como objetivo llegar a usuarios en Brasil, podrías publicarlo tan sólo en portugués. Pero si también quieres alcanzar audiencia en Argentina, publicar información en español podría serte útil.


Google y el reconocimiento del idioma

Google intenta determinar el idioma de cada una de tus páginas. Para facilitar el reconocimiento de éste te aconsejamos que utilices una solo idioma por página. Aunque Google puede reconocer más de un idioma por página, es recomendable usar el mismo para todos los elementos que forman la página: encabezados, menús, etc.

Recuerda que Google ignora la información a nivel de código, como atributos "lang" o definiciones de tipo de documentos (DTD). Algunos programas de edición web crean dichos atributos de manera automática, por lo que no suelen proporcionar información válida a la hora de identificar la lengua de una página web.

Alguien que llega a Google y realiza una búsqueda en su idioma espera encontrar resultados localizados, y es aquí donde el webmaster entra en escena: si vas a realizar una versión localizada de tu sitio web, asegúrate de que esta versión sea visible en los resultados de búsqueda con algunos de nuestros consejos.


La anatomía de un sitio multilingüe: estructura de la URL

No es necesario crear URL con una estructura particular. No obstante, podría ser beneficioso para tus usuarios el saber en qué sección de tu sitio web se encuentran con dar un simple vistazo a la URL. Por ejemplo, las siguientes URL indican al usuario que se encuentra en la versión inglesa de este sitio web:

http://example.ca/en/mountain-bikes.html
http://en.example.ca/mountain-bikes.html

Mientras que estas otras URL indican al usuario que está viendo la misma página en francés:

http://example.ca/fr/mountain-bikes.html
http://fr.example.ca/mountain-bikes.html

Además, esta estructura de URL te puede ayudar a la hora de analizar la indexación de páginas con el mismo contenido pero en distintos idiomas.

Si vas a crear URL con caracteres no ingleses, utiliza codificación UTF-8. Así deberían estar correctamente escapadas para enlazar a otras páginas de tu sitio. Si necesitas crear URL escapadas, puedes encontrar un codificador de URL en línea. Por ejemplo, si quisiera traducir la siguiente URL del inglés al francés:

http://example.ca/fr/mountain-bikes.html

Podría traducirla así:

http://example.ca/fr/vélo-de-montagne.html

Puesto que esta URL contiene un carácter que no es inglés (é), podría escaparla para usarla como enlace en una de las páginas:

http://example.ca/fr/v%C3%A9lo-de-Montagne


Rastreo e indexación de tu sitio web multilingüe

Te recomendamos que no dejes que las traducciones automáticas sean indexadas. Las traducciones automáticas pueden carecer de sentido, por lo que podrían ser percibidas como spam. Además, el objetivo de un sitio multilingüe es llegar a una audiencia más amplia proporcionando contenido relevante en varios idiomas. Si a tus usuarios les cuesta entender una traducción automática, deberías preguntarte si realmente quieres ofrecerles este tipo de contenidos.

Si vas a localizar tu sitio, intenta que todas las versiones sean fáciles de rastrear para el Googlebot. Procura enlazar entre páginas de tu sitio que ofrecen el mismo contenido en distintos idiomas. Esto también puede ser muy útil para tus usuarios. Siguiendo el ejemplo anterior, si un usuario francés llega a la página http://example.ca/en/mountain-bikes.html, ahora con un solo clic puede acceder a http://example.ca/fr/vélo-de-montagne.html, donde puede ver el mismo contenido en francés.

Para que todas las secciones de tu sitio web sean más fáciles de rastrear, evita redireccionamientos automáticos basados en la presunción del idioma del usuario. Dichos redireccionamientos pueden impedir que tanto el usuario como los motores de búsqueda vean todas y cada una de las secciones de tu sitio web.

Y por último, crea URL distintas para cada idioma. No uses cookies para mostrar las versiones traducidas.


Codificación de caracteres

Google extrae la codificación de los caracteres directamente de los encabezados HTTP, de los encabezados de página HTML y del contenido. Por lo tanto, la codificación de caracteres no requiere demasiado esfuerzo por tu parte: simplemente procura que no haya información contradictoria entre el contenido y en los encabezados, por ejemplo.

Aunque Google puede reconocer varias codificaciones de caracteres, te recomendamos que utilices UTF-8 siempre que sea posible.


Si se te traba la lengua...

Ahora que sabes todo esto, ¡crear un sitio multilingüe no tiene por qué ser tan difícil como un trabalenguas!

Para obtener más información, lee nuestro post sobre sitios multirregionales. Más adelante publicaremos un post más detallado sobre situaciones especiales que pueden surgir al trabajar con un sitio web multilingüe y/o multirregional. Hasta entonces, ¡no dudes en pasarte por el Foro de ayuda para webmasters y hacer muchas preguntas!

martes 23 de marzo de 2010

13 comments:

alfa dijo...

Buenos días. Acabo de leer su artículo y les agradezco la información que proporcionan. Es muy buena. Sin embargo, encuentro un párrafo que me ha dejado perplejo y desorientado. Comentan ustedes que nos recomiendan que no hagamos ‘traducciones automáticas en nuestros sitios web, porque pueden parecer sin sentido y ser percibidas como spam’.

En este mismo blog, el pasado 9 de noviembre publicaron ustedes un artículo con el tema: “Traduce tu sitio web con Google y amplia tu audiencia”. En el penúltimo párrafo comentaron ustedes lo siguiente:

“La traducción automática es práctica y ayuda a ver la esencia de la página que se visita de una forma rápida. Sin embargo, no es el sustituto de la traducción profesional. Esperamos que los traductores profesionales, junto con herramientas de traducción, como Google Translator Toolkit [inglés] y este gadget, seguirán ayudando a hacer el contenidos más accesibles para todos.”

¿No hay aquí una contradicción? ¿Es o no es útil una traducción automática? Estoy totalmente de acuerdo con lo publicado en noviembre pasado. Una traducción automática permite dar a conocer a los usuarios de otros países la esencia de un contenido que de otro modo sería imposible tener acceso a ello por falta de tiempo y de recursos económicos. ¡Claro, que jamás podrá sustituir a un traductor profesional!

Pero, ¿por qué tiene que ser percibido como spam el contenido original (no copiado de otras webs) de la propia web que ha sido traducido automáticamente a otros idiomas para dar a otras personas la posibilidad de que tengan acceso a la ‘esencia’ de ese contenido original?

¿Qué lo haría spam? ¿El que en los artículos traducidos esté adsense? ¿El que una web haya hecho un esfuerzo por traducir miles de páginas de su propio contenido así? Si el contenido puede ser relevante para las personas de otros idiomas ¿por qué considerarlo spam? ¿No se está haciendo un esfuerzo para hacer más accesible el contenido de internet para todos? ¿Sería spam si se avisa al usuario de que es una traducción automática y se está trabajando en corregir esa traducción?

En su página spam report animan ustedes a que si nos encontramos con spam marquemos entre lo siguiente:

Tipo (s) de problema (marque todos los que apliquen):
De texto o vínculos ocultos
Palabras engañosas o repetidas
La página no coincide con la descripción de Google
Página encubierta
Redireccionamientos engañosos
Páginas puerta
Sitio o páginas duplicadas
Otros (especificar)

(Por cierto esto lo he traducido con el Google traductor del inglés, y miren por donde totalmente entendible). ¿Entraría en el apartado “otros” el contenido traducido automáticamente?

Les ruego sinceramente que publiquen un artículo profundizando en este tema para que los propietarios de páginas web sepamos exactamente a qué atenernos y todo el esfuerzo de años no se vaya al traste por una penalización suya.

Sinceramente creo que ustedes son los mejores. Ustedes son odiados por mucha gente. Creo que es por la envidia que tienen de sus excelentes productos (entre ellos su buscador y traductor), pero a veces ustedes me dejan perplejo y desorientado.

Cristina, Equipo de Calidad de Búsqueda dijo...

Hola, alfa:

Gracias por tu detallado comentario. A ver si con el mío aclaro un poco las dudas:

En general, las traducciones automáticas resultan útiles para obtener una idea rápida sobre el contenido de un sitio que originalmente está en otro idioma.

Pero la calidad de una traducción automática puede variar mucho.

Si estás ofreciendo tu sitio web localizado, estás ofreciendo un sitio web de calidad adaptado a ese idioma o país concreto que deseas alcanzar. Es decir, no consiste sólo en una traducción automática. Por eso en este artículo nos permitíamos hacer esa recomendación, en este contexto.

Las traducciones automáticas a veces pueden no tener sentido y parecer spam. Cuando una página no tiene ningún sentido en un idioma, lo más probable es que no sea relevante para los usuarios de ese idioma. Si tienes un sitio web o parte de un sitio web lleno de páginas que carecen de sentido, esto puede percibirse como spam.

Un saludo,
Cristina

alfa dijo...

Buenos días Cristina.

Muchas gracias por su rápida respuesta.

Ahora, con sus comentarios, tenemos algo más claro el tema de las traducciones automáticas. Seguiremos esforzándonos para hacer un buen trabajo en este campo.

Saludos.

elQuique dijo...

Igualmente luego de leer el post y la explicación me genera desconfianza como Google determina el idioma y si puede o no parecer spam.

Trata de entender español de españa, español de argentina, español mexicano, o quizas no lo entiende y tacha de spam ?

Por otra parte me llama la atención que siendo Google una empresa que respeta e insiste bastante en los estándares no tome en cuenta las etiquetas lang="es" de HTML, que de echo estoy seguro las he visto en algunos videos como sugerencias para regionalizar o determinar el idioma de nuestro contenido.

elQuique dijo...
Este comentario ha sido eliminado por el autor.
Enrique dijo...
Este comentario ha sido eliminado por el autor.
Enrique dijo...

El artículo me ha resuelto algunas dudas pero todavía estoy un poco inseguro.

Estoy diseñando mi primera web, parte de ella tendrá un blog que será multiidioma y tengo un par de dudas:

1. Para organizar los idiomas, ¿es mejor utilizar subdominios, subcarpetas o da lo mismo?

2. Quiero empezar con la web en inglés, español y alemán. Había pensado esta estructura:

www.ejemplo.com/blog/example-post.html (inglés)
www.ejemplo.com/es/blog/ejemplo-post.html (español)
www.ejemplo.com/de/blog/post-beispiel.html (alemán)

No utilizo subcarpetas para el idioma inglés, pero para el resto de idiomas si, ¿Es un planteamiento correcto?

Saludos
Enrique

laRusalka dijo...

En la entrada correspondiente en inglés (http://googlewebmastercentral.blogspot.com/2010/03/working-with-multilingual-websites.html) NO dice que Google recomiende no utilizar traducción automática; dice que recomiendan que no se permita que las traducciones automáticas sean indexadas (están hablando específicamente de arañas web -crawlers). No es lo mismo.

laRusalka dijo...
Este comentario ha sido eliminado por el autor.
Cristina, Equipo de Calidad de Búsqueda dijo...

Hola, laRusalka:

Gracias por hacernos llegar tus comentarios. Mi compañero Xavier ha revisado la frase que nos comentas.

Un saludo,
Cristina

Guillermo dijo...

Buenas, para mi deberían agregar en el protocolo sitemap el idioma o idiomas de cada pagina, dominio, subdominio y subdirectorio.
Creo que se evitarían muchos problemas.
Es lo más fácil y lógico.
Si en la página default tengo el acceso a varios idiomas, y las paginas están en subdirectorios con su respectivo idioma, google se confunde. Google asocia a todo el dominio con un idioma.
ejemplo.com/index.html
ejemplo.com/es/
ejemplo.com/en/
Yo uso las etiquetas
meta http-equiv="Content-Language" content="es"
meta name="language" content="spanish"
Y también link rel="alternate" hreflang="en"

Google interpreta las etiquetas?
Que colocar en el default de acceso a los idiomas es,en ?
Consejo?

Lo mejor es actualizar el protocolo, espero que lo tomen en cuenta. Podria ser:
0.6
Spanish
Me gustaría ponerme en contacto.

CarlosBerman dijo...

Este artículo me ha dejado pensando y hasta con cierto temor, ya que quiero hacer precisamente algo que no recomiendan, en una misma página agregar dos idiomas: español e inglés.

El sito está basado en Wordpress y desde hace años tuve la idea del sitio bilingüe, pero usando "TABS" o pestañas dentro de cada post para separar los idiomas, una pestaña diría "español" la otra "english", al hacer clic en cualquiera de ellas, mostrará el contenido del post en el idioma correspondiente, la traducción al inglés es humana, por lo que estará perfectamente traducida del español. Debería tener WP multisite por lo que recomiendan, y esto me complica más la vida.

Mi página será de videocursos en 4 tamaños diferentes (HD 720p, 540p, iPhone y iPad) creados por un servidor, narrados en español y subtítulados en inglés, los subtítulos son opcionales obviamente, inclusive incluiré también subtítulos en español.

Realmente la información escrita que tenga el sitio será mínima (unos 3-4 párrafos por posts en cada idioma) ya que el resto lo narraré en los videocursos, en los posts solo mostraré una breve descripción, tal vez algunos screenshots y algún video resumen desde youtube. Los cursos completos estarán para descarga desde servidores externos.
Este tipo de tabs usaría para dividir los idiomas:

http://flowplayer.org/tools/tabs/index.html

Me dejaron pensando seriamente con este artículo, veré que hacer.

Saludos

Equipo de Calidad de Búsqueda dijo...

Hola CarlosBerman,

En estos casos no hay que perder la perspectiva, si bien estas son recomendaciones para gestionar sitios multilingües, lo que debes analizar es si tu web funciona bien tanto para los usuarios, como para los motores de búsqueda. Si tu página funciona bien y está en línea con nuestras directrices, quizás no sea necesario cambiar nada :-))) Recuerda estos son sugerencias a tener en cuenta.

Saludos