rel=”canonical”, o cómo evitar contenido duplicado

rel=”canonical”

Esta es la clave.  Google ha creado este atributo para que podamos indicar qué contenido es duplicado.

Como ya debes saber, el contenido duplicado es penalizado por Google (también por los demás buscadores).  En Innovation Studio hacemos uso de la reescritura de URL, también llamado “direcciones semánticas” o “URL semántica”, y ello puede llevarnos (y de hecho nos lleva) a hacer que una misma página pueda estar referenciada por más de una dirección.

Para solucionarlo, Google se ha sacado de la manga un nuevo tag para HTML que permite indicar estos casos, llevando con ello a la no penalización en posicionamiento.  Este hecho es muy importante para los que nos dedicamos a posicionar páginas, porque incurríamos sistemáticamente en estos pequeños hechos penalizables, sin demasiado remedio (quitando el rehacer la navegación de toda la web, algo realmente duro).

Algún ejemplo lo tenemos en Decoration-line.com, una web de decoración e interiorismo que puede mostrar el mismo proyecto de decoración por diferentes URLs, en función de qué estemos viendo.  Por ejemplo, vamos a visitar la siguiente página: http://www.decoration-line.com/proyecto-basico-decoracion.html

Esta dirección (proyecto-basico-decoracion.html) es una reescritura de URL (URL rewriting).  La dirección REAL de esta página es otra; concretamente se trata de la página http://www.decoration-line.com/index.php?seleccio=1&menu=3 (se puede probar para ver que es la misma página).

Ahora bien, la página que queremos indexar en Google no es ni la primera, ni la dirección REAL, sino que nos interesa que sea esta otra dirección: http://www.decoration-line.com/vivienda_unifamiliar_cambrils_proyecto_basico.html. Queremos que todos los clicks se apunten a esta dirección (a esta página).

¿Cómo hacemos entonces para que esta sea la dirección que indexe Google?

Esta es la parte más bonita del trabajo.  Vamos a introducir la siguiente línea en la cabecera (header) de la página REAL, de manera que siempre que se muestre, nos indique qué dirección es la que queremos indexar:

<link rel="canonical" href="http://www.decoration-line.com/vivienda_unifamiliar_cambrils_proyecto_basico.html">

De esta manera, siempre que Google entre en esta página, con independencia de cuál sea su URL, los clicks y las visitas se apuntan a la dirección que a nosotros nos interesa.

¿No es genial?  ¿No es Google?  😀

Te gustó este artículo? Por qué no dejas un comentario y continuamos la conversación, o suscríbete al feed RSS para obtener los artículos directamente en tu lector de RSS.

Comentarios

Una mica complicat tot plegat. Però per això esteu els informàtics i programadors, perajudar-nos a moure’ns per aquest món tant complicat com és la programació.

Hola Oscar,

suposo que a partir del mail podràs saber qui sóc, en qualsevol cas volia ampliar un pel el teu comentari, així com suggerir altres possibles maneres de evitar el contingut duplicat.

D’entrada aquesta etiqueta tal i com ho presentes, entenc que només és google qui ho interpreta d’aquesta forma, de manera que continuem tenim el problema de contingut duplicat per a la resta de buscadors(google te la major quota de mercat, però tampoc cal despreciar a la resta).

Per tal de poder usar una solució global al contingut duplicat(per a tots els buscadors), podríem usar exclusions de robots mitjaçant etiquetes meta o bé mitjançant l’arxiu robots.txt

També comentar que quan disposem de diverses URL’s que corresponen a una mateixa pàgina, podem usar redireccions 301 per tal de donar valor a la URL que ens interessa de cara als buscadors.

Salutacions!

Hola, aprendizseo.

Les opcions que aportes són bones. Sense cap mena de dubtes resolen el problema del contingut duplicat. El cas és que les pàgines del web que he fet servir de referència necessitaven les URL diferenciades (no les podia redireccionar a la pàgina “canonical”). D’altra banda, si excloc un buscador d’algunes de les pàgines de contingut duplicat (Yahoo! per exemple) tinc el problema de que no es veuen aquelles pàgines en concret, a aquell buscador.

De totes maneres, la idea del rel=”canonical” és bona, així que estic convençut que la resta de buscadors l’adoptaran ben aviat, si no ho han fet ja.

Gràcies per tornar.

Lo siento, el formulario para comentar está cerrado en este momento.