3
Indiquez l’intérêt que vous portez à cette question
0

urlrewriting un peu trop tolérant

Bonjour

Le problème que je vais exposer peut paraître anodin
mais en réalité, la conséquence peut être un déclassement important du site par Google.

J’utilise la ré-écriture d’url de SPIP.
J’ai remarqué que le htaccess (ou le couteau suisse) est très tolérant. C.a.d qu’il retrouve souvent les bons articles même si il y a une erreur dans l’url, du moment que cette erreur est minime.

A priori, on pourrait dire : ben tant mieux.

Le problème est que je me retrouve avec des centaines de pages indexées dans GG ayant une url différente mais avec un contenu strictement identique.

Par exemple : si vous tapez votre url avec des majuscules ou des minuscules, c’est pareil.

Et ils se trouve que GG a indexé des url qui avait un format légèrement différent à un moment donné. Je n’avais peut être pas sélectionné le forçage en minuscule à ce moment-là.

Avec le nouvel algo PANDA, ces pages seront vues comme dupliquées et GG interprétera cela comme de la filouterie.
Donc, dégringolade dans le positionnement du site.

Il y a toujours la possibilité d’indiquer à GG de désindexer certaines pages, grâce au Web Master Tool.
Mais il faut que les pages à désindexer renvoient une erreur 404 ou 410.

Donc il faudrait que le htaccess (ou peut-être le code spip ?) soit moins tolérant et renvoie un 404 si l’url tapée n’est exactement celle stockée.

C’est possible ça ?