Améliorer son référencement organique

J’en ai assez que mes RSS arrivent en premier dans les résultats de recherche Google.

Google spammé par mes RSS

Une solution simple : robots.txt.

User-agent: * Disallow: /feed/
  1. Cette règle concerne tous les robots (*)
  2. Ne pas lire les IRI contenant le mot /feed/ juste après le tld

Ainsi, cette adresse ne sera plus récupérée par les robots (du moment qu’ils obéissent à la convention robots.txt, bien sûr) :

http://blog.empyree.org/feed/tag/DotClear/rss2/comments

Celle-ci, en revanche, le sera :

http://david.latapie.name/blog/Une_traduction_adéquate_pour_«_feed_»

Cependant, je vois une manière d’améliorer les choses : plutôt que de simplement ignorer le fil, rediriger le robot vers la page HTML correspondante. En revanche, robots.txt ne suffit plus, il faut passer pas .htaccess, PHP…

  • Pour /feed/atom, il s’agit de / : soit la page d’accueil.
  • Pour /feed/tag/DotClear/rss2/comments, il s’agit de /tag/DotClear/ : pas de page HTML pour les commentaires spécifiques à un mot-clé.
  • Pour /feed/rss2/comments/2854, il s’agit de /post/Télé_poubelle : il faut effectuer une redirection identifiant vers titre. Beaucoup plus simple si on décide de jeter à la poubelle les IRI signifiantes (ça peut se faire par about:config, dans l’interface d’administration) ; dans ce cas, l’adresse de redirection devient /post/2854.

J’y pense assez sérieusement : le W3C répète à l’envie que les adresses n’ont pas à être visibles et que la signifiance, c’est assez relatif. Enfin, les adresses avec un identifiant sont plus faciles à noter sur un papier (/post/1234, c’est plus facile à noter que /Bloc-note_de_code : bloc_note, blocnote, bloc-notes, bloc-note_de,…. D’un autre côté, lors du flat_export pour passer de DC1 à DC2, tous les identifiants se sont mélangés, ce qui casse tout…

Côté référencement, je ne suis pas même sûr que j’y perde beaucoup. Bon, il faut encore que je trouve comment rediriger un robot de cette manière. Une idée ? C’est vrai que ça fait beaucoup pour pas grand-chose.

Pour ce que j’en vois, il faut remplacer /feed/ par /post/ et supprimer rss2|atom(/comments). En code, ça donne quoi ?

Que pensez-vous de tout ceci ?

flattr this!

  • Pour ce que j’en vois, il faut remplacer /feed/ par /post/ et supprimer rss2

    Tu veux rediriger tes feeds sur tes pages c’est ça ?

    Si c’est bien le cas alors cela entrainera un effet pervers : les personnes qui suivent les feeds ne recevront plus aucune info car ça leur renverra la page du billet/tag et donc aucune info utilisable par leur lecteur de flux.

    Je ne comprends pas pourquoi tu ne te “contente” pas du simple code dans le robots.txt en fait ?