21/05/2010, 15:39:25
a ma connaissance puisque le robot fonctionne comme un visiteur (et ne fait pas de distinction entre un fichier index.php et un dossier s'appelant index.php) tu dois spécifier effectivement
Disallow: /index.php/mapage
pour bloquer son indexage.
pour le second point, si ta page peut s'appeler indistinctement http://www.site.fr/mapage.html ou http://www.site.fr/index.php?page=mapage par exemple, il te faudra préciser dans le fichier robots.txt :
Disallow: /mapage.html
Disallow: /index.php?page=mapage
de la même façon si on peut y accéder par http://www.site.fr/mapage tu ajoute l'entrée ce qui donne
Disallow: /mapage.html
Disallow: /mapage
Disallow: /index.php?page=mapage
le problème des solutions globale
la meilleur solution dans ton cas est de spécifier page à page quelle sont celles que tu ne souhaites pas indexer et coupler cela par une astuces qu'a décrite une personne pas plus tard qu'hier : http://www.cmsmadesimple.fr/forum/viewtopic.php?id=2642
Disallow: /index.php/mapage
pour bloquer son indexage.
pour le second point, si ta page peut s'appeler indistinctement http://www.site.fr/mapage.html ou http://www.site.fr/index.php?page=mapage par exemple, il te faudra préciser dans le fichier robots.txt :
Disallow: /mapage.html
Disallow: /index.php?page=mapage
de la même façon si on peut y accéder par http://www.site.fr/mapage tu ajoute l'entrée ce qui donne
Disallow: /mapage.html
Disallow: /mapage
Disallow: /index.php?page=mapage
le problème des solutions globale
la meilleur solution dans ton cas est de spécifier page à page quelle sont celles que tu ne souhaites pas indexer et coupler cela par une astuces qu'a décrite une personne pas plus tard qu'hier : http://www.cmsmadesimple.fr/forum/viewtopic.php?id=2642