[Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 21/05/2010
Citation :#~~~~~ NE PAS SUPPRIMER CE BLOC ~~~~~
#~ Version du CMS: 1.7.1
#~ Nom de l'hébergeur : Hosteur
#~ Informations Système :
#~~~~~ NE PAS SUPPRIMER CE BLOC ~~~~~
Je pose ma question ici pour en avoir le coeur net:
je dois utiliser le robots txt pour désinder plusieurs dizaines de pages à la fois.
le code est: Disallow: /repertoire/chemin/page.html
Imaginons que la page à désindexer soit:
http://example.com/index.php/mapage
Deux questions se posent à moi:
1) "index.php" n'étant pas un dossier mais un fichier dois je dans mon cas indiquer quand meme à robot txt:
Disallow: /index.php/mapage
?
2) La procédure explique dans l'exemple "mapage
.html" puis je ne pas mettre l'extention de la page et simplement "mapage" sans créer de dysfonctionnement?
Merci aux spécialistes pour leur aide
Philippe.
[Résolu] "Disallow:" de robots txt et CMS MS -
bess - 21/05/2010
a ma connaissance puisque le robot fonctionne comme un visiteur (et ne fait pas de distinction entre un fichier index.php et un dossier s'appelant index.php) tu dois spécifier effectivement
Disallow: /index.php/mapage
pour bloquer son indexage.
pour le second point, si ta page peut s'appeler indistinctement
http://www.site.fr/mapage.html ou
http://www.site.fr/index.php?page=mapage par exemple, il te faudra préciser dans le fichier robots.txt :
Disallow: /mapage.html
Disallow: /index.php?page=mapage
de la même façon si on peut y accéder par
http://www.site.fr/mapage tu ajoute l'entrée ce qui donne
Disallow: /mapage.html
Disallow: /mapage
Disallow: /index.php?page=mapage
le problème des solutions globale
la meilleur solution dans ton cas est de spécifier page à page quelle sont celles que tu ne souhaites pas indexer et coupler cela par une astuces qu'a décrite une personne pas plus tard qu'hier :
http://www.cmsmadesimple.fr/forum/viewtopic.php?id=2642
[Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 21/05/2010
Merci Jess !
j'ai a peu près 100 pages que j'ai listées méticuleusement je vais voir si j'arrive à appréhender tous les cas mais je pense au avec tes explications ca devrait aller
A bientot,
Philippe.
[Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 23/05/2010
Un cas qui me paraît épineux.
Quelle syntaxe pour "Disallow" cette URL:
http://example.com/index.php?mact=News,cntnt01,print,0&cntnt01articleid=1&cntnt01showtemplate=false&cntnt01returnid=61
Merci pour votre aide.
Philippe
[Résolu] "Disallow:" de robots txt et CMS MS -
bess - 23/05/2010
bonne question. je doute que tu t'en sorte :/
enfin au pire test :
Disallow: /index.php?mact=News
mais j'ai un sérieux doute ^^
[Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 23/05/2010
Argh
Je vais poser la question également sur un autre forum et dès que j'ai la réponse je la poste ici :p
Philippe.
[Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 24/05/2010
Je me réponds à moi même:
Avec l'aide du forum OSEOX la solution est:/index.php?mact=News,cntnt01,print,0&cntnt01articleid=1&cntnt01showtemplate=false&cntnt01returnid=61
Et pour info voici toutes les syntaxes possibles:
http://www.google.com/support/webmasters/bin/answer.py?hl=fr&answer=156449
Amitiés,
Philippe