Forum CMS Made Simple FR
[Résolu] "Disallow:" de robots txt et CMS MS - Version imprimable

+- Forum CMS Made Simple FR (https://forum.cmsmadesimple.fr)
+-- Forum : Ressources (https://forum.cmsmadesimple.fr/forum-4.html)
+--- Forum : Hébergement et référencement (https://forum.cmsmadesimple.fr/forum-11.html)
+--- Sujet : [Résolu] "Disallow:" de robots txt et CMS MS (/thread-420.html)



[Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 21/05/2010

Citation :#~~~~~ NE PAS SUPPRIMER CE BLOC ~~~~~
#~ Version du CMS: 1.7.1
#~ Nom de l'hébergeur : Hosteur
#~ Informations Système :
#~~~~~ NE PAS SUPPRIMER CE BLOC ~~~~~
Je pose ma question ici pour en avoir le coeur net:

je dois utiliser le robots txt pour désinder plusieurs dizaines de pages à la fois.

le code est: Disallow: /repertoire/chemin/page.html

Imaginons que la page à désindexer soit: http://example.com/index.php/mapage

Deux questions se posent à moi:

1) "index.php" n'étant pas un dossier mais un fichier dois je dans mon cas indiquer quand meme à robot txt:

Disallow: /index.php/mapage

?

2) La procédure explique dans l'exemple "mapage.html" puis je ne pas mettre l'extention de la page et simplement "mapage" sans créer de dysfonctionnement?

Merci aux spécialistes pour leur aide Smile

Philippe.


[Résolu] "Disallow:" de robots txt et CMS MS - bess - 21/05/2010

a ma connaissance puisque le robot fonctionne comme un visiteur (et ne fait pas de distinction entre un fichier index.php et un dossier s'appelant index.php) tu dois spécifier effectivement

Disallow: /index.php/mapage

pour bloquer son indexage.

pour le second point, si ta page peut s'appeler indistinctement http://www.site.fr/mapage.html ou http://www.site.fr/index.php?page=mapage par exemple, il te faudra préciser dans le fichier robots.txt :

Disallow: /mapage.html
Disallow: /index.php?page=mapage

de la même façon si on peut y accéder par http://www.site.fr/mapage tu ajoute l'entrée ce qui donne


Disallow: /mapage.html
Disallow: /mapage
Disallow: /index.php?page=mapage

le problème des solutions globale Smile

la meilleur solution dans ton cas est de spécifier page à page quelle sont celles que tu ne souhaites pas indexer et coupler cela par une astuces qu'a décrite une personne pas plus tard qu'hier : http://www.cmsmadesimple.fr/forum/viewtopic.php?id=2642


[Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 21/05/2010

Merci Jess !

j'ai a peu près 100 pages que j'ai listées méticuleusement je vais voir si j'arrive à appréhender tous les cas mais je pense au avec tes explications ca devrait aller Smile

A bientot,

Philippe.


[Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 23/05/2010

Un cas qui me paraît épineux.

Quelle syntaxe pour "Disallow" cette URL:

http://example.com/index.php?mact=News,cntnt01,print,0&cntnt01articleid=1&cntnt01showtemplate=false&cntnt01returnid=61

Merci pour votre aide.

Philippe


[Résolu] "Disallow:" de robots txt et CMS MS - bess - 23/05/2010

bonne question. je doute que tu t'en sorte :/

enfin au pire test :

Disallow: /index.php?mact=News

mais j'ai un sérieux doute ^^


[Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 23/05/2010

Argh Sad

Je vais poser la question également sur un autre forum et dès que j'ai la réponse je la poste ici :p

Philippe.


[Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 24/05/2010

Je me réponds à moi même:

Avec l'aide du forum OSEOX la solution est:/index.php?mact=News,cntnt01,print,0&cntnt01articleid=1&cntnt01showtemplate=false&cntnt01returnid=61

Et pour info voici toutes les syntaxes possibles: http://www.google.com/support/webmasters/bin/answer.py?hl=fr&answer=156449

Amitiés,

Philippe