50837 Membres -  2 Connectés
ALL HTML.COM : 1er portail communautaire dédié aux webmasters et aux développeurs francophones
ACCUEILFORUMSANNUAIRE DES MEMBRESOFFRES SPECIALES
 
 LANGAGES
 ASP
 COLDFUSION
 CSS
 DHTML
 HTML
 JAVA
 JAVASCRIPT
 MATHML
 MYSQL
 PERL
 PHP
 SMIL
 SVG
 UML
 WML
 XHTML
 XML
 XSL
 TECHNO
 Astuces
 Eléments clés
 Atelier pratique
 ACTUALITES
 Agenda
 Chiffres et Etudes
 Dossiers
 Emploi
 Interview
 News
 Sondages
 Webtest
 WEBDESIGN
 Couleurs
 Design
 Flash zone
 Tutoriaux
 REFERENCEMENT
 Analyse moteurs
 Méthodologie
 Meta-Tags
 Promotion
 RESSOURCES
 Annuaire
 Audits et Services
 Chat
 Documentations
 FAQ
 Forums
 Glossaire
 Outils et Solutions
 Téléchargement
 SHOPPING/SERVICES
 AMEN vous offre
 -15% sur le Pack Pro
 Spécial Entreprise !
 vous cherchez une
 vraie agence web?
 c'est IMAGINANCE
 qu'il vous faut !
 Webmasters,
 gagnez
 de l'argent avec
 votre site web !
 Un nom de domaine
 pour 0.90€ ht/mois ?
 C'est possible !
 Chaque semaine
 des promos sur
 toute la gamme
 de produits et
 accessoires DELL
 ACHAT/VENTE à -50%
 dvd | vhs | cd 
 livres | bd 
 portables | pda 
 video | consoles 
 jeux | mode 
 informatique | pc 
 photo | mp3 | hifi 
 électroménager 

Focus - 29 Août 2008
Devenez "membre" de ALL HTML et faites partie d'une vraie communauté de passionnés et/ou de professionnels du développement sur Internet.
L'accès membre est gratuit et vous permet d'accéder à des fonctionnalités complémentaires :
- accéder à l'annuaire des 44 000 membres,
- poster des messages dans les forums,
- utiliser la messagerie interne,
- bénéficier d'offres négociées...).
Alors n'attendez-plus!

Inscrivez-vous dès à présent !

MéthodologiePrécédentRecommanderImprimerAjouter à mon Compte
Le fichier robots.txt

1. Principe de fonctionnement
Pour exclure sur les moteurs de recherche, des répertoires entiers ou des pages (la plupart des cas pour des raisons de confidentialité), deux moyens s'offrent à vous :
a) La balise META avec l'attribut robots
b) La construction d'un fichier robots.txt

C'est ce dernier que l'on va étudier ici. Pour "imager" le fonctionnement, voici un schéma montrant un spider (ou robot) face à un fichier robot.txt.

Fonctionnment d'un robot (spider)

2. Construction du fichier robots.txt
Dans un premier temps ouvrez n'importe quel éditeur texte (Bloc-notes par exemple) puis créer un fichier texte (avec l'extension .txt).
Ci-dessous un exemple détaillé ainsi que les explications.

Exemple de fichier robots.txt

Explications
a) La première ligne est composée de User-agent:*, elle indique aux robots (spiders) de n'importe quel moteur de recherche (representé par *) que l'accès au site leur est donné.
b) Disallow:/index2.php3 indique aux robots de tous les moteurs qu'ils ne doivent pas indexer la page index2.php3 situé à la racine du site.
c) Disallow:/cgi/ indique aux robots qu'ils ne peuvent indexer les fichiers contenus dans le répertoire cgi.
d) Disallow:/admin/ indique aux robots qu'ils ne peuvent indexer les fichiers contenus dans le répertoire admin.

Note : Lors du transfert de ce fichier assurez-vous d'être en mode ASCII.

3. Commandes

CommandeDescription
User-agent: *Tous les moteurs sont concernés
User-agent: GooglebotLe spider de Google est concerné uniquement
Disallow:Tout est indexé. Identique à un fichier robots.txt inexistant
Disallow:/Toutes les pages et répertoires du site ne sont pas indexés
Disallow:/index2.htmlindex2.html situé à la racine du site n'est pas indexé
Disallow:/reprep.html s'il existe n'est pas indexé ainsi que le répertoire rep
Disallow:/rep/La totalité du répertoire rep n'est pas indexée
Disallow:/rep/index.htmlindex.html situé dans le répertoire rep n'est pas indexé
# commentairesVos commentaires doit être précédé d'un #

4. Régles et précautions
a) Il doit exister un seul fichier robots.txt sur l'ensemble de votre site. Il doit être situé à la racine de votre site
b) L'astérisque (*) n'est acceptée que dans le champ User-agent
c) Vous devez créer plusieurs sections User-agent si vous souhaitez que votre fichier robots.txt s'applique à différents moteurs de recherche
d) Le nom du fichier (robots.txt) doit être écrit impérativement en minuscule.
e) Il n'existe pas de champs Allow:
f) Transférez votre fichier robots.txt en mode ASCII.





Zone MembreInfo...
Créez gratuitement votre
accès et soyez membre
d'ALL HTML !
Mot de passe oublié ?



Recommander ALL HTML
Si vous appréciez ce site,
n'hésitez pas à le faire
découvrir à vos ami(e)s...
Cliquez ici 
Top
 Tous Droits Réservés  -  Contact  -  Partenaires  -  Info Annonceurs  -  Données personnelles  -  Edition MobileHébergé par IKOULA