robots.txt

Molto spesso questo file non è utilizzato e non viene preso in considerazione, un po' perchè non lo si conosce un po' per il suo dubbio funzionamento. A cosa serve infatti questo files?

Innanzitutto viene posizionato nella directory principale (" / ") del sito, dove c'è l'index.html e serve per dire al motore di ricerca quali pagine escludere dall'indicizzazione. Molti di voi diranno subito che è quindi inutile, dato che lo scopo è quello di indicizzare il maggior numero di pagine. Se però pensiamo a pagine private o pagine di accesso a zone riservate è consigliabile dire ai motori di stare alla larga da essi. Per far ciò si crea un file txt "robots.txt", attenzione che il nome sia giusto e si usa in questo modo:

User-Agent: *
Disallow: /password/pwd.html
Disallow: /dati-personali/

User-Agent: *
indica che il files vale per ogni motore di ricerca

Disallow: /password/pwd.html
indica che i motori non devono indicizzare il file pwd.html

Disallow: /dati personali/
indica che i motori non devono indicizzare nessun file presente nella directory dati-personali

E' possibile creare anche un robots.txt dicendo ai motori di indicizzare tutte le pagine del nostro sito, comportamento che comunque il motore esegue di norma, quindi è un po' inutile, utilizzando:

User-Agent: *
Disallow:

Oppure dire di non indicizzare nessuna pagina del sito con:

User-Agent: *
Disallow: /

 

Copyright © 2004 - http://ilwebmaster.altervista.org/ - Tutti i diritti riservati -