Esclusioni pagine Web

Per configurare questo crawler in modo da evitare l'importazione di pagine Web indesiderate nel portale, eseguire i passaggi descritti di seguito.

  1. Per impostazione predefinita, questo crawler segue le raccomandazioni del server Web sulle pagine che potrebbero essere utili ai crawler automatizzati. Se si desidera ignorare queste raccomandazioni, deselezionare la casella Seguire i protocolli di esclusione del robot del sito di destinazione.

    In generale, queste raccomandazioni aiutano a limitare l'analisi di contenuto non desiderato nel portale. In ogni caso, alcuni siti offrono raccomandazioni di tipo molto rigido. Se il crawler non importa alcun contenuto da un sito, provare a disattivare questa opzione.

  2. Per impostazione predefinita, questo crawler salva gli URL nelle pagine Web importate con le lettere maiuscole usate sul sito Web di origine. Per cambiare le lettere degli URL da maiuscole a minuscole, selezionare Cambiare le lettere di tutti gli URL da maiuscole a minuscole.

  3. Per evitare di importare contenuto da un'area specifica di un sito Web oppure evitare l'importazione di pagine particolari, eseguire quanto descritto di seguito.

  4. Per impostazione predefinita, questo crawler non analizza o importa pagine specificate nelle esclusioni. Se il crawler navigherà da un link su una pagina esclusa ad una pagina che non è esclusa e che dovrebbe essere importata, scegliere Analizzare le pagine escluse, ma non importarle.

  5. Per limitare l'analisi ad un'area di un sito Web o a pagine particolari, eseguire quanto descritto di seguito.


  1. Fare clic su Amministrazione.
  2. Aprire l'Editor Crawler Web.
  3. A sinistra, sotto Modifica impostazioni oggetto, fare clic su Esclusioni pagine Web.