Paramètres principaux (crawler de contenu web)

Pour en savoir davantage sur les crawlers de contenu et les services web de contenu, cliquez ici.

Marche à suivre pour préciser l’emplacement visé par l’analyse ainsi que le dossier destinataire et les paramètres de sécurité des documents importés par ce crawler de contenu :

  1. Dans la zone URL à analyser, tapez l’URL du site à partir duquel vous souhaitez importer du contenu.

  2. Dans la liste déroulante Rayon d’analyse, précisez la profondeur maximum des liens que vous souhaitez analyser par rapport à la page cible. Par exemple, si vous choisissez 1, le crawler de contenu essaie d’importer toutes les pages directement liées à la page cible ; si vous choisissez 2, le crawler de contenu essaie d’importer toutes les pages directement liées à la page cible plus toutes les pages directement liées à ces pages liées.

  3. Par défaut, ce crawler crée un lien vers l’URL indiqué à l’étape 1. Si vous ne souhaitez pas créer un lien vers cette page, désélectionnez la case Importer la page cible. Par exemple, quand vous analysez les résultats d’une recherche, vous n’avez pas besoin d’importer la page cible (la page des résultats de la recherche) ; par contre, vous voulez probablement importer chacune des pages liées (chaque résultat).

  4. Indiquez les dossiers dans lesquels importer le contenu. Pour chaque document trouvé, le crawler de contenu essaie d’importer un lien dans le sous-dossier le plus bas du dossier destinataire permettant au lien de passer. Cliquez ici pour consulter l’organigramme illustrant la façon dont le crawler de contenu choisit les dossiers dans lesquels le contenu est importé.

  5. Pour imposer aux documents de franchir les filtres des dossiers destinataires avant de pouvoir être importés dans ces dossiers, sélectionnez l’option Appliquer le filtre du dossier destinataire. Par défaut, les documents n’ont pas besoin de franchir les filtres des dossiers destinataires : tous les documents sont importés dans tous les dossiers destinataires.

  6. Pour accepter tous les documents importés dans le portail et les mettre immédiatement à la disposition des utilisateurs, sélectionnez l’option Approuver automatiquement les documents importés. Par défaut, les documents doivent être approuvés. Cela signifie que le lien vers le document importé n’est mis à la disposition des utilisateurs qu’après avoir été approuvé par un administrateur du portail disposant de droits de modification dans le dossier destinataire.

  7. Sous Droits d’accès au document, les actions ci-dessous permettent d’accorder aux utilisateurs et aux groupes des droits d’accès au contenu importé par ce crawler de contenu :


  1. Cliquez sur Administration.
  2. Ouvrez l’Éditeur de crawler de contenu :