Paramètres principaux (crawler de contenu web)

Pour en savoir davantage sur les crawlers de contenu et les services web de contenu, cliquez ici.

Marche à suivre pour préciser l’emplacement visé par l’analyse ainsi que le dossier destinataire et les paramètres de sécurité des documents importés par ce crawler de contenu :

Dans la zone URL à analyser, tapez l’URL du site à partir duquel vous souhaitez importer du contenu.
Dans la liste déroulante Rayon d’analyse, précisez la profondeur maximum des liens que vous souhaitez analyser par rapport à la page cible. Par exemple, si vous choisissez 1, le crawler de contenu essaie d’importer toutes les pages directement liées à la page cible ; si vous choisissez 2, le crawler de contenu essaie d’importer toutes les pages directement liées à la page cible plus toutes les pages directement liées à ces pages liées.
Par défaut, ce crawler crée un lien vers l’URL indiqué à l’étape 1. Si vous ne souhaitez pas créer un lien vers cette page, désélectionnez la case Importer la page cible. Par exemple, quand vous analysez les résultats d’une recherche, vous n’avez pas besoin d’importer la page cible (la page des résultats de la recherche) ; par contre, vous voulez probablement importer chacune des pages liées (chaque résultat).
Indiquez les dossiers dans lesquels importer le contenu. Pour chaque document trouvé, le crawler de contenu essaie d’importer un lien dans le sous-dossier le plus bas du dossier destinataire permettant au lien de passer. Cliquez ici pour consulter l’organigramme illustrant la façon dont le crawler de contenu choisit les dossiers dans lesquels le contenu est importé.

Pour ajouter des dossiers destinataires, cliquez sur Ajouter un dossier ; ensuite, dans la boîte de dialogue Choisir des dossiers, sélectionnez les dossiers que vous souhaitez ajouter et cliquez sur OK. Pour analyser des documents dans un dossier, vous devez au moins disposer des droits de modification sur ce dossier.
Pour supprimer un dossier, sélectionnez celui-ci et cliquez sur .
Pour sélectionner ou désélectionner toutes les cases des dossiers, sélectionnez ou désélectionnez la case située à gauche de Chemin du dossier.
Pour changer l’ordre de tri des dossiers, cliquez sur Chemin du dossier. L’icône située à droite de Chemin du dossier indique le type de tri alphabétique : croissant () ou décroissant ().

Pour imposer aux documents de franchir les filtres des dossiers destinataires avant de pouvoir être importés dans ces dossiers, sélectionnez l’option Appliquer le filtre du dossier destinataire. Par défaut, les documents n’ont pas besoin de franchir les filtres des dossiers destinataires : tous les documents sont importés dans tous les dossiers destinataires.
Pour accepter tous les documents importés dans le portail et les mettre immédiatement à la disposition des utilisateurs, sélectionnez l’option Approuver automatiquement les documents importés. Par défaut, les documents doivent être approuvés. Cela signifie que le lien vers le document importé n’est mis à la disposition des utilisateurs qu’après avoir été approuvé par un administrateur du portail disposant de droits de modification dans le dossier destinataire.
Sous Droits d’accès au document, les actions ci-dessous permettent d’accorder aux utilisateurs et aux groupes des droits d’accès au contenu importé par ce crawler de contenu :

Pour ajouter des utilisateurs ou des groupes, cliquez sur Ajouter des utilisateurs/groupes ; ensuite, dans la boîte de dialogue Choisir des groupes et des utilisateurs, sélectionnez les utilisateurs et les groupes que vous souhaitez ajouter et cliquez sur Ok. Pour ajouter un utilisateur ou un groupe, vous devez au moins disposer du droit de sélection sur cet utilisateur ou ce groupe.
Pour chaque utilisateur ou groupe, choisissez dans la liste déroulante Privilège associée le droit d’accès que vous souhaitez accorder sur le contenu importé par ce crawler.
Pour supprimer un utilisateur ou un groupe, sélectionnez-le, puis cliquez sur .
Pour sélectionner ou désélectionner toutes les cases des utilisateurs et des groupes, sélectionnez ou désélectionnez la case située à gauche de Utilisateurs/Groupes.
Pour changer l’ordre dans lequel les utilisateurs et les groupes sont triés, cliquez sur Utilisateurs/Groupes ou cliquez sur l’icône située à droite (classement par ordre croissant de a à z) ou (classement par ordre décroissant de z à a).
Pour afficher les membres d’un groupe, cliquez sur le nom du groupe.

Marche à suivre pour afficher la page associée à cette rubrique d’aide :

Cliquez sur Administration.
Ouvrez l’Éditeur de crawler de contenu :

Marche à suivre pour créer un nouveau crawler de contenu web :

Ouvrez un dossier administratif.
Dans le menu Créer un objet, cliquez sur Crawler de contenu - WWW.
Dans la boîte de dialogue Choisir une source de contenu, sélectionnez la source de contenu qui convient et cliquez sur Ok.

Marche à suivre pour modifier un crawler de contenu web existant :

Naviguez jusqu’au crawler de contenu web que vous souhaitez modifier.
Cliquez sur le nom du crawler de contenu web.