La pagina illustra come creare un crawler per importare contenuto nel portale da repository di contenuto esterne. Si dovrà eseguire un job associato al crawler di contenuto per eseguire ricerche periodiche nella repository esterna sul contenuto, e importare quel contenuto. Per informazioni sui job, consultare Informazioni sui job.
Nota: i crawler di contenuto dipendono dalle origini contenuto. Per informazioni sulle origini dati consultare Informazioni sulle origini contenuto.
Quest'argomento tratta le seguenti informazioni:
Per imparare a creare o modificare oggetti amministrativi (crawler di contenuto inclusi), fare clic qui.
Un crawler di contenuto Web consente agli utenti di importare contenuto dal Web nel portale.
Per saperne di più sull'Editor Crawler di contenuto Web, fare clic su una delle seguenti pagine editor:
Un crawler di contenuto remoto consente agli utenti di importare contenuto da una repository di contenuto esterna nel portale.
Alcuni provider di analisi vengono installati con il portale e sono immediatamente disponibili per i suoi utenti; altri provider richiedono installazione ed impostazione manuale. Ad esempio, Oracle offre i provider di analisi indicati di seguito.
Nota: Per informazioni su come ottenere provider di analisi, fare riferimento a Oracle Technology Network pressohttp://www.oracle.com/technology/index.html. Per informazioni su come installare i provider di analisi, fare riferimento a Installation Guide for WebCenter Interaction (Guida all'installazione di WebCenter Interaction), (disponibile sull'Oracle Technology Network (disponibile sull'Oracle Technology Network presso http://www.oracle.com/technology/documentation/bea.html) o alla documentazione in dotazione al provider di analisi, oppure contattare l'amministratore del portale.
Per creare un nuovo crawler di contenuto remoto, eseguire quanto descritto di seguito.
Per saperne di più sull'Editor Crawler di contenuto remoto, fare clic su una delle seguenti pagine editor:
Ogni provider di analisi ulteriormente installato include almeno una pagina extra per l'Editor Crawler di contenuto remoto.
I Web service Crawler di contenuto consentono di specificare le impostazioni generali per la repository di contenuto remoto, lasciando le impostazioni di destinazione e sicurezza alla fonte di autenticazione remota associata ed al crawler di contenuto remoto. Questo consente di analizzare più posizioni della stessa repository di contenuto senza dover ripetutamente specificare tutte le impostazioni.
Nota: l'utente crea Web service Crawler di contenuto su cui basare le proprie origini contenuto remoto. Per informazioni sulle origini dati consultare Informazioni sulle origini contenuto.
Per saperne di più sull'Editor dei Web service contenuto, fare clic su una delle seguenti pagine editor:
Agli utenti può essere automaticamente concesso l'accesso al contenuto importato da alcuni crawler di contenuto remoti. La Mappa ACL di sincronizzazione globale mostra a questi crawler di contenuto come importare la sicurezza dei documenti d'origine.
Se si desidera vedere un esempio di importazione della sicurezza, fare clic suEsempio di importazione della sicurezza.
Qualora il crawler di contenuto non dovesse importare il contenuto previsto, si consiglia di controllare quanto segue.
Verificare che i filtri delle cartelle eseguano correttamente il filtraggio del contenuto. Per saperne di più su come controllare i filtri, consultare la sezione Controllo dei filtri nella pagina Impostazioni principali (Filtro).
Verificare che il crawler di contenuto non abbia collocato contenuto indesiderato nella cartella di destinazione. Se un documento non passa i filtri di qualsiasi sottocartella, il crawler di contenuto potrà collocare il documento in una cartella di destinazione. Questo viene determinato da un'impostazione sulla pagina Impostazioni principali dell'Editor Cartella.
Verificare che il crawler di contenuto non abbia collocato contenuto nella cartella Documenti non classificati. Se un documento non può essere collocato in alcuna cartella o sottocartella di destinazione, il crawler di contenuto potrebbe collocarlo nella cartella Documenti non classificati. Questo viene determinato da un'impostazione sulla pagina Impostazioni principali dell'Editor Crawler di contenuto. Se si è in possesso delle autorizzazioni corrette, sarà possibile vedere la cartella Documenti non classificati mentre si modifica da directory o facendo clic su Amministrazione | Selezionae utility | Accedi a Documenti non classificati.
Assicurarsi di disporre almeno dell'accesso di tipo Modifica alla cartella di destinazione.
Per i crawler Web di contenuto, verificare che i protocolli di esclusione robot o qualsiasi esclusione o inclusione non impediscano al crawler di importare il contenuto previsto. Questo viene determinato da un'impostazione sulla pagina Esclusioni pagina Web dell'Editor Crawler di contenuto.
Verificare che le informazioni di autenticazione specificate nell'origine contenuto associata consentano al portale di accedere al contenuto.
Rivedere la cronologia job per ulteriori informazioni.