Informazioni sui crawler di contenuto

La pagina illustra come creare un crawler per importare contenuto nel portale da repository di contenuto esterne. Si dovrà eseguire un job associato al crawler di contenuto per eseguire ricerche periodiche nella repository esterna sul contenuto, e importare quel contenuto. Per informazioni sui job, consultare Informazioni sui job.

Nota: i crawler di contenuto dipendono dalle origini contenuto. Per informazioni sulle origini dati consultare Informazioni sulle origini contenuto.

Quest'argomento tratta le seguenti informazioni:

Crawler di contenuto Web
Crawler di contenuto remoto
Web service Contenuto
Come importare la sicurezza dei documenti
Risoluzione di problemi derivanti dai risultati di un'analisi

Per imparare a creare o modificare oggetti amministrativi (crawler di contenuto inclusi), fare clic qui.

Crawler di contenuto Web

Un crawler di contenuto Web consente agli utenti di importare contenuto dal Web nel portale.

Per saperne di più sull'Editor Crawler di contenuto Web, fare clic su una delle seguenti pagine editor:

Scegli un’origine contenuto
Impostazioni principali
Esclusioni pagine Web
Impostazioni di destinazione
Impostazioni documento
Tipo di contenuto
Impostazioni avanzate
Imposta job
Proprietà e nomi
Sicurezza (disponibile solo quando si modifica un oggetto)
Cronologia e stato migrazioni (disponibile solo quando si modifica un oggetto)

Crawler di contenuto remoto

Un crawler di contenuto remoto consente agli utenti di importare contenuto da una repository di contenuto esterna nel portale.

Alcuni provider di analisi vengono installati con il portale e sono immediatamente disponibili per i suoi utenti; altri provider richiedono installazione ed impostazione manuale. Ad esempio, Oracle offre i provider di analisi indicati di seguito.

File Windows NT (in dotazione al software del portale)
Documentum
Microsoft Exchange
Lotus Notes

Nota: Per informazioni su come ottenere provider di analisi, fare riferimento a Oracle Technology Network pressohttp://www.oracle.com/technology/index.html. Per informazioni su come installare i provider di analisi, fare riferimento a Installation Guide for WebCenter Interaction (Guida all'installazione di WebCenter Interaction), (disponibile sull'Oracle Technology Network (disponibile sull'Oracle Technology Network presso http://www.oracle.com/technology/documentation/bea.html) o alla documentazione in dotazione al provider di analisi, oppure contattare l'amministratore del portale.

Per creare un nuovo crawler di contenuto remoto, eseguire quanto descritto di seguito.

Installare il provider di analisi sul computer del server del portale, o su un altro computer.
Creare un server remoto.
Creare un Web service contenuto (argomento discusso di seguito).
Creare un'origine contenuto remoto.
Creare un crawler di contenuto remoto.

Per saperne di più sull'Editor Crawler di contenuto remoto, fare clic su una delle seguenti pagine editor:

Scegli un’origine contenuto
Impostazioni principali
Impostazioni documento
Tipo di contenuto
Impostazioni avanzate
Imposta job
Proprietà e nomi
Sicurezza (disponibile solo quando si modifica un oggetto)
Cronologia e stato migrazioni (disponibile solo quando si modifica un oggetto)

Ogni provider di analisi ulteriormente installato include almeno una pagina extra per l'Editor Crawler di contenuto remoto.

File Windows NT (in dotazione al software del portale)
Documentum
Microsoft Exchange
Lotus Notes

Web service Contenuto

I Web service Crawler di contenuto consentono di specificare le impostazioni generali per la repository di contenuto remoto, lasciando le impostazioni di destinazione e sicurezza alla fonte di autenticazione remota associata ed al crawler di contenuto remoto. Questo consente di analizzare più posizioni della stessa repository di contenuto senza dover ripetutamente specificare tutte le impostazioni.

Nota: l'utente crea Web service Crawler di contenuto su cui basare le proprie origini contenuto remoto. Per informazioni sulle origini dati consultare Informazioni sulle origini contenuto.

Per saperne di più sull'Editor dei Web service contenuto, fare clic su una delle seguenti pagine editor:

Impostazioni principali
Configurazione HTTP
Preferenze
Impostazioni avanzate URL
Impostazioni avanzate
Impostazioni di autenticazione
Preferenze
Informazioni utente
Impostazioni debugging
Oggetti associati (disponibile solo quando si modifica un oggetto)
Proprietà e nomi
Sicurezza (disponibile solo quando si modifica un oggetto)
Cronologia e stato migrazioni (disponibile solo quando si modifica un oggetto)

Importazione della sicurezza documenti

Agli utenti può essere automaticamente concesso l'accesso al contenuto importato da alcuni crawler di contenuto remoti. La Mappa ACL di sincronizzazione globale mostra a questi crawler di contenuto come importare la sicurezza dei documenti d'origine.

Se si desidera vedere un esempio di importazione della sicurezza, fare clic suEsempio di importazione della sicurezza.

Risoluzione di problemi derivanti dai risultati di un'analisi

Qualora il crawler di contenuto non dovesse importare il contenuto previsto, si consiglia di controllare quanto segue.

Verificare che i filtri delle cartelle eseguano correttamente il filtraggio del contenuto. Per saperne di più su come controllare i filtri, consultare la sezione Controllo dei filtri nella pagina Impostazioni principali (Filtro).
Verificare che il crawler di contenuto non abbia collocato contenuto indesiderato nella cartella di destinazione. Se un documento non passa i filtri di qualsiasi sottocartella, il crawler di contenuto potrà collocare il documento in una cartella di destinazione. Questo viene determinato da un'impostazione sulla pagina Impostazioni principali dell'Editor Cartella.
Verificare che il crawler di contenuto non abbia collocato contenuto nella cartella Documenti non classificati. Se un documento non può essere collocato in alcuna cartella o sottocartella di destinazione, il crawler di contenuto potrebbe collocarlo nella cartella Documenti non classificati. Questo viene determinato da un'impostazione sulla pagina Impostazioni principali dell'Editor Crawler di contenuto. Se si è in possesso delle autorizzazioni corrette, sarà possibile vedere la cartella Documenti non classificati mentre si modifica da directory o facendo clic su Amministrazione | Selezionae utility | Accedi a Documenti non classificati.
Assicurarsi di disporre almeno dell'accesso di tipo Modifica alla cartella di destinazione.
Per i crawler Web di contenuto, verificare che i protocolli di esclusione robot o qualsiasi esclusione o inclusione non impediscano al crawler di importare il contenuto previsto. Questo viene determinato da un'impostazione sulla pagina Esclusioni pagina Web dell'Editor Crawler di contenuto.
Verificare che le informazioni di autenticazione specificate nell'origine contenuto associata consentano al portale di accedere al contenuto.
Rivedere la cronologia job per ulteriori informazioni.