建立內容 Crawler 以從外部內容存放庫將內容匯入至您的入口網站。您必須執行與內容 Crawler 關聯的作業,以定期搜尋外部存放庫內容並匯入該內容。有關作業的詳細資訊,請參閱關於作業。
注:內容 Crawler 取決於內容來源。有關內容來源的資訊,請參閱關於內容來源。
此主題討論以下資訊:
要瞭解如何建立或編輯系統管理物件(包括內容 Crawler),請按一下此處。
Web 內容 Crawler 允許使用者從 Web 將內容匯入至入口網站。
要瞭解 Web 內容 Crawler 編輯器,請按一下以下編輯器頁之一﹕
遠端內容 Crawler 允許使用者將內容從外部內容存放庫匯入至入口網站。
一些爬行提供程式可隨入口網站一起安裝,並且可隨時供入口網站使用者使用,但其他提供程式則需要您手動安裝和設定。例如,Oracle 提供以下搜尋提供程式﹕
注:有關獲取搜尋提供程式的資訊,請參閱 Oracle Technology Network (http://www.oracle.com/technology/index.html)。有關安裝搜尋提供程式的資訊,請參閱 Installation Guide for Oracle WebCenter Interaction(可從 Oracle Technology Network (http://www.oracle.com/technology/documentation/bea.html) 取得)或搜尋提供程式隨附的文件,或者與入口網站管理員連絡。
建立遠端內容 Crawler﹕
要瞭解遠端內容 Crawler 編輯器,請按一下以下編輯器頁之一﹕
如果安裝了以下搜尋提供程式,每個提供程式都至少包含一個遠端內容 Crawler 編輯器的附加頁面:
內容 Web 服務允許您指定遠端內容存放庫的一般設定,而將目標和安全性設定留在關聯的遠端內容來源和遠端內容 Crawler 中進行設定。這使您可以爬過同一內容存放庫的多個位置時不必重複指定所有設定。
注: 您可以建立作為遠端內容來源基礎的內容 Web 服務。有關內容來源的資訊,請參閱關於內容來源。
要瞭解內容 Web 服務編輯器,請按一下以下編輯器頁之一﹕
使用者可以自動獲得對某些遠端內容 Crawler 所匯入內容的存取權。全域 ACL 同步化對應確定了這些內容 Crawler 如何匯入來源文件安全性。
有關如何匯入安全性的範例,請參閱匯入安全性範例。
如果內容 Crawler 未匯入預期內容,您應該檢查以下幾個方面﹕
確保資料夾篩選器能夠正確篩選內容。要瞭解篩選器測試,請參閱「主要設定(篩選器)」頁面上的測試篩選器。
確保內容 crawler 未將不需要的內容放入目標資料夾。如果文件未被篩選至任何子資料夾,內容 Crawler 可能會將該文件放入目標資料夾。這取決於資料夾編輯器主要設定頁面中的一項設定。
確保內容 crawler 未將內容放入「未分類文件」資料夾。如果無法將某文件放入任何目標資料夾或子資料夾,內容 Crawler 可能會將該文件放入「未分類文件」資料夾。這取決於內容 Crawler 編輯器進階設定頁面中的一項設定。如果您權限正確,則可在編輯目錄時檢視「未分類文件」資料夾,或透過按一下系統管理 | 選擇實用程式 | 存取未分類文件進行檢視。
確保您對目標資料夾至少具有編輯權限。
對於 Web 內容 crawler,確保自動排除協定以及任何排除或包含操作不會妨礙內容 crawler 匯入預期內容。這取決於內容 Crawler 編輯器網頁排除頁面中的一項設定。
確保關聯內容來源中指定的驗證資訊允許入口網站存取內容。
更多相關資訊,請檢視作業歷史記錄。