Mithilfe der Directory Walker-Technologie von Content Server können Sie Datenflüsse erstellen, die Daten in Ihrem Dateisystem indizieren. So können Content Server-Benutzer aus Content Server heraus nach diesen Daten suchen. Directory Walker ermöglicht das Durchsuchen und Indizieren von Dateisystemen, ohne dass Objekte in Content Server erstellt werden. Für jeden von Ihnen erstellten Directory Walker-Index geben Sie ein oder mehrere Verzeichnisse der obersten Ebene Ihres Dateisystems an, die indiziert werden sollen.
Ein Directory Walker-Datenfluss besteht aus einem Directory Walker-Prozess, einem Dokumentkonvertierungsprozess und einem Aktualisierungsverteiler-Prozess. Der Directory Walker-Prozess durchläuft die von Ihnen angegebenen Verzeichnisse der obersten Ebene (sowie gegebenenfalls deren Unterverzeichnisse) und sucht nach Dateien, die den eingegebenen Suchkriterien entsprechen.
Sie legen die Dateitypen fest, die vom Directory Walker-Prozess abgerufen werden, indem Sie die entsprechenden Kriterien zum Ein- und Ausschließen von Dateien (z. B. Dateinamenmuster, Datumsbereiche und Dateigrößenbereiche) angeben. Der Directory Walker-Prozess schreibt die Dateien, die mit den Kriterien übereinstimmen, in einen iPool. Der Dokumentkonvertierungsprozess liest die Daten aus diesem iPool, konvertiert sie in HTML oder einfachen Text und schreibt sie in einen zweiten iPool. Der Aktualisierungsverteiler-Prozess liest die Daten aus diesem zweiten iPool, gibt sie an die von ihm verwalteten Index-Maschinen weiter und gibt Befehle aus, den entsprechenden Index zu generieren oder zu aktualisieren.
Wenn Sie einen Directory Walker-Datenfluss erstellen, generiert Content Server Ereignisprotokolldateien. Ereignisprotokolldateien enthalten Informationen zu den Dateien, die der Directory Walker-Prozess bereits durchlaufen hat. Wenn ein Directory Walker-Prozess eine Reihe von Verzeichnissen erneut durchläuft, vergleicht er die Ereignisprotokolldateien mit den Dateien, die derzeit im Verzeichnis gespeichert sind, um festzustellen, ob neue Dateien vorhanden sind und welche Dateien aktualisiert oder gelöscht wurden. Der Directory Walker-Prozess extrahiert Informationen über Dateien, die im Datenfluss ersetzt oder gelöscht wurden bzw. zum Datenfluss hinzugefügt wurden. Der Directory Walker-Prozess extrahiert nicht alle Dateien erneut. Dadurch wird die Indexaktualisierung effizienter. Sie können den Ablageort der Ereignisdateien auf der Registerkarte Spezifisch der Directory Walker-Eigenschaftenseite ändern.
Wenn Sie davon ausgehen, dass sich die Daten in den indizierten Verzeichnissen ändern, können Sie Datenflüsse verwalten, und zwar so, dass die Verzeichnisse erneut durchlaufen werden, oder Sie können nach einem festen Zeitplan Startoptionen für einen Datenflussprozess konfigurieren. Weitere Informationen finden Sie unter Startoptionen für einen Datenflussprozess konfigurieren .
Beim Einrichten einer Directory Walker-Datenquelle wählen Sie als erstes einen Namen für die Datenquelle und legen fest, welche Ports von den Prozessen überwacht werden.
Nachdem Sie die Datenquelle benannt und ihre Portnummern angegeben haben, konfigurieren Sie ihre Hyperlink-Zuordnungen. Über Hyperlink-Zuordnungen können Benutzer bei der Anzeige von Suchergebnissen auf Informationen in einer Directory Walker-Datenquelle zugreifen. Dokumente in einer Directory Walker-Datenquelle werden durch ihren vollständigen Pfad identifiziert. Wenn diese Dokumente von einer Suche zurückgegeben werden, werden sie auf der Ergebnisseite in Form ihrer Pfadnamen angezeigt. Um sicherzustellen, dass jedes Ergebnis mit dem entsprechenden Dokument verknüpft ist, müssen Sie eine Hyperlink-Zuordnung erstellen, durch die die Datenquelle so konfiguriert wird, dass die Dokumente über einen Webserver zur Verfügung gestellt werden. Ein Webserver muss ausgeführt werden, damit Hyperlink-Zuordnungen ordnungsgemäß funktionieren.
Sie listen die zu durchlaufenden Verzeichnisse beim Konfigurieren eines Directory Walker auf. Alle aufgeführten Verzeichnisse müssen über ein gemeinsames Stammverzeichnis verfügen. Angenommen, Sie richten den Directory Walker so ein, dass die Verzeichnisse c:/dirA/dir1 und c:/dirA/dir2 durchlaufen werden. In diesem Fall können Sie eine Hyperlink-Zuordnung von c:/dirA aus erstellen. Wenn Sie unterschiedliche Stammverzeichnisse auflisten, z. B. c:/dirA und c:/dirB oder c:/dirA und d:/dirA, kann keine Hyperlink-Zuordnung von diesen beiden Pfaden aus erstellt werden. Verfügen Ihre Verzeichnisse nicht über ein gemeinsames Stammverzeichnis, können Sie separate Directory Walker-Indizes erstellen, damit die Verzeichnisse Hyperlink-Zuordnungen verwenden können.
Sie können Hyperlink-Zuordnungen beim Erstellen einer Directory Walker-Datenquelle oder beim Einrichten des Suchmanagers konfigurieren. Für andere Datenquellen, die nicht von Ihrem Unternehmen stammen, konfigurieren Sie Hyperlink-Zuordnungen mithilfe der unter Hyperlink-Zuordnungen konfigurieren beschriebenen Schritte. Beispiele für solche Datenquellen sind die Datenquelle der Admin-Hilfe, die Directory Walker-Datenquelle, die Datenquelle der Benutzerhilfe und die XML Activator-Hersteller-Datenquelle.
Nach dem Einrichten einer Directory Walker-Datenquelle konfigurieren Sie die Directory Walker-Informationen. Der Directory Walker ist ein Prozess, der Daten aus dem Dateisystem extrahiert und diese Daten in einen Datenaustausch-Pool (iPool) schreibt.
Wenn Sie einen Directory Walker-Index erstellen, indem Sie Directory Walker-Datenquelle aus dem Menü Objekt hinzufügen auf der Seite Systemverwaltung wählen, gibt Content Server automatisch Protokollierungsoptionen für den entsprechenden Datenfluss an. Hierbei werden standardmäßige Protokolldateinamen, Grade und Ablageorte verwendet. Wenn Sie benutzerdefinierte Protokollierungsoptionen angeben möchten, können Sie die Standardangaben auf der Directory Walker-Eigenschaftenseite bearbeiten, nachdem Content Server den Datenfluss erstellt hat.
Beim Angeben von Verzeichnissen auf der Seite „Neue Directory Walker-Datenquelle erstellen“ müssen Sie die Verzeichnispfade so angeben, wie sie auf dem Host des Admin-Servers zugeordnet sind, dessen Verknüpfung Sie aus der Liste Host auswählen.
Nachdem Sie eine Directory Walker-Datenquelle eingerichtet und den Directory Walker-Prozess konfiguriert haben, müssen Sie die Zwischenprozessinformationen für die Dokumentkonvertierung angeben. Der Dokumentkonvertierungsprozess liest Daten aus einem iPool (Interchange Pool), konvertiert diese in HTML oder einfachen Text und schreibt die Daten in einen weiteren iPool.
Bei der Angabe der Lese- und Schreibverzeichnisse für den Dokumentkonvertierungsprozess müssen Sie die Verzeichnispfade so eingeben, wie sie auf dem Host des Admin-Servers zugeordnet sind, dessen Verknüpfung Sie in der Liste Host auswählen.
Nachdem Sie eine Directory Walker-Datenquelle eingerichtet und die Directory Walker- und Dokumentkonvertierungsprozesse konfiguriert haben, müssen Sie die Informationen für den Aktualisierungsverteiler angeben. Weitere Informationen zum Konfigurieren von Indexaktualisierungsprozessen finden Sie unter Indizierungsprozesse konfigurieren.
Bei der Angabe der Lese- und Indexverzeichnisse für den Indexaktualisierungsprozess müssen Sie die Verzeichnispfade so eingeben, wie sie auf dem Host des Admin-Servers zugeordnet sind, dessen Verknüpfung Sie in der Liste Host auswählen.
Nachdem Sie eine Directory Walker-Datenquelle eingerichtet und die Directory Walker-, Dokumentkonvertierungs- und Aktualisierungsverteiler-Prozesse konfiguriert haben, können Sie die Einrichtung der Directory Walker-Datenquelle abschließen.
Sie können angeben, ob die Prozesse im Directory Walker-Datenfluss bei der Erstellung oder manuell ausgeführt werden, nachdem Sie den Datenfluss erstellt haben. Wenn Sie z. B. XML-Daten für die mit dieser Datenquelle verknüpften Suchmaschinen indizieren möchten (siehe dazu XML-Daten indizieren), können Sie den Datenfluss erstellen, die Attribute veröffentlichen und dann die Datenflussprozesse starten, damit die XML-Attribute beim Ausführen indiziert werden.