Index-Maschinen und Aktualisierungsverteiler-Prozesse sind die Indizierungsprozesse eines Indizierungs- und Suchsystems. Eine Index-Maschine ist ein Prozess, der Daten der ihm zugeordneten Partition indiziert, sodass Suchmaschinen die Daten durchsuchen und Benutzer die Informationen in Content Server abrufen können. Eine Partition ist ein Teil eines Gesamtdatenindexes. Der Aktualisierungsverteiler-Prozess ist ebenfalls ein Prozess eines Index-Datenflusses, der Daten verwaltet und an Index-Maschinen weitergibt. Ein Aktualisierungsverteiler-Prozess liest vom Dokumentkonvertierungsprozess ausgegebene Daten aus einem iPool und verteilt diese Daten dann unter den Index-Maschinen der jeweiligen Partitionen. Hierdurch werden die zu indizierenden Daten gleichmäßig auf die Partitionen verteilt. Der Aktualisierungsverteiler-Prozess verteilt auch Indexaktualisierungsanforderungen an Index-Maschinen, sodass alle indizierten Daten einer Partition auf dem aktuellsten Stand bleiben. Hierzu kommuniziert der Aktualisierungsverteiler-Prozess mit den Index-Maschinen, um festzustellen, ob das zu aktualisierende Objekt im Index der Partition vorhanden ist. Wurde das Objekt gefunden, sendet der Aktualisierungsverteiler-Prozess die aktualisierten Daten zur Indizierung an die jeweilige Index-Maschine.
Wenn Sie Ihrem Indizierungs- und Suchsystem eine Partition hinzufügen, wird der Partition auch eine Index-Maschine hinzugefügt und die Index-Maschine wird automatisch mit dem Aktualisierungsverteiler-Prozess verbunden. Um einen Aktualisierungsverteiler-Prozess zu erstellen, fügen Sie ihn einem Index-Datenfluss hinzu. Das Erstellen eines Indexes erfordert das Hinzufügen von Partitionen zu Indizierungs- und Suchsystemen sowie das Hinzufügen von Aktualisierungsverteilern zu Index-Datenflüssen. Sie können Indizierungsprozesse löschen; das Löschen eines Aktualisierungsverteiler-Prozesses führt jedoch dazu, dass die Indizierung für ein Indizierungs- und Suchsystem gestoppt wird. Das Löschen einer Index-Maschine kann ebenfalls die Einstellung der Indizierung für einen Partitionsindex oder ein Indizierungs- und Suchsystem zur Folge haben. OpenText empfiehlt, keine Indizierungsprozesse zu löschen.
Nachdem Sie eine Index-Maschine oder einen Aktualisierungsverteiler-Prozess hinzugefügt haben, können Sie deren Funktionsweise konfigurieren. Für manche Einstellungen werden beim Hinzufügen der Indizierungsprozesse automatisch Standardwerte angegeben; diese Werte müssen jedoch u. U. geändert werden. Beim Konfigurieren einer Index-Maschine können Sie eine Zusammenfassung der Ereignisse erzeugen, die in der Protokolldatei einer Index-Maschine aufgezeichnet werden. Die Zusammenfassung der Protokolldatei enthält Statistiken zu dem Partitionsindex, zu dem die Index-Maschine gehört. Weitere Informationen über die in den Zusammenfassungen der Indexprotokolldatei enthaltenen Daten erhalten Sie beim OpenText-Kundendienst. Bevor Sie Prozesse konfigurieren, müssen Sie diese anhalten. Sie können einen einzelnen Prozess anhalten oder alle Indizierungsprozesse auf einmal stoppen. Es ist egal, ob Sie einen einzelnen oder alle Indizierungsprozesse anhalten - hierdurch wird die Indizierung für das Indizierungs- und Suchsystem, zu dem die Prozesse gehören, vollständig gestoppt.
Wenn Sie eine Index-Maschine konfigurieren, können Sie auch den Index der Partition überprüfen, zu der die Index-Maschine gehört. Beim Überprüfen eines Partitionsindexes wird eine Analyse zu potenziellen Problemen durchgeführt. Während der Überprüfung des Indexes stellt der Aktualisierungsverteiler-Prozess fest, ob die Datenstrukturen synchronisiert sind. Nachdem Content Server die Überprüfung eines Partitionsindexes beendet hat, wird eine Überprüfungsprotokolldatei angezeigt, die den Prozentsatz gelöschter Objekte und Wörter enthält, falls die Überprüfung erfolgreich war. War die Überprüfung nicht erfolgreich, enthält die Überprüfungsprotokolldatei Diagnoseinformationen, die Sie dem OpenText-Kundendienst mitteilen können.
Wenn Sie den Index einer Partition validieren werden interne Prüfungen der Indexstruktur ausgeführt, die sich nach der angegebenen Ebene richten. Die Ebenen 1 bis 5 sind kumulativ:
Ebene 1: Ermittelt Inkonsistenzen, wenn die Daten in den Dateien otadmin.cfg und search.ini nicht mit den entsprechenden Informationen in der Content Server-Datenbank übereinstimmen. Wenn diese Informationen nicht konsistent sind, beispielsweise weil die in beiden Dateien erfassten Dateien gelöscht oder beschädigt wurden, müssen Sie die Indizierungsprozesse möglicherweise neu synchronisieren
Ebene 2: Auch die Prüfsumme der Checkpoint-Datei wird geprüft. In einer Checkpoint-Datei werden Partitionsmetadaten im Speicher abgelegt. Mit einer Prüfsumme der Metadatenintegrität kann überprüft werden, dass die Daten in der Checkpoint-Datei nicht beschädigt wurden.
Ebene 3: Prüft außerdem, ob die Checkpoint-Datei in den Speicher geladen werden kann. Such-Maschinen laden ihren Status aus den letzten aktuellen Checkpoint- und Indexdateien und wenden inkrementelle Änderungen aus den Dateien accumlog und metalog an.
Ebene 4: Prüft außerdem die Prüfsumme aller Dateien mit Volltextindex im Bereich OTChecksum, um sicherzustellen, dass die Daten nicht beschädigt sind.
Ebene 5: Prüft außerdem, ob die Wortzeiger im Inhaltsindex konsistent sind. Verschiebungsdateien enthalten Zeiger auf Listen mit Ablageorten für Wörter, die für die Volltextsuche verwendet werden. Sie geben der Such-Maschine die relative Position eines Wortes innerhalb eines indizierten Objekts an.
Ebene 10: Prüft außerdem, ob die Wortzeiger im Metadatenindex vorhanden sind. Diese Ebene der Überprüfung ist von den untergeordneten Ebenen unabhängig. Die Metadaten-Indexdateien sind mit den entsprechendenen Volltext-Indexdateien identische, enthalten jedoch Indexdaten für Textmetadaten-Bereiche.
Ein Admin-Server schreibt Informationen in die Dateien otadmin.cfg und search.ini, um die Änderungen in der Content Server-Datenbank widerzuspiegeln (wenn z. B. eine Partition konfiguriert oder gelöscht wurde). Bei den Dateien otadmin.cfg und search.ini handelt es sich um Konfigurationsdateien, in denen Informationen zu den mit Datenquellen verbundenen Systemobjekten gespeichert sind. Im Besonderen enthält die Datei search.ini Einstellungen, die beim Erstellen von Komponenten für Indizierungs- und Suchsysteme (z. B. Partitionen, Index-Maschinen und Suchmaschinen) standardmäßig eingerichtet werden. OpenText empfiehlt dringend, die Einstellungen der Datei search.ini nicht zu ändern. Die Informationen in den Dateien otadmin.cfg und search.ini müssen jederzeit mit den entsprechenden Informationen der Content Server-Datenbank übereinstimmen. Es kann jedoch zu Ungleichheiten kommen (z. B., wenn die in der Datei verzeichneten Informationen gelöscht oder beschädigt werden). In diesem Fall müssen Sie die Indizierungsprozesse möglicherweise resynchronisieren. Beim Resynchronisieren von Indexprozessen werden die Dateien otadmin.cfg und search.ini entsprechend der derzeit in der Content Server-Datenbank enthaltenen Prozessinformationen geändert.