Ein Unternehmensweit-Extractor-Prozess ist ein Datenflussprozess, der Objekte und Metadaten aus Content Server extrahiert und in den Datenfluss schreibt, um den Content Server-Index zu aktualisieren.

Die meisten Einstellungen des Unternehmensweit-Extractors werden auf der Seite Allgemeine Extractor-Einstellungen festlegen konfiguriert. Hier wird gesteuert, wie Objekte dem Suchindex hinzugefügt werden. Auch andere Einstellungen können sich auf das Extractor-Verhalten auswirken, beispielsweise ausgeschlossene MIME-Typen, die in der Datei opentext.ini definiert werden.

Auf der Seite Allgemeine Extractor-Einstellungen festlegen sind die folgenden Steuerelemente enthalten:

Element Beschreibung
Allgemeine Einstellungen
Grad der Protokollierung
Gibt den Protokollierungsgrad für die Datenextrahierung und -indizierung mit Enterprise Extractor an. Die Protokolldaten werden in die Thread-Protokolle von Content Server geschrieben:

Normal: Gibt den Standard-Protokollierungsgrad an, bei dem ein minimaler Grad des Extractor-Fortschritts protokolliert wird.

Information: Gibt den Grad der ausführlichen Protokollierung an.

Detailliert: Legt den Debuggen-Protokollierungsgrad fest, der ein detailliertes Protokoll für den Debug-Prozess erstellt.

 

Hinweis

Hinweis:
Content Server Debug-Grad muss größer gleich 2 sein, damit die Extractor-Protokollierung funktioniert.

 
Benachrichtigung bei Wiederherstellung des Inhalts
Wird diese Auswahl getroffen, wird eine Benachrichtigungs-E-Mail an den Administrator gesendet, wenn der Extractor die Dokumente für die Inidizierung nicht mehr verarbeiten kann. Standardmäßig ist diese Option deaktiviert.
Maximale Anzahl von Objekten pro Extrahierung
Gibt die maximale Anzahl der Anforderungen zur Aktualisierung des Suchindex an, den der Extractor verarbeitet, wenn die einzelnen Typen von Iteratorläufen ausgeführt werden:

Sammlungen: Verarbeitet alle Objekte einer gesamten Sammlung direkt.

Wiederherstellung: Nimmt die Extrahierung von Elementen vor, deren Inhalte beim ersten Mal nicht extrahiert werden konnten.

Erneut extrahieren: Bearbeitet extrahierende Unternehmensweit-Daten, damit der ursprüngliche Suchindex erstellt wird oder wenn ein Neuindizierungsvorgang über die Wartungsseite des Datenfluss-Managers für die Unternehmensweit-Datenquelle angefordert wurde.

Gezielte Aktualisierungen: Steuert die Aktualisierung von Unternehmensweit-Daten auf effiziente Weise, d. h. es werden nicht alle Daten extrahiert, sondern nur diejenigen, die für eine Änderung relevant sind. Beispielsweise werden nur die Relevanzpunkte eines Objekts extrahiert, wenn sich diese Information ändert. DerOpenText-Kundendienst empfiehlt, diesen Typ auf Normale Extrahierung eingestellt zu lassen, damit der Index aktuell bleibt.

Hinzufügen/Bearbeiten: Steuert die Extrahierung von Unternehmensweit-Daten von neu hinzugefügten oder aktualisierten Objekten. DerOpenText-Kundendienst empfiehlt, diesen Typ auf Normale Extrahierung eingestellt zu lassen, damit der Index aktuell bleibt.

Initiierte Workflows: Steuert die Extrahierung der Aufgabeninformationen für Workflow-Schritte, die gerade bearbeitet werden. Diese Informationen sind im Suchindex für die Dauer der Workflow-Schritte vorhanden und werden anschließend automatisch entfernt.

Alle anderen: Die Extrahierungstypen in Content Server sind erweiterbar. Es handelt sich hierbei um eine Sammeleinstellung für ältere oder optionale Typen, die auf dieser Seite möglicherweise nicht angezeigt werden.

Wählen Sie für die einzelnen Iterator-Typen eine Verarbeitungsoption aus der Liste aus:

Normale Extrahierung: Extrahierung verläuft normal.

Extrahierung anhalten: Für diesen Iterator findet keine Extrahierung statt. Die Elemente in der Warteschlange des Iterators bleiben erhalten, die Warteschlange darf weiter anwachsen.

 

Tipp

Tipp:
Diese Option sollte nur temporär verwendet werden, beispielsweise um anderen Iteratoren die Verarbeitung einer größeren Datenmenge zu ermöglichen.

 

Indizierungsanforderungen verwerfen: Für diesen Iterator findet keine Extrahierung statt. Elemente in der Warteschlange des Iterators werden in regelmäßigen Abständen gelöscht, um zu vermeiden, dass die Kapazität erschöpft wird. (Für Erneut extrahieren nicht verfügbar.)

 

Tipp

Tipp:
Diese Option kann dauerhaft verwendet werden.

 
Die Anzahl von Objekten je Extrahierungsanforderung – die Objektanzahl – ist für jeden Iterator begrenzt. Die Standardeinstellung der einzelnen Optionen ist 5000.
Jeder Iterator hat einen Zustand, die Optionen. Folgende Zustände sind möglich:

Normale Extrahierung

Extrahierung anhalten

Indizierungsanforderungen verwerfen

Maximal zu extrahierende Versionen
Gibt die maximale Anzahl der Versionen pro Dokument an, die in einer Extrahierungsanforderung verarbeitet werden sollen. Im Suchindex können mehrere Versionen vorhanden sein.
 

Hinweis

Hinweis:
Um eine Verlangsamung des Systems durch Extractor zu verhindern, ist der Wert Maximal zu extrahierende Versionen auf den Wert für Anzahl der Objekte beschränkt, auch wenn er auf „Unbegrenzt“ eingestellt ist.

Als Folge einer zu niedrigen Einstellung können für ältere Versionen falsche Informationen gespeichert werden, insbesondere können zwei verschiedene Versionen als aktuelle Version markiert werden. Die Extrahierung älterer Versionen ist erforderlich, damit gemeinsame Informationen wie bearbeitete Datumsangaben, Benutzerinformationen und die aktuelle Version in allen Objektversionen aktualisiert werden. Werte unter 10 werden nicht empfohlen.

 
Zugriffskontrolllisten einschließen
Bei Auswahl werden dem Datenfluss und Suchindex Informationen zu Berechtigungen der Zugriffskontrollliste hinzugefügt.
 

Hinweis

Hinweis:
Die Aufnahme von Informationen zu Zugriffskontrolllisten wird in der Regel nicht empfohlen. Die ACL-Extrahierung reduziert die Leistung bei der Indizierung und bietet in der Regel keinen Nutzen für typische Installationen.

 
Abzugsrichtung:
Legt die Reihenfolge fest, in der die Extractor-Prozesse Informationen in der Tabelle DTreeNotify verarbeiten.

Aufsteigend, von den ältesten zu den neuesten Aktualisierungen

Absteigend, von den neuesten zu den ältesten Aktualisierungen. Dies wird nur für Abwärtskompatibilität angeboten und wird vom OpenText-Kundendienst nicht empfohlen.

 

Hinweis

Hinweis:
Die optionale Steuerungsregel für die datenbasierte Partitionserstellung ist nur verfügbar, wenn Aufsteigend ausgewählt ist. Weitere Informationen finden Sie unter Steuerungsregeln für die datenorientierte Partitionserstellung in Steuerungsregeln für die Partitionsverwaltung hinzufügen.

 
EFS-Objektinhalt
Es gibt zwei Möglichkeiten, Objekte, die im Enterprise File System gespeichert sind, dem Dokumentkonvertierungsserver für die Indizierung zu präsentieren:

In der Regel ist es schneller, wenn der Server direkt vom EFS lesen kann. Die Dateien werden nicht gelöscht. Es hat sich bewährt, dem Admin-Server nur Leseberechtigung für das EFS zu erteilten.

Das Einbetten einer Kopie der Datei ist zu bevorzugen, wenn die Sicherheit erhöht werden muss, oder wenn DCS keinen Lesezugriff auf das EFS hat.

Nicht-EFS-Objektinhalt
Die gängigsten Nicht-EFS-Speichersysteme sind Enterprise Library oder Archive Server. Objekte, die von diesen Quellen für die Indizierung durch DCS extrahiert werden, können in iPool-Nachrichten eingebettet oder in einen temporären Arbeitsbereich eingefügt werden.
Wenn Sie einen temporären Arbeitsbereich auswählen, muss der angegebene Dateipfad für die einzelnen Admin-Server, Content Server und den Dokumentkonvertierungsserver zugänglich sein. Details hierzu finden Sie unter Objektinhalt über Datenflüsse weitergeben.
iPool-Limits
Gesamtgröße
Gibt eine Beschränkung (in MB) für die maximale Gesamtgröße aller in einem iPool enthaltenen eingebetteten Objektinhalte an. Diese Einstellung gibt für die iPool-Nachricht selbst kein Größenlimit an.
iPools können eine Gesamtgröße von mehr als 2 GB haben, und der DCS kann iPool-Nachrichten, die größer sind als 2 GB, auf 64-Bit-Systemen verarbeiten.
Jede positive Ganzzahl ist gültig. Es gibt keinen Maximalwert für diesen Parameter. Der Standardwert ist 1999 MB.
 

Hinweis

Hinweis:
Wenn ein Objekt in den iPool geschrieben wird, das diesen Grenzwert überschreitet, schließt der Extractor die iPool-Nachricht, und die nächste Nachricht wird verarbeitet.

 
Inhaltsgröße für Einzelobjekt
Gibt eine Beschränkung (in MB) für die Maximalgröße einzelner eingebetteter Objektinhalte an, die in einen iPool geschrieben werden sollen. Diese Einstellung gibt für die iPool-Nachricht selbst kein Größenlimit an.
iPools können eine Gesamtgröße von mehr als 2 GB haben, und der DCS kann einzelne Objekte in iPool-Nachrichten, die größer sind als 2 GB, auf 64-Bit-Systemen verarbeiten.
Jede positive Ganzzahl ist gültig. Es gibt keinen Maximalwert für diesen Parameter. Der Standardwert ist 1024 MB.
 

Hinweis

Hinweis:
Wenn ein Objekt in den iPool geschrieben wird, das diesen Grenzwert überschreitet, schließt der Extractor die iPool-Nachricht, und die nächste Nachricht wird verarbeitet.

 
Anzahl der Objekte
Gibt die Anzahl der extrahierten Objekte an, die durch den Unternehmensweit-Extractor-Prozess in eine einzige iPool-Nachricht-Gruppe eingeteilt wird. iPool-Nachrichten enthalten die Informationen, die ein Index benötigt, um auf dem Laufenden zu bleiben. (beispielsweise Anforderungen, indizierte Objekte zu aktualisieren oder zu löschen). In der Regel werden Werte im Bereich zwischen 500 und 2000 empfohlen. Der Standardwert ist 1000.
Wenn Sie eine zu kleine Anzahl an Objekten einstellen, können der Overhead für die iPool-Verwaltung und die Indizierung von Transaktionen, den Indizierungsprozess verlangsamen. Wenn der Wert zu groß ist, werden die Größen-Limits für iPool-Nachrichten wahrscheinlich überschritten.
Ausschlusseinstellungen
Es gibt eine Reihe von Einstellungen, mit denen Sie steuern können, welche Objekte extrahiert und im Suchindex dargestellt werden sollen. Inhalt und Metadaten von Objekten, die ausgeschlossen sind, werden nicht indiziert.
Für jeden Typ wird die Anzahl der Objekte angegeben, die aktuell ausgeschlossen sind.
Objekttypen
Klicken Sie auf die Verknüpfung Liste bearbeiten/prüfen, um in Ausgeschlossene Objekttypen konfigurieren andere Objekte anzuzeigen oder hinzuzufügen und weitere Informationen zu den Objekttypen zu erhalten.
Datenbereichstypen
Klicken Sie auf die Verknüpfung Liste bearbeiten/prüfen, um in Ausgeschlossene Datenbereichstypen konfigurieren andere Objekte anzuzeigen oder hinzuzufügen und weitere Informationen zu den Datenbereichstypen zu erhalten.
Ablageorte
Klicken Sie auf die Verknüpfung Liste bearbeiten/prüfen, um in Ausgeschlossene Speicherorte andere Speicherorte anzuzeigen oder hinzuzufügen und weitere Informationen zu Speicherorten zu erhalten.
Anzeigetypen
Klicken Sie auf die Verknüpfung Liste bearbeiten/prüfen, um in Anzeigetypen konfigurieren andere Anzeigetypen anzuzeigen oder hinzuzufügen und weitere Informationen zu den Datenbereichstypen zu erhalten.
 

Hinweis

Hinweis:
Diese Einstellung wird nur angezeigt, wenn ein Anzeige-Modul auf Ihrem Content Server-System installiert wurde.

 
Einstellungen für das Sammeln von Statistiken
Sammeln von Statistiken aktivieren
Wenn dieses Element ausgewählt ist, werden während der Datenextrahierungs- und Indizierungsprozesse im Unternehmensweit-Extractor Daten zu diesen Prozessen gesammelt. Das Sammeln von Statistiken ist standardmäßig aktiviert. Die gesammelten Daten können auf der Seite Übersicht der Indizierungs-Datenflussleistung abgerufen werden. Details hierzu finden Sie unter Überprüfen der Extractor-Leistung.
Index-Tracer aktivieren
Wenn dieses Element ausgewählt ist, werden in regelmäßigen Abständen spezielle Kennzeichnungsobjekte in den Datenfluss eingespeist. Anschließend wird der Verlauf dieser Objekte im Indizierungssystem verfolgt, um festzustellen, wie aktuell bzw. veraltet der Suchindex ist.
Die oben beschriebene Einstellung Abzugsrichtung muss auf Aufsteigend festgelegt sein.
Mit den Ergebnissen können Indexierungsverzögerungen intern überwacht werden. Außerdem können die Ergebnisse in zukünftigen eDiscovery- und Suchfunktionen zum Einsatz kommen.
Tage, die die Statistiken aufbewahrt werden
Gibt die Anzahl der Tage an, während derer Daten erfasst werden. Der Standardwert ist 7 Tage.