Die Einstellungen im Abschnitt [FilterEngine] steuern das Verhalten des Dokumentkonvertierungsdienstes (DCS). Dieser Dienst konvertiert Dokumente zum Anzeigen oder Indizieren aus ihren ursprünglichen Formaten in HTML oder einfachen Text. Dazu verwendet er Dokumentkonvertierungsfilter. Weitere Informationen zu Dokumentkonvertierungsfiltern finden Sie unter
Es gibt drei Verfahren, den DCS zu konfigurieren.
Sie können alle Dokumentkonvertierungsdienste an Ihrem Standort global konfigurieren, indem Sie die Parameter im Abschnitt [FilterEngine] der Datei opentext.ini einstellen.
Sie können die spezifischen Einstellungen für einen Konvertierungsfilter in einem der folgenden Abschnitte der Datei opentext.ini global konfigurieren: [DCS], [DCSworker], [DCSxpdf], [DCSservers], [DCSview], [DCSpipe], [DCSipool], [QDF], [DCSIm] und [Summarizer].
Sie können einen einzelnen DCS lokal konfigurieren, indem Sie für den Dienst Befehlszeilenargumente einstellen.
Einige der in den DCS-Abschnitten der Datei opentext.ini enthaltenen Parameter und einige der DCS-Befehlszeilenargumente sind auch als Parameter im Abschnitt [FilterEngine] enthalten. Die DCS-Parameter und DCS-Befehlszeilenargumente erfüllen dieselbe Funktion wie die entsprechenden Parameter im Abschnitt [FilterEngine]; dabei gilt jedoch, dass durch das Einstellen von Werten für die Parameter in den DCS-Abschnitten der Datei opentext.ini oder in den DCS-Befehlszeilenargumenten die Einstellungen im Abschnitt [FilterEngine] außer Kraft gesetzt werden.
Der Abschnitt [FilterEngine] der Datei opentext.ini enthält folgende Parameter:
Gibt den Ablageort des Verzeichnisses an, das die Content Server-Konvertierungsfilter enthält. Ein von einem Textverarbeitungsprogramm wie z. B. Microsoft Word erstelltes Dokument enthält Formatierungsinformationen, die für eine Suche nicht erforderlich sind. Konvertierungsfilter extrahieren aus Textverarbeitungsdateien Textinhalt, der zum Lesen und Indizieren geeignet ist.
Ein absoluter Pfad. Der Standardwert ist <Content_Server_home>\filters. Dabei fungiert <Content_Server_Start> als Stamm Ihrer Content Server-Installation.
Mit dem Parameter encoding<n> können Sie mehrere Zeichencodierungswerte angeben, durch die eine erfolgreiche Konvertierung der Zeichencodierung bei indizierten Dokumenten möglich ist. Der DCS versucht, die Zeichencodierung von Textdokumenten zu erkennen, die indiziert werden sollen. Wenn der DCS keine Codierung erkennt, versucht er, mithilfe der für diesen Parameter festgelegten Codierungswerte eine UTF-8-Zeichencodierung durchzuführen. Der DCS verwendet dabei die Codierungswerte in der Reihenfolge, in der sie im Abschnitt [FilterEngine] aufgeführt sind. Er setzt seinen Versuch einer Zeichencodierung fort, bis er entweder erfolgreich ist oder keine gültigen Codierungswerte mehr hat, die er ausprobieren kann. Der erste Codierungswert, bei dem die Daten erfolgreich konvertiert werden können, wird als die korrekte Codierung angesehen. Jeder Eintrag für encoding<n> im Abschnitt [FilterEngine] muss folgendes Format aufweisen: encoding<n>=<encodingvalue>, wobei <n> eine eindeutige Nummer darstellt.
In dem im folgenden Abschnitt Syntax dargestellten Beispiel versucht der DCS, Dokumente mithilfe der Codierung Shift JIS zu konvertieren. Wenn die Verwendung von Shift JIS fehlschlägt, versucht es der DCS stattdessen mit der Codierung EUC-JP.
Ein Name einer Zeichencodierungsspezifikation. Wenn für diesen Parameter kein Wert angegeben ist, wird ISO-8859-1 verwendet. Wenn Sie den Parameter encoding<n> nicht in die Datei opentext.ini aufnehmen, verwendet der DCS standardmäßig die Codierung Latin-1. Wenn Sie weitere Informationen wünschen, wenden Sie sich an den OpenText-Kundendienst.
Legt den Ablageort und das Präfix für die Protokolldatei der Dokumentkonvertierung fest. Die diesem Prozess zugewiesene Admin-Portnummer wird an die Protokolldatei angehängt, gefolgt von dem Suffix „.log“. Dadurch wird verhindert, dass mehrere Dateien in dieselbe Datei schreiben.
Ein absoluter Pfad. Der Standardwert ist <Content_Server_home>\logs\dcs. Dabei fungiert <Content_Server_Start> als Stamm Ihrer Content Server-Installation.
|
Hinweis: | |
Gibt an, ob der DCS Zusammenfassungen der Dokumente generiert, die er in HTML konvertiert. Wenn der Benutzer in den Anzeigeoptionen für die Suche festlegt, dass Zusammenfassungen angezeigt werden sollen, zeigt Content Server diese Zusammenfassungen mit den Suchergebnissen auf der Seite „Suchergebnis“ an.
Standardmäßig wird der Parameter summary in der Befehlszeile jedes DCS auf TRUE eingestellt. Um den Parameter summary auf FALSE einzustellen, müssen Sie die Befehlszeile jedes DCS ändern, anstatt den Parameter in der Datei opentext.ini zu ändern, denn die in der Befehlszeile eingestellten Argumente überschreiben die in der Datei opentext.ini eingestellten globalen Parameter. Weitere Informationen finden Sie unter
TRUE oder FALSE. Der Standardwert ist TRUE.
Wenn der Wert TRUE eingestellt ist, generiert der DCS Zusammenfassungen. Wenn der Wert FALSE eingestellt ist, generiert der DCS keine Zusammenfassungen.
Gibt die Anzahl der Schlüsselwörter an, die der Summarizer zum Generieren einer Dokumentzusammenfassung verwendet. Das Senken dieses Wertes kann das Generieren einer Zusammenfassung beschleunigen, es gibt aber noch viele weitere Variablen, die die Geschwindigkeit dieses Prozesses beeinflussen.
|
|
Wichtig: |
Eine Ganzzahl größer oder gleich 1. Der Standardwert ist 20.
Legt fest, wie viele Sekunden gewartet wird, bevor ein Arbeitsprozess beendet wird.
Der DCS überwacht, wie lange die Arbeitsprozesse mit dem Konvertieren von Dokumenten beschäftigt sind, und beendet die Arbeitsprozesse, die diesen Grenzwert überschreiten. Der Grenzwert für die Zeitüberschreitung wird durch den Parameter timeout definiert.
Wenn der Arbeitsprozess versucht, ein beschädigtes oder in anderer Form unzulässig formatiertes Dokument zu konvertieren, schlägt er fehl und wird ein Fehlercode an den DCS zurückgegeben. Einige Dokumente können allerdings dazu führen, dass das Filtersystem in einer unendlichen Verarbeitungsschleife hängen bleibt. In seltenen Fällen nimmt der Konvertierungsfilter in solchen Endlosschleifen schrittweise die Systemressourcen in Beschlag.
Der DCS hat für timeout einen Standardwert von 30 Sekunden; nach Ablauf dieser 30 Sekunden stoppt er den Arbeitsprozess. Wenn jedoch der Arbeitsprozess schnell Speicher in Beschlag nimmt, könnte er noch vor Ablauf dieser 30 Sekunden den gesamten verfügbaren Speicher in Anspruch nehmen. In diesem Fall können Sie den Wert von timeout senken, damit der Konvertierungsfilter vor seiner Zeitüberschreitung nicht den gesamten Speicher in Beschlag nimmt.
Der Wert des Parameters timeout sollte so gering wie möglich sein, ohne dass dadurch der Konvertierungsvorgang endet, bevor ein zulässiges Dokument konvertiert werden kann. Sie können einen geeigneten Wert für timeout schätzen, indem Sie für einen angemessenen Zeitraum, z. B. für 24 Stunden, die Protokollierung aktivieren und anschließend untersuchen, wie lange der Prozess zum Konvertieren eines zulässigen Dokuments höchstens benötigt. Die maximal benötigte Konvertierungszeit für zulässige Dokumente beträgt in der Regel nur wenige Sekunden. Sobald Sie diesen Wert ermittelt haben, können Sie den Wert von timeout in das Anderthalbfache oder Doppelte der für zulässige Dokumente maximal benötigten Konvertierungszeit ändern. Durch die überschüssige Zeit werden Dokumente berücksichtigt, die größer als die während der Testzeit konvertierten Dokumente sind.
Der Wert des Parameters timeout kann auch für jeden Konvertierungsfilter angepasst werden. Dies erfolgt durch Festlegen des Parameters x-timeout im INI-Abschnitt jedes Konvertierungsfilters.
Eine Ganzzahl größer oder gleich 1. Der Standardwert ist 30.
Mit diesem Parameter wird das Verzeichnis angegeben, in dem Dokumentkonvertierungsdienste temporäre Konvertierungsdateien ablegen. Temporäre Konvertierungsdateien sind Dateien mit den Erweiterungen .in oder .out und die vom Filtersystem erstellen temporären Dateien. Der Wert dieses Parameters darf 256 Byte nicht überschreiten.
Wenn Sie mit einem Linux-Betriebssystem arbeiten, empfiehlt OpenText, als temporäres Verzeichnis für die Dokumentkonvertierungsdienste das Verzeichnis /tmp zu verwenden. Das Festlegen eines temporären Dateisystems wie beispielsweise /tmp für Linux verbessert die Leistung von Dokumentkonvertierungsdiensten beträchtlich. In Linux-Versionen von Content Server wird der Parameter tmpdir bei der Installation von Content Server standardmäßig auf /tmp eingestellt.
Temporäre Dateien werden in Linux gelegentlich durch Arbeitsprozesse, die auf nicht ordnungsgemäße Weise beendet wurden, verworfen. OpenText empfiehlt, das temporäre Verzeichnis regelmäßig zu leeren.
Gibt die maximale Anzahl von iPool-Nachrichten an, die vom iPool-Lesebereich verarbeitet werden sollen, bevor der DCS eine iPool-Transaktion vornimmt.
Dieser Parameter ist der erste von drei den Durchsatz beschränkenden Parametern im Abschnitt [FilterEngine] der Datei opentext.ini. Die beiden anderen Parameter sind minwindow und maxtime.
Eine Ganzzahl größer oder gleich 1. Der Standardwert ist 10.
|
Hinweis: | |
Gibt die minimale Anzahl von iPool-Nachrichten an, die vom iPool-Lesebereich verarbeitet werden sollen, bevor der DCS eine iPool-Transaktion vornimmt. Wenn die Anzahl der im Lesebereich verfügbaren Nachrichten geringer ist als der für den Parameter minwindow angegebene Wert, erfolgt die Transaktion, nachdem der DCS die letzte iPool-Nachricht verarbeitet hat.
Dieser Parameter ist der zweite von drei den Durchsatz beschränkenden Parametern im Abschnitt [FilterEngine] der Datei opentext.ini. Der erste Parameter ist window und der dritte Parameter ist maxtime.
Eine Ganzzahl größer oder gleich 1. Der Standardwert ist: 5.
Gibt die maximale Zeitdauer in Millisekunden an, die zum Verarbeiten einer iPool-Transaktion zulässig ist. Wenn eine Transaktion dieses Zeitlimit überschreitet, wird sie nach Abschluss der Verarbeitung der aktuellen iPool-Nachricht durchgeführt, unabhängig davon, ob die Kriterien für den Parameter window oder minwindow erfüllt sind.
Dieser Parameter ist der letzte von drei den Durchsatz beschränkenden Parametern im Abschnitt [FilterEngine] der Datei opentext.ini. Die beiden anderen Parameter sind window und minwindow.
Eine Ganzzahl größer oder gleich 1. Der Standardwert ist 120000 oder zwei Minuten.