SAP TREX
SAP TREX (Text Retrieval and Information Extraction) ist eine eigenständige Suchmaschine, die eine intelligente Suche und automatische Klassifizierung von Dokumenten ermöglicht. Die TREX-Suchmaschine ist in der Lage, Informationen aus strukturiertem und unstrukturiertem Text abzurufen.
Definition von SAP TREX
Search and Classification (TREX) ist die zentrale SAP NetWeaver-Suchmaschine, die grundlegende Suchtechnologien und Funktionen für Enterprise Knowledge Management und Search Engine Service (SES) bereitstellt.
Die TREX-Suchmaschine ist eine eigenständige Komponente, die in einer Reihe von Systemumgebungen eingesetzt werden kann, aber vor allem als integraler Bestandteil von SAP-Produkten wie Enterprise Portal, Knowledge Warehouse und Business Intelligence eingesetzt wird.
In SAP NetWeaver BI versorgt die TREX-Suchmaschine den sogenannten BI Accelerator, eine Plug-in-Appliance zur Leistungssteigerung der Online-Analytik.
TREX bietet einen integrierten Satz von Services und ist ein grundlegender Bestandteil der SAP NetWeaver Search Integrationsfähigkeiten. Zu den TREX-Services gehören Suche und Abruf in großen Dokumentsammlungen (unstrukturierte Daten), Text-Mining, automatische Dokumentenklassifizierung sowie Suche und Aggregation von Business-Objekten (strukturierten Daten) in SAP-Anwendungen.
TREX kann Text aus Dokumenten in zahlreichen Formaten, darunter Microsoft Office- und Adobe-Formate (PDF), und mehr als 30 Sprachen verarbeiten. TREX-Suchoptionen wie exakte, boolesche, unscharfe oder linguistische Suche sowie Klassifizierungsoptionen wie query-basierte oder beispielbasierte Klassifizierung bieten dem Endanwender eine hohe Leistungsfähigkeit und Flexibilität.
SAP TREX Architektur
TREX basiert auf einer Client/Server-Architektur. Die Client-Komponente ist in die Anwendung integriert, die die TREX-Funktionen nutzt und ermöglicht die Kommunikation mit den TREX-Servern. Die Serverkomponente verarbeitet die Anfragen; sie indiziert und klassifiziert Dokumente und beantwortet Suchanfragen.
TREX Komponenten
Die Client-Komponente ist in Java-Client und ABAP-Client unterteilt. Die Serverkomponente ist hingegen in die folgenden Server unterteilt:
Java-Client und ABAP-Client
TREX stellt für die Sprachen Java und ABAP Programmierschnittstellen (Application Programming Interfaces, APIs) zur Verfügung, die den Zugriff auf alle TREX-Funktionen ermöglichen. Die Java-Schnittstelle (Java-Client) ist Teil des Application Server (AS) Java als TREX-Service. Die ABAP-Schnittstelle (ABAP-Client) ist Teil des Application Server (AS) ABAP. Diese APIs sind nur für die SAP-interne Entwicklung freigegeben.
Webserver mit TREX-Erweiterung
Der Web-Server ist für die Kommunikation zwischen Java-Anwendungen und den TREX-Servern verantwortlich. Auf dem Web-Server ist eine TREX-Komponente installiert, die den Web-Server um TREX-spezifische Funktionen erweitert.
RFC-Server
Der RFC-Server ist für die Kommunikation zwischen einem SAP-System und den TREX-Servern verantwortlich. Das SAP-System sendet Anforderungen über ein SAP-Gateway an einen RFC-Server. Der RFC-Server konvertiert die Requests in ein TREX-internen Format und leitet sie dann an die zuständigen TREX-Server weiter.
Queue-Server
Der Queue-Server koordiniert die Verarbeitungsschritte, die während der Indizierung stattfinden. Er sammelt eingehende Dokumente und stößt die Vorverarbeitung durch den Preprocessor sowie die Weiterverarbeitung durch den Index-Server an.
SAP Basis Berater - gesamte Projekte oder Berater auf Zeit
Sie suchen Unterstützung durch SAP Basis Berater? Wir bieten mehr als nur einen gewöhnlichen Berater auf Zeit. Informieren Sie sich über Ihre Vorteile!
Preprocessor
Der Preprocessor verarbeitet Dokumente und Suchanfragen. Die Dokumentenvorverarbeitung umfasst mehrere Schritte: Dokumente laden, Dokumente filtern und Dokumente linguistisch analysieren. Bei Suchanfragen führt der Preprozcssor eine linguistische Analyse durch.
Index-Server
Der Index-Server indiziert und klassifiziert Dokumente und beantwortet Suchanfragen. Die Verarbeitung erfolgt in den Suchmaschinen, die zum Index-Server gehören: Suchmaschine, Text-Mining-Engine, Attribut-Engine.
Name-Server
Der Name-Server verwaltet Informationen über das gesamte TREX-System. Er stellt sicher, dass die TREX-Server miteinander kommunizieren können und alle notwendigen Informationen erhalten. Der Name-Server hat die folgenden Aufgaben: Verwaltung von Topologiedaten, Koordination von Replikationsdiensten, Lastausgleich und Sicherstellung einer hohen Verfügbarkeit.
TREX Admin Tools
TREX stellt die folgenden Admin Tools zur Verfügung:
TREX-Monitor im Portal
Sie verwenden dieses Werkzeug, wenn Sie die Knowledge-Management-Funktionen im Portal implementieren. Mit diesem Tool können Sie Queues verwalten, wichtige Indexparameter, leere Such- und Klassifikations-Caches anzeigen und die Verfügbarkeit der TREX-Server überprüfen.
TREX-Admin-Tool im SAP-System
Sie verwenden dieses Tool, wenn TREX an ein SAP-System angeschlossen ist. Mit diesem Tool können Sie die Queues administrieren, TREX überwachen und Informationen über die Komponenten in einem TREX-System anzeigen.
TREX-Admin-Tool (Stand-Alone)
Dieses Tool kann unabhängig von einem Portal oder einem SAP-System verwendet werden. Das TREX-Admin-Tool bietet alle Funktionen zur Konfiguration und Überwachung von TREX. Mit diesem Tool kann ein verteiltes TREX-System sowie eine RFC-Verbindung konfiguriert, Delta-Indizes verwaltet und Performance-Traces auslöst werden. Darüber hinaus bietet dieses Tool detaillierte technische Informationen zu den Komponenten eines TREX-Systems. Mit Hilfe von periodisch ausgeführten Prüfungen kann es den Systemstatus automatisch überwachen. Im Fehlerfall werden die Anwender per E-Mail informiert, damit sie entsprechende Maßnahmen ergreifen können.
Fazit
SAP TREX ist ein wesentlicher Bestandteil der meisten Suchfunktionen in SAP-Anwendungen und ist eine Such- und Text-Mining-Lösung. Als Backend-Suchmaschine bietet TREX Suchanwendungen wie SAP NetWeaver Enterprise Search und Suchdienste wie Search Engine Service und Embedded Search mit Indexierungs- und Suchtechnologien an. Sie haben noch weitere Fragen oder möchten sich weiterführend von SAP-Experten beraten lassen? Wir helfen Ihnen gern dabei. Kontaktieren Sie uns einfach.
FAQ SAP TREX
Was ist SAP TREX?
„Search and Classification (TREX) ist die zentrale SAP NetWeaver-Suchmaschine, die grundlegende Suchtechnologien und Funktionen für Enterprise Knowledge Management und Search Engine Service (SES) bereitstellt.
Welche Funktionen bietet SAP TREX?
TREX bietet einen integrierten Satz von Services und ist ein grundlegender Bestandteil der SAP NetWeaver Search Integrationsfähigkeiten. Zu den TREX-Services gehören Suche und Abruf in großen Dokumentsammlungen, Text-Mining, automatische Dokumentenklassifizierung sowie Suche und Aggregation von Business-Objekten in SAP-Anwendungen.
Aus welchen Komponenten besteht SAP TREX?
TREX unterteilt sich in einen Java-Client und ABAP-Client, einen Webserver mit TREX-Erweiterung, einen Webserver mit TREX-Erweiterung und eine Queue-Server. Zudem besteht es aus einem Pre-Processor, einem Index-Server und einem Name-Server.
Welche TREX Admin Tools gibt es?
Trex stellt den TREX-Monitor im Portal zu Verfügung. Außerdem kann auch das TREX-Admin-Tool im SAP-System und das TREX-Admin-Tool (Stand-Alone) genutzt werden.
Weiterführende Infos
SAP Search and Classification (TREX)