How Do You Index Content Sources?
Es ist ganz einfach, Drittanbieterquellen wie Atlassian Confluence, ServiceNow oder OpenText Content Server zu integrieren, um Apache Solr zu einer vollwertigen Unternehmenssuche zu machen. Da Apache Solr keine integrierten Konnektoren enthält, bietet es natürlich alle APIs, die zum Indexieren von Inhaltsquellen erforderlich sind.
Auf der Basis der APIs können Sie Ihre eigenen Konnektoren oder Crawler schreiben. Zudem gibt es das Open Source Framework Apache ManifoldCF, um Inhalte zu indexieren sowie unsere Raytion Enterprise Search Konektoren.
Um neue Inhaltsquellen in Apache Solr zu integrieren, müssen Sie die folgenden Komponenten einrichten und konfigurieren:
Innerhalb von Apache Solr erstellen Sie eine Collection mit schema.xml and solrconfig.xml.
Für eine Secure Search benötigen Sie einen Security Token Store, wie z. B. den Raytion Custom Security Manager.
Zuletzt installieren und konfigurieren Sie den Konnektor, der die Inhaltsquelle indexiert.
Sucherfahrung und User Journeys
Die Datenindexierung der Inhaltsquelle ist der erste Schritt zu einer erstklassigen Unternehmenssuche. Auf dieser Basis kann man ein Suchinterface konfigurieren.
Bei Apache Solr oder auch Elasticsearch hat ein Suchinterface mehrere Aufgaben. In Enterprise-Search-Szenarien mit Secure Search ist es dafür verantwortlich, dass Benutzer authentifiziert sind. Daher muss es einen der gängigen Authentifizierungs-Anbieter wie Azure AD, Google Cloud Identity, Okta oder auch Active Directoy unterstützen.
Die Suchoberfläche muss zudem eine Abfragepipeline für die Secure Search anbieten. Innerhalb dieser Abfrage-Pipeline wird der Token-Speicher mit der Benutzer-ID des Benutzers abgefragt, der nach Ergebnissen sucht. Basierend auf der Antwort wird die ursprüngliche Suchanfrage so transformiert, dass sie einen ACL-Filter (Access Control List Filter) hinzufügt, der für eine Secure Search benötigt wird. Innerhalb der Query-Pipeline können zudem beispielsweise Synonyme expandiert werden, es kann ein Natural Language Processing stattfinden oder es können Ranking-Hinweise gegeben werden.
Bei der Trefferdarstellung und der Such-Experience generell ist es ein Ziel, dass Benutzer schnell die Informationen finden, die sie brauchen. Daher ist es wichtig, das Suchinterface so aufzubauen, dass Benutzer die Suchtreffer leicht voneinander unterscheiden und die Daten entsprechend filtern können.
Wir haben Kunden, die die Suchoberfläche entweder selbst oder mit unserer Hilfe implementieren. Dazu sind zum Beispiel Open Source Frameworks verfügbar, die als Ausgangspunkt für die Implementierung des Search Interface verwendet werden können. Alternativ kann unser kommerzielles Framework Raytion Search & Retrieval Interface mit Apache Solr verwendet werden.
Das Ergebnis
Apache Solr ist eine solide Open-Source-Grundlage für erstklassige Suchanwendungen. Es bietet volle Flexibilität bei der Anpassung der Abfrageverarbeitung, Inhaltsverarbeitung und Sucherfahrung. Allerdings müssen Sie einige Komponenten um diese Suchmaschine herum bauen oder kaufen, wie z. B. das Suchinterface, Konnektoren und Security Trimming. Unsere Kunden verwenden die Suchmaschine für ihre Enterprise Search oder auch für E-Commerce- oder Website-Suchen.
Wenn Sie an weiteren Informationen zum Aufbau einer Unternehmenssuche auf Basis von Apache Solr interessiert sind, wenden Sie sich bitte an unsere Experten.