Enterprise Suche: Semantik macht Arbeit und ist keine Magie

Frank Wolf —  14. Dezember 2009 — Kommentieren

Interview mit interface:projects Geschäftsführer Uwe Crenze über seine Enterprise Suche inter:gator.

Das Schöne am Social Web ist, dass es Menschen animiert sich mitzuteilen und wertvolle Inhalte zu erstellen. Die Kehrseite sind Informationsmengen in Dimensionen, die so vor einigen Jahren nicht vorstellbar  waren. Nicht zuletzt dank Google und seinem Siegeszug im Internet ist eine gute Suche heute der wichtigste Weg, um im Wirrwarr aus Tweets, Artikeln, Präsentationen, Webseiten, Dokumenten und Kommentaren die Übersicht zu behalten. Das Dresdner Unternehmen interface:projects konzentriert sich mit seiner Suche „inter:gator“ vor allem auf Suchszenarien im Unternehmen. Die Lösung kommt auch als Unternehmenssuche in der T-Systems MMS zum Einsatz und hat in der laufenden Beta-Phase viel Lob geerntet. Interface:projects Geschäftsführer Uwe Crenze war so freundlich, uns einige Frage zum Thema Enterprise Suche zu beantworten.

Eine Suche ist heute überall eingebaut: in Content Management Systemen aber auch in Social Business Software. Was leistet eine Enterprise Suche zusätzlich?

Der zentrale Knackpunkt ist der übergreifende Charakter einer Enterprise Suche. Eine gute Suche endet ja nicht mit einer Ergebnisliste, sondern diese Ergebnisse können unterschiedlich gefiltert, gruppiert und visualisiert werden. Performant umzusetzen ist das nur, wenn es einen Gesamtindex über alle Anwendungen gibt. Man kann auch die jeweiligen Suchen der einzelnen Systeme automatisiert einzeln abfragen, hat dann aber eine Ergebnisliste, die schwer zu priorisieren ist und mit der man nichts weiter anfangen kann.

Suche

Metadaten sind der große Schatz einer Enterprise Suche: Links neben dem Suchergebnis werden Filter und Kategorien zu den Ergebnissen angezeigt. Damit können die Suchresultate weiter eingegrenzt werden.

Es gibt ja verschiedene Suchlösungen für Unternehmen. Was ist der Unterschied zwischen z.B. einer FAST Suche und dem inter:gator?

Als erstes zu nennen wäre das Preis / Leistungsverhältnis. Mittelständische Unternehmen können sich sehr große Lösungen wie FAST nicht leisten, denn ein Suchprojekt besteht ja nicht nur aus den Kosten für die Lizenz, sondern auch aus Aufwänden für die Implementierung. Unterhalb der Markführer entsteht ein großes Loch zu den Standard Suchen und genau in diesem Bereich platzieren wir uns. Wir bieten 80% der Funktionalität zu 20% des Preises. Funktional gesehen, hat jedes System seine Schokoladenseite. Das können eine ausgeprägte Mehrsprachigkeit sein, ein umfangreicher Thesaurus, der Umgang mit extremen Datenmengen oder eine Spezialisierung auf Audio und Videodateien. Generell gibt es im Bereich der Suche viele Detailprobleme, die im Einzelfall viel Kraft kosten können und wenn diese von einem Produkt besonders gut gelöst werden, dann lohnt sich dort die Investition.

Jeder redet von Semantik – man könnte den Eindruck gewinnen, es ist ein richtiges Marketing Buzzword geworden. Was sind die Möglichkeiten und Grenzen von Semantik bei der Suche?

Das wichtigste, wenn wir über Semantik reden sind Metadaten. Nicht nur Volltext, sondern alles was ich zusätzlich an Informationen zu einem Objekt finden kann. Vieles ist bereits vorhanden, weitere Informationen können in zusätzlichen Analyseschritten generiert werden. So kann man z.B. Eigennamen durch ein kombiniertes Verfahren aus Wörterbüchern und linguistischen Regeln erkennen. Am Ende muss die Bedeutung erschlossen werden, dafür brauche ich Anhaltspunkte und das sind entweder Metadaten oder eine ausreichende Anzahl an thematisch ähnlichen Beispieldokumenten. Semantik macht Arbeit. Es ist keine Magie, dafür muss ich etwas tun. Spannend ist vor allem das Szenario, dass auf der einen Seite ein gut gepflegter Datenbestand existiert und auf der anderen Seite viel unstrukturierter „digitaler Müll“. Die gepflegten Daten geben bei einem inhaltlichen Zusammenhang genügend Hinweise, um auch den „Müll“ viel besser in seiner Bedeutung zu erschließen. Aus dem Wenigen was ich redaktionell gepflegt habe, kann ich also für alles einen Nutzen ziehen.

Welchen Nutzen hat Autotagging?

Autotagging hängt in erster Linie an der Qualität der Inhalte. Je unstrukturierter, je mehr Beliebigkeit in der Formulierung desto schwieriger. Unsere Erfahrung ist aber, dass selbst eine relativ einfache statistische Findung von Schlagworten, von den Anwendern als sehr nützlich betrachtet wird.

Teil Ihrer Suche ist auch eine Social Search Funktion. Wie funktioniert die?

Wir erheben Nutzerfeedback als ein Kriterium für Relevanz. Nutzerfeedback kann verschiedene Formen annehmen. Das einfachste ist ein Button, der sagt „Dieses Ergebnis war relevant“. Darüber hinaus kann man automatisch beobachten, welche Treffer sich ein Nutzer angesehen hat – so fängt man auch das Verhalten von eher passiven Nutzern mit ein. Das betreffende Dokument wird dann einfach mit dem Suchbegriff getaggt. So baut sich schrittweise einen Datenbasis auf, die man dann wieder für Treffervorschläge verwenden kann.

Welche neuen Funktionen planen sie in der Produktroadmap?

Ein großes Thema sind für uns relationale Suchen, also das Indizieren von relationalen Datenbanken. Damit wird z.B. so etwas möglich wie ein aggregiertes Skillprofil, wo für einen Mitarbeiter aus den verschiedensten Anwendungen Daten zusammengetragen werden, die sehr aktuell sind und nicht extra für das Skillprofil gepflegt werden müssen. Ein weiteres Thema ist die Verknüpfung von Desktop und Enterprise Suche. Wir werden inter:gator also auch als Desktop Suche anbieten. Der Nutzer kann dann über ein Dashboard, das auf dem Google Web Toolkit basiert, verschiedenste Suchanfragen speichern und als zentrales Informationscockpit verwenden (aktuelle Dokumente, News zu bestimmten Stichwörtern, Personen, Outlook – Mails, Termine, Aufgaben, etc).

Dashboard

Schlanke Integration: Dashboard mit einzelnen Widgets, die jeweils die aktuellen Ergebnisse einer gespeicherten Suchabfrage anzeigen.

Struktur vs. Suche. Suche ist nicht der einzige Weg etwas zu finden, oder?

Wir sind Strukturen gewohnt. Wir können uns aber nicht auf eine Ordnung einigen, Ordnung ist etwas Mehrdimensionales. Die Suche wird gut, wenn sie beim Indizieren auf bestimmte Dinge aufbauen kann und Metadaten wichtige Informationen für die Auswahl von Treffern liefern. Je mehr Strukturen das sind, desto reicher wird das Ergebnis. Die Suche ist deshalb wichtig, weil es nicht die eine Struktur für alles gibt. Informationen entstehen in einem bestimmten Kontext und werden in einem anderen Zusammenhang gebraucht. Wehe ich suche mal etwas aus einem anderen Blickwinkel, dann ist Struktur am Ende und die Suche übernimmt das Feld.

Keine Kommentare zu Enterprise Suche: Semantik macht Arbeit und ist keine Magie

  1. so long and thanks for all the fish

Trackbacks und Pingbacks:

  1. Die Wolke verblasst – Tag Clouds und Folksonomien im Intranet | Besser 2.0 - 23. März 2011

    […] Automatische Methoden wie semantische Textanalyse und Autotagging erlauben eine durchgängige Verschlagwortung von Inhalten mit wenig manuellem Aufwand. Zum Erschließen der Bedeutung braucht es nur gut gepflegte thematisch ähnliche Beispielinhalte. Diese gepflegten Daten geben bei einem inhaltlichen Zusammenhang genügend Hinweise, um auch schwer erfassbares viel besser in seiner Bedeutung zu erschließen. Mehr Details dazu hier. […]

Schreibe einen Kommentar

Text formatting is available via select HTML. <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*