Doxis Blog Innovation & Technologie
Volltextsuche im Dokumentenmanagement: Informationen zuverlässig auffindbar machen
Unternehmen speichern täglich in Datenbanken und Dokumentenmanagement-Systemen neue Dokumente. Aus Milliarden an Textzeilen eine spezifische Information zu finden, ist manuell ein Gewaltakt. Auf der Suche nach einer ganz bestimmten Information braucht es deshalb effiziente Suchmöglichkeiten. Eine davon ist die Volltextsuche. Mit ihr filtern Nutzer Datenbanken nach Dokumenten oder Dokumente nach bestimmten Begriffen. So finden Nutzer die benötigte Information in Sekunden, ohne die Unterlagen vollständig durchlesen zu müssen. Das beschleunigt Arbeits- und Suchvorgänge.
Im Folgenden erfahren Sie, was Volltextsuche ist, welche Sucharten es gibt und warum sie im Dokumentenmanagement eine zentrale Rolle spielt. Außerdem sehen Sie, welche Voraussetzungen (Indexierung, OCR, Kontext) dafür sorgen, dass Informationen schnell und zuverlässig auffindbar sind.
Was bedeutet Volltextsuche?
Volltextsuche (auch Volltextrecherche) ist eine Suchmethode, die den gesamten Text von Dokumenten oder Datenbeständen nach Wörtern und Wortgruppen durchsucht. Ergebnisse werden angezeigt, wenn der gesuchte Begriff im Text vorkommt – zum Beispiel „Rechnungsnummer“ oder „Rechnung September 2024“.
Technisch betrachtet Programme bei Volltextsuchabfragen also die gesamte Suchquelle auf Basis des Suchbegriffs. Anschließend zeigen sie nur Ergebnisse an, die den Suchbegriff enthalten.
Die Volltextsuche unterscheidet sich grundsätzlich in zwei Methoden:
- Ganze Datenbanken durchsuchen: Die Volltextsuche zeigt alle Dokumente an, die eingegebene Suchbegriffe enthalten.
- Einzelne Dokumente durchsuchen: Die Volltextsuche markiert den Suchbegriff in der einzelnen Unterlage und macht sie so sofort auffindbar.
Abgrenzung zu Freitextsuche
Im Vergleich zur Freitextsuche ist die Volltextsuche präziser. Bei der Freitextsuche geben Nutzer Suchbegriffe flexibler ein – das genaue Wort zu treffen, ist nicht wichtig, genauso wenig wie die Reihenfolge, in der die Wörter auftauchen. Auf der Suche nach dem Begriff „Gehaltsabrechnung“ könnten also auch Ergebnisse wie „Lohnabrechnung“ oder „Gehaltsaufstellung“ erscheinen. Durchsucht werden dabei oft nur bestimmte Felder (z. B. Titel, Zusammenfassungen oder Schlagworte) und nicht der gesamte Text eines Dokuments. Die Palette an gelieferten Ergebnissen ist also relativ breit. Für sehr präzise Treffer ist Freitextsuche jedoch weniger geeignet, weil häufig nur bestimmte Felder durchsucht werden und die Ergebnisliste breiter ausfällt.
Hingegen durchsucht die Volltextsuche gesamte Texte. Der technische Hintergrund: Informationen liegen indexiert vor. Technisch werden Inhalte indexiert und in Tokens zerlegt – vereinfacht: Jedes Wort wird als einzelnes Suchelement erfasst. Als Beispiel: Der Satz „Das ist die Rechnungsnummer“ unterteilt sich in „Das“ „ist“ „die“ „Rechnungsnummer“. Indem der Volltextindex jedes einzelne Wort berücksichtigt, lässt sich in der Abfrage genauestens filtern.
Das sind Vorteile:
- Effizienz: Der Index beschleunigt Suchen, da Nutzer Texte nicht jedes Mal vollständig durchsuchen müssen, um Informationen zu finden.
- Schnelligkeit: Allgemein ist ein indexierter Text schneller durchsuchbar als ein nicht indexierter Text: Ein Index speichert Informationen in einem Kontext ab.
- Priorisierung: Indexierte Wörter unterscheiden sich in ihrer Priorität. In unserem Beispiel („Das ist die Rechnungsnummer“) erhält das Wort „Rechnungsnummer“ eine höhere Gewichtung. Das Auffinden dieser Wörter gelingt so schneller und präziser.
Dokumente intelligent managen und so Informationen weltweit auffindbar machen
Wie SEW-Eurodrive Doxis als internationale Informationsplattform nutzt und abteilungsübergreifende Prozesse mehrsprachig abbildet.
Jetzt lesenSuchmöglichkeiten bei der Volltextsuche
Hey Doxi, was sind Suchmöglichkeiten bei der Volltextsuche?
Je nach Anwendung können die Funktionen der Volltextsuche variieren. So kann die Volltextsuche in SAP anders funktionieren als die in Microsoft Word oder Doxis. Das sind die bekanntesten Formen:
- Einfache Volltextsuche: Nutzer suchen nach einem oder mehreren Begriffen im Textbestand. Die Volltextsuche zeigt alle Dokumente oder Textstellen an, in denen der Suchbegriff vorkommt. Steht im Suchfeld „Rechnung“, zeigt die Volltextsuche sämtliche Treffer des Begriffs.
- Erweiterte Volltextsuche: Die Suchfunktionen ist um Filter erweitert. Nutzer suchen nach bestimmten Wortgruppen, Phrasen oder auch Operatoren (UND/ODER …). Filter schränken die Treffer nach Kategorien ein, zum Beispiel Lieferant, Mitarbeiter X oder Dokumententyp. Steht im Suchfeld zum Beispiel „Rechnung AND 2023“ zeigt die Volltextsuche nur Rechnungen aus 2023 an.
- Relevanzbasierte Suche: Ergebnisse erscheinen bei der relevanzbasierten Suchfunktion nach der Priorisierung. Dabei hebt der Volltextindex bestimmte Wörter hervor – entweder nach vorkommender Häufigkeit im Text, Algorithmus oder hinterlegter Gewichtung. Sind Stichwörter wie „Rechnungsdatum“ hervorgehoben, sucht der Index diese vorrangig.
- Fuzzy-Suche (unscharfe Suche): Statt nur den exakten Begriff zu suchen, berücksichtigt die Suche ähnliche Schreibweisen. So findet eine Suche nach „Rechng“ dennoch Treffer wie „Rechnung“.
Bedeutung der Volltextsuche in Dokumentenmanagement-Systemen
Im Dokumentenmanagement spielt die Volltextsuche eine gesonderte Rolle.
Daten zugänglich und auffindbar speichern
Liegen Informationen nicht strukturiert ab, erhöht das den Anteil von Dark Data – also ungenutzten Daten. Das ist für Unternehmen teuer und gleichzeitig risikoreich. Denn aufbewahrungspflichtige Dokumente wie Belege müssen Unternehmen verpflichtend nachvollziehbar und zugänglich aufbewahren. Indexierte Informationen gehen nicht mehr verloren – sie sind über die Volltextsuche schnell zu finden. Für die Compliance, im Falle von Audits oder anderen Prüfungen unterstützt die Volltextsuche Unternehmen dabei, Informationen im Prüfungs- oder Auskunftsfall schneller nachzuweisen.
Suchprozesse beschleunigen
Unabhängig von der Rechtslage beschleunigt die Volltextsuche Workflows. Mitarbeiter finden gesuchte Phrasen oder Informationen in Kürze. Alle relevanten Inhalte schnell zu finden, fördert übrigens auch den unternehmensweiten Wissensaustausch – Fachwissen und wichtige Informationen liegen zentral ab und lassen sich von autorisierten Mitarbeitern leicht zusammentragen.
Wie funktioniert die Volltextsuche im DMS?
In einem modernen DMS ist Volltextsuche Standard – so auch in Doxis. Damit sie zuverlässig funktioniert, werden Dokumente indexiert: Inhalte liegen maschinenlesbar vor, und relevante Informationen können je nach Dokumenttyp zusätzlich als Metadaten strukturiert abgelegt werden. Im Falle einer Rechnung erfasst das System beispielsweise Inhalte wie Rechnungsnummer, Betrag, Positionen oder Lieferanten. Diese Informationen sind dann auch indexiert und durchsuchbar.
Aber nicht bei jeder Dokumentenart sind die wesentlichen Informationen so leicht zu erfassen, zum Beispiel bei E-Mail-Verläufen oder seitenlangen Verträgen. Hier muss der gesamte Text indexiert werden. Über die Volltextsuche durchsuchen Sie den Text dann nach relevanten Informationen.
Schritt 1: Dokument per Document Capturing erfassen
Digitale Dokumente holt sich Doxis über Schnittstellen zu Drittsystemen wie etwa SAP selbstständig ab. Alternativ übergeben die Drittsysteme sie automatisch an Doxis oder Sie schieben sie per Drop and Drag ins System. Anders sieht das aus, wenn Sie Papierdokumente in Doxis erfassen möchten: Solche Dateien müssen Sie zunächst digitalisieren.
Da die Texte eingescannter Dateien zu diesem Zeitpunkt noch als Bilddatei vorliegen, bereitet Doxis diese für Maschinen auf. Dafür nutzt Doxis OCR-Texterkennung. Durch Mustererkennung wandelt die Technologie Textinhalte aus Bilddateien wie Ihrem eingescannten PDF in ein maschinenlesbares Textformat um und legt einen Textlayer auf das PDF. Dieser Text wird dann indexiert. Dadurch finden Sie das Dokument auch zu einem späteren Zeitpunkt durch Eingabe einzelner Wörter in der Volltextsuche wieder.
Schritt 2: Texte klassifizieren
Auf Basis der Textinhalte klassifiziert Doxis die Dokumente. Anhand von Schlagworten wie Rechnungsnummer oder Rechnungsposition erkennt Doxis, dass es sich bei dem Dokument um eine Rechnung handelt. Sollte es sich um ein selteneres Dokument handeln, unterstützt künstliche Intelligenz (KI) bei der Klassifizierung. Dabei durchsucht die KI vorhandene Dokumente auf Ähnlichkeiten und schlägt basierend auf den Suchergebnissen eine Klasse vor.
Schritt 3: Informationen extrahieren
Für einen noch besseren Überblick über wesentliche Informationen eines Dokuments extrahiert die KI in Doxis alle relevanten Informationen eines Dokuments und legt sie strukturiert als Metadaten ab. Im Falle einer Rechnung sind das die oben genannten Informationen wie Rechnungsnummer, Betrag, Positionen oder Lieferanten. Der Vorteil: Daten und Informationen sind in Doxis vollständig erfasst, der Anteil an Dark Data minimiert sich analog.
Schritt 4: Daten validieren
Für die Volltextsuche ist es wesentlich, dass Daten im richtigen Kontext abliegen. Daten validieren Sie in Doxis manuell oder automatisiert:
Manuell: Ein Mitarbeiter gleicht die Informationen aus dem Dokument mit den extrahierten Daten ab.
Automatisiert: Doxis gleicht die Informationen mit zugehörigen Dokumenten ab. Doxis stellt die Rechnung also zum Beispiel der Bestellbestätigung gegenüber.
Schritt 5: Dokument in der richtigen digitalen Akte ablegen
Liegen alle Informationen kontextgebunden, indexiert und extrahiert vor, legt Doxis das Dokument in der richtigen digitalen Akte ab. Die korrekte digitale Akte für die Rechnung könnte also die Lieferantenakte des Rechnungsstellers sein.
Schritt 6: Dokument archivieren
Inaktive Dokumente bewahrt Doxis über definierte Aufbewahrungsfristen revisionssicher auf und unterstützt so GoBD- und DSGVO-orientierte Anforderungen – abhängig von Konfiguration und Prozess. Auch während der revisionssicheren Archivierung von Dokumenten ist die Volltextsuche weiterhin möglich. Im Falle von Prüfungen finden Sie per Volltextsuche die notwendigen Dateien beziehungsweise Daten in Kürze.
Eingangspost intelligent automatisieren
Wie die Stuttgarter Lebensversicherungen ihr Input Management mit Doxis intelligent angehen und so Mitarbeiter entlasten und Kosten unternehmensweit sowie auf Kundenseite einsparen.
Jetzt lesenFazit: Mit der Volltextrecherche Dokumente schnell und effizient durchleuchten
Die Volltextsuche erleichtert es Unternehmen, große Mengen an Dokumenten und Daten langfristig schnell zu überblicken. Per Volltextrecherche finden Mitarbeiter genau die Dokumente oder Inhalte, nach denen sie suchen. Das steigert den unternehmensweiten Wissenstransfer, beschleunigt Prozesse und unterstützt die Nachweisfähigkeit bei Prüfungen. In Doxis finden Sie per Volltextsuche Dokumente wie auch Inhalte in kürzester Zeit und reduzieren so Ihren Dark-Data-Anteil.
Häufige Fragen zur Volltextsuche
Jetzt zum Newsletter anmelden
Die neusten Digitalisierungstrends, Gesetze und Richtlinien sowie hilfreiche Tipps direkt in Ihrem Postfach.
Wie können wir helfen?
+49 (0) 228 90896-0Ihre Nachricht hat uns erreicht!
Wir freuen uns über Ihr Interesse und melden uns in Kürze bei Ihnen.