MindServer Categorization

Daten strukturieren und kategorisieren - Die Herausforderung der Zukunft!

Verschlagwortung, Kategorisierung, Indexierung, Indizierung – verschiedene Begriffe, die im Bereich des Information Retrieval, der Suchmaschinentechnologie ein und dasselbe beschreiben, nämlich die Analyse eines Dokuments, die Anreicherung mit eindeutigen, beschreibenden Begriffen (Metadaten) und die anschließende (ggf. automatische) Einordnung in ein bestehendes Kategoriensystem.

Eine Aufgabe, die aufgrund ihrer intellektuellen Anforderung auch im Bereich der digitalen Daten bislang Human Resources-Einsatz erforderte. Angesichts der stetig wachsenden Menge an neuen, elektronischen Dokumenten bei gleichzeitig steigendem Kostendruck ein Kampf gegen Windmühlen!

Erst mit der patentierten CORE™ – Technologie ist es möglich, diese Arbeit von einem Computer mit der gleichen Präzision und Vollständigkeit durchführen zu lassen wie von einem Archivar. In unabhängigen Tests des Fraunhofer-Instituts hat Recommind's Categorizer bewiesen, auf menschlichem Niveau zu verschlagworten. Der Kategorisierer der MindServer-Familie analysiert und prüft Inhalte, unabhängig ob es sich um strukturierte oder unstrukturierte Informationen handelt und ordnet diese automatisch in eine Informationsstruktur – Taxonomie, Ontologie oder thematische Klassifikationen.

Präzise Kategorisierung durch inhaltliches Verständnis

Der MindServer™ Categorizer strukturiert alle vorhandenen und neu hinzukommenden Informationen. Mit Hilfe dieser Software können Dokumentare und Archivare, Intranet-Verantwortliche und Content Manager ihre Arbeit effektiver gestalten. Sie verbringen erheblich weniger Zeit mit der Organisation der Daten und können sich auf ihre eigentliche Kernaufgabe, die qualitative Informationsbereitstellung konzentrieren. Der Wert der vorhandenen Informationen wird so maximiert.

Automatisiertes Records Management

Auch im Bereich des Records Managements kann der Such- und Markierprozess relevanter Daten und Dokumente automatisiert werden - der gesamte Prozess wird mit Hilfe des Categorizers schneller, präziser und kosteneffizienter ohne das von dem Hintergrundprozess beeinflusst oder gar gestört werden.

Optimierte und rechtssichere Archivierung

Das Wachstum unstrukturierter Daten wird auf jährlich 100 - 200% geschätzt. Zu dem Problem der Datenflut kommt noch hinzu, dass viele Unternehmen überhaupt nicht wissen, welche Informationen für Unternehmens-, Records Management-, Compliance- oder E-Discovery-Zwecke gespeichert werden müssen - so wird oft einfach alles archiviert und nichts gelöscht.

Der MindServer Categorizer kann exakt bestimmen, welche Inhalte gespeichert werden müssen und versetzt Unternehmen damit in die Lage, die Archive zu optimieren, ein Information Lifecycle Management einzuführen und mit dem Löschprozess nicht benötigter Daten zu beginnen. Neben dem geringeren Informationsrisiko ergeben sich so auch Einsparungspotentiale durch schlankere Archive und reduzierten Speicherbedarf.  

Bestandteil einer End-to-End E-Discovery Plattform

MindServer Categorization bildet zusammen mit Recommind's preisgekrönten Anwendungen Insite Legal Hold™ und Axcelerate eDiscovery™ eine einzigartige End-to-End E-Discovery Plattform - vom Information Management über die Datensammlung, Verarbeitung, Prüfung, Analyse bis zur Veröffentlichung.

SharePoint Investitionen maximieren
Mit MindServer Categorization können Unternehmen Daten kategorisieren und veredeln bevor sie in SharePoint allen Usern verfügbar gemacht werden. Informationen werden so einfacher, schneller und präziser im Unternehmen wiedergefunden und gewinnen so an Wert. Durch die Anreicherung der Daten kommt es zu genauen und umfassenden Suchergebnissen und die Akzeptanz und der Nutzen von SharePoint Installationen steigt erheblich.

Verbesserte Suchergebnisse
MindServer Categorization steigert die Effektivität von MindServer Search - oder jeder anderen Suchtechnologie - indem es Inhalte extrahiert, kategorisiert und zusätzliche Zusammenhänge in Unternehmensdaten herstellt. Der User findet so genau die Informationen, die er benötigt. 

Merkmale:

  • Präzise Kategorisierung von Dokumenten in eine oder mehrere Kategorien in einer Ein- oder Mehrfachtaxonomiestruktur
  • Genaue Zuordnung von Deskriptoren, Thesaurus-Ausdrücken oder Metadaten zum Dokument
  • Dokumente können gleichzeitig automatisch und regelbasiert kategorisiert werden
  • Mehrere Trainingsmodi - automatisiertes Lernen durch Beispieldokumente, regelbasiert oder assistiert durch positive und negative Beispiele
  • Unterstützung von Mehrfachtaxonomien, sowohl flach als auch hierarchisch
  • Einfaches Importieren vorhandener Taxonomien
  • Qualitäts-Reports über den Präzisionsgrad der Kategorisierung nach Kategorie
  • Grafische Oberfläche ermöglicht einfache Administration und Bearbeitung der Taxonomiestrukturen
  • Unterstützt mehr als 30 Sprachen, einschließlich Englisch, Spanisch, Deutsch, Italienisch, Französisch, Russisch, Japanisch, Koreanisch, Chinesisch, Arabisch (komplette Liste auf Anfrage)
  • Unterstützt über 400 Dokumentformate und Dateitypen einschließlich MS Word, Excel, PowerPoint, Adobe, WordPerfect, html, E-Mail Anhänge und ZIP-Dateien (komplette Liste auf Anfrage)
  • Schnelle und einfache Integration in nahezu jede Umgebung (DMS-, CMS-Lösungen, Record Managementsysteme, Portale, Dateisysteme, Datenbanken oder z.B. Webseiten)

Wie der MindServer Categorizer funktioniert:

MindServer Categorization crawled und indiziert Texte aktiv aus den definierten Quellen (DMS-, CMS-Systeme, Intranets, Webseiten, CRM-Lösungen, Datenbanken, Dateisystemen, FileShares etc.). Basierend auf deren Inhalt werden Dokumente mit einer oder mehreren Kategorien assoziiert, z.B. Thema, Dokumenttyp, geographische Lage, Branche und mit den entsprechenden Metadaten angereichert. MindServer Categorization ist in der Lage, automatisierte Kategorisierungen von neuen Dokumenten basierend auf Trainingssets anhand von positiven und negativen Beispieldokumenten durchzuführen. Dieser Prozess kann zusätzlich noch durch frei definierbare Regeln ergänzt werden.

Durch den Einsatz von MindServer Categorization kann eine unternehmenseigene Taxonomie auf Basis von Dateistrukturen oder Informationen in der Dokumentensammlung entwickelt werden, es können aber auch problemlos vorhandene Taxonomien (auch mehrere) übernommen werden. Neu hinzukommende Dokumente und geänderte Daten werden identifiziert und inkrementell gecrawled und verschlagwortet. 

Die CORE™ Technologie

Recommind's CORE-Technologie basiert auf eigenentwickelten, geschützten Machine Learning Technologien, unter anderem dem patentierten Probabilistic Latent Semantic Analysis (PLSA)- Algorithmus. Recommind's Lösungen verbinden in idealer Weise die Vorteile menschlicher Genauigkeit und inhaltlichem Verständnis mit den Möglichkeiten der Automatisierung durch Computer. 

Klicken Sie hier um mehr über die CORE-Plattform zu erfahren.