Ausgangslage

Die Arbeit eines Rechtsanwalts besteht oft darin, eine beträchtliche Anzahl von Verträgen zu durchforsten. Idealerweise wäre jedes Dokument sorgfältig und konsistent kategorisiert, um die Aufgabe zu vereinfachen. Die Realität in Unternehmen ist jedoch meist weit von dieser idealen Situation entfernt.

Unser Mandant, die Rechtsabteilung eines Dienstleistungsunternehmens, hatte es mit einer grossen Menge unstrukturierter Vertragsdokumente zu tun. Der Zeitaufwand für auffinden gewünschter Informationen aus den Verträgen hat in den letzten Jahren deutlich zugenommen. Sobald ein Dokument gefunden wurde, war es relativ einfach, es zu analysieren. Doch versteckt unter Tausenden von Dokumenten war es so schwierig, eine bestimmte Vertragsinformation zu finden. Diese Problematik führte dazu, dass unser Kunde befürchtete möglicherweise strategisch relevante Informationen zu verpassen, was sogar dem Unternehmen schaden könnte.

Vorgehensweise

Unser Open Web Technology Team unterstützte unseren Kunden bei der Konzeption und Entwicklung einer Lösung, die diese umfangreiche Vertragsdatenbank analysieren und kategorisieren konnte und es somit Nutzern zu ermöglichen, diese zu durchsuchen.

Wir nutzen die Vorteile unseres Joint Ventures mit Swisscom und haben gemeinsam mit dem Swisscom AI-Team eine innovative und intelligente Lösung entwickelt. Diese Lösung konnte von den neuesten Fortschritten der AI-Algorithmen zur effizienten Analyse und Kategorisierung von Dokumenten profitieren und bot darauf aufbauend eine Applikation zur intuitiven Abfrage des der Dokumente basierend auf dem neuen Datenmodell.

 

In einem ersten Schritt haben wir die eingescannten Verträge aus verschiedenen Archivierungssystemen gesammelt und deren Text mit Hilfe modernster Texterkennungs-Technologien (OCR) extrahiert. Nachdem der Dokumentinhalt so als verarbeitbarer Text verfügbar war, haben wir dann Methoden des «Natural Language Processing» sowohl für die Dokumentenkategorisierung als auch für Bildung von Beziehungen/Relationen zwischen Dokumenten angewandt.

 

Anlernen des Dokumenttyps

  1. Um maschinelle Lernaufgaben durchführen zu können, muss ein Computer mit einer digitalen Version des Vertrages arbeiten. Die Umwandlung von Text in ein mathematisches Objekt wird als Dokumenteneinbettung bezeichnet.
  2. Mit jedem Dokument, das als mathematisches Objekt dargestellt wird, kann ein Computer Entfernungen zwischen den Objekten messen und die nächsten Nachbarn zusammenfassen. Dieser Schritt wird als Clustering bezeichnet. In unserem Fall repräsentieren solche Cluster Dokumente des gleichen Typs (Rahmenvertrag, Einzelvertrag, Anhang, etc.) So konnte das System diese automatisch erzeugten Kategorien speichern, so dass der Jurist aufgrund der verschiedenen Dokumentenkategorien suchen kann.

Visualisierung der Clusterbildung von mehr als 1000 Dokumenten in Vertragsarten

Bilden von Beziehungen zwischen Dokumenten

Um Zusammenhänge zwischen Dokumenten zu ermitteln, haben wir den Umstand genutzt, dass Verträge Konventionen beinhalten um sich auf ähnliche Dokumente referenzieren. Dies kann erkannt werden und führt zu einem Dokumentenrelations-Inferenz-Workflow:

Wenn eine solche Referenz gefunden wurde, hat der Algorithmus in der Datenbank alle Dokumente durchsucht um passende Formulierungen oder gleiche Entitäten (Unternehmensnamen, Orte, Produkte etc.) zu finden. Wenn eine solche Referenz gefunden wurde, hat der Algorithmus das Dokument mit der Datenbank abgleichen.

  1. Je nach Dokumenttyp kann die Beziehung zwischen den beiden Dokumenten abgeleitet werden, so dass unser Programm nach und nach eine Liste von Dokumenten erstellen kann, die sich gegenseitig referenzieren.
  2. Diese Liste wird in einer eigenen Referenzdatenbank gespeichert und so kann sie später von der Rechtsabteilung abgefragt zu werden.
  3. Nachdem also ein Dokumenttyp als auch die Beziehung zwischen den Dokumenten erkannt wird, kann der Jurist nun die Applikation nutzen um schnell die gewünschte Information in der grossen Anzahl Dokumente zu finden.

Ergebnis

Die von uns entwickelte Lösung demonstriert, wie künstliche Intelligenz die Unternehmenswelt disruptiv verändern kann, indem sie schwerfällige und sich wiederholende Arbeiten automatisiert, damit die Menschen Zeit für wertvollere Aufgaben aufwenden können.

Unser Kunde konnte innerhalb weniger Monate eine enorme Menge an Dokumenten neu klassifizieren, was mit herkömmlichen Techniken nicht möglich gewesen wäre und zu einer verbesserten Rechtsdatenbank geführt hat.

Bei Open Web Technology sind wir überzeugt, dass Künstliche Intelligenz Unternehmen in naher Zukunft neue Möglichkeiten zur Kostensenkung und Geschäftsentwicklung eröffnet.