Abschluss­arbeit
"Implemen­tierung eines Modells zur gezielten Daten­extraktion und -klassifikation aus Text­dokumenten"

Offen. Direkt. Effizient.

Abschlussarbeit: "Implementierung eines Modells zur gezielten Datenextraktion und -klassifikation aus Textdokumenten"

Trotz weitgehend digitalisierter Prozesse fallen in einigen Verwaltungsbereichen immer noch große Mengen an heterogenen Textdokumenten an. Das manuelle Abarbeiten dieser Dokumente (z.B. Rechnungen und Lieferscheine) ist zeitaufwändig und fehleranfällig. Moderne Methoden des maschinellen Lernens bieten vielversprechende Ansätze, um diesen Prozess zu automatisieren.

 

Durch die Nutzung eines bereits implementierten Workflow-Automation-Tools und einer integrierten Texterkennungs-Technologie (Optical Character Recognition, kurz OCR) können Dokumente in maschinenlesbare Zeichenketten umgewandelt werden. Die Herausforderung besteht nun darin, aus diesen Rohdaten gezielt die für die Weiterverarbeitung relevanten Informationen zu extrahieren und zu klassifizieren.

Ihre Aufgaben

  • Entwicklung und Implementierung eines Modells zur Extraktion und Klassifikation relevanter Informationen aus Textdokumenten basierend auf maschinellem Lernen, Natural Language Processing (NLP), regelbasierten Algorithmen oder einer Kombination aus den genannten
  • Vergleich und Evaluation der Modelle anhand von Kriterien wie Genauigkeit, Effizienz und Robustheit
  • Sicherstellung einer reibungslosen Schnittstelle zwischen dem Workflow-Automation-Tool und dem entwickelten Modell
  • Dokumentation der Implementierung sowie der Evaluationskriterien und -ergebnisse

Ihr Profil

  • Student (m/w/d) der Informatik, Wirtschaftsinformatik, Data Science oder eines vergleichbaren Studiengangs
  • Idealerweise Erfahrung mit der Programmiersprache Python sowie einschlägigen Machine-Learning-Bibliotheken (z.B. scikit-learn, TensorFlow, oder PyTorch)
  • Kenntnisse im Bereich NLP, insbesondere in der Textvorverarbeitung, Merkmalsextraktion und Klassifikation wünschenswert
  • Kenntnisse im Bereich verteilte Systeme bzw. deren Schnittstellen (z.B. REST-API, MQTT, …) sind von Vorteil
  • Interesse an der Datenverarbeitung und Automatisierung von Geschäftsprozessen
  • Analytisches und strukturiertes Denkvermögen sowie Kommunikationsstärke

Wir bieten

Vergütung & Arbeitsumfeld

Faire Vergütung, modernes Arbeitsumfeld, familiäre und motivierende Arbeitsatmosphäre

  1.  

Praxisnähe
 

Praxisnahes Thema, intensive Betreuung

  1.  

Mitwirkung in Projekten

Mitwirkung in spannenden Projekten,  aktive Mitarbeit am Unternehmens-geschehen 

Übernamhe-chancen

Gute Chancen auf einen Direkteinstieg nach erfolgreichem Abschluss des Studiums

Gesundheit
 

Sportgruppen, Betriebsrestaurant mit frischen Speisen zu vergünstigten Preisen

u.v.m.

avatar
Haben wir DEIN interesse geweckt?
Dann freuen wir uns Auf DEINE bewerbung! 
Herr Johannes Hänle
Personalabteilung
Hüttlinger Straße 18-20