Maschinelles Lernen auf Datenströmen und Zeitreihenanalysen zur Entwicklung von Prognoseverfahren sind der wesentliche Kern der Problemstellung. Es existieren bereits viele Ansätze um exakte Prognosen zu generieren, häufig ist es jedoch schwer die entscheidenden Signale zu identifizieren und in einem passenden Modell zu verarbeiten. Auch der Kontext, in welchem zukünftige Entwicklungen prognostiziert werden sollen, ist entscheidend.
Im Rahmen dieses Projekts soll aus einem realen Datensatz ein Prognoseproblem formuliert werden und zunächst klassische Prognoseverfahren auf dieses Problem angewendet werden. Die daraus gewonnenen Erkenntnisse fließen dann in die Entwicklung eines KI-basierten Ansatzes zur Vorhersage ein.
Oftmals ist es so, dass mehrere KI-basierte Ansätze kombiniert werden, um die Prognosegüte weiter zu verbessern. Eine wesentliche Aufgabe wird es daher sein, verschiedene Verfahren auf das Problem anzuwenden und die unterschiedlichen Teillösungen zu kombinieren. Diese Lösungen sollen dann wiederum in einem Smart Service abgebildet werden, der in der Lage ist das aktuelle Kundenverhalten zu interpretieren und versucht, es in die Zukunft zu prognostizieren.
Die Ziele des Partnerunternehmens Bio-Circle sind es durch den Smart Service, in Echtzeit auf branchen- und produktrelevante Ereignisse reagieren zu können und entsprechende Handlungen vorzunehmen (z.B. Anpassung von Lagerbeständen auf Basis der Markterwartungen, ein priorisierter Kundenkontakt im Vertrieb oder zielführende Marketingaktivitäten).
Aufgabe des Studierenden ist es, bei der Konzeptionierung und Realisierung des gesamten Data- Workflows mitzuarbeiten. Dies umfasst unter anderem folgende Punkte:
- Datenaufbereitung und Vorverarbeitung, Formulierung des Prognoseproblems
- Implementierung klassischer Prognosen
- Anreicherung der Datenbasis mit weiteren Features aus externen Datenquellen
- Recherche, Auswahl, Implementierung und Erweiterung von KI-basierten Ansätzen
- Analyse, Auswertung und Optimierung der Verfahren sowie des Trainingsprozesses
- Manuelle Datenanalyse und Datenvisualisierung der Ergebnisse
Bezug zum Thema Data Science
Im Rahmen des Projektes muss der Studierenden verschiedene Verfahren aus den Bereichen Regression, Clustering, Deep Learning und spezifische Verfahren für die Erstellung von Nachfrageprognosen identifizieren und auf Ihre Eignung für den Projektkontext untersuchen und bewerten. Beispielsweise könnte es sich hier um Verfahren wie Random-Forest-Algorithmen, Bagging Ensemble- /Random-Forest Regressoren, ARIMA-Verfahren und Evolutionary Neural Networks (EANNs) handeln.
Für die Analyse der Daten sollen zunächst Werkzeuge der Zeitreihenanalyse angewendet werden, bei der eine Reihe zeitlich aufeinanderfolgender Datenpunkte untersucht und deren Entwicklung vorhergesagt wird. Während traditionelle Modelle in ihrer heutigen Evolutionsstufe bereits in der Lage sind äußerst präzise Vorhersagen bei linearen Zusammenhängen der Nachfragedaten zu treffen, nimmt diese Präzision mit abnehmender Linearität, zunehmender Saisonalität, und zunehmendem Trend jedoch dramatisch ab. Artificial Neural Networks (ANNs), Support Vector Machines (SVMs) und Evolutionary Neural Networks (EANNs) sind hingegen in der Lage aus diesen nicht linearen Zusammenhängen Prognosen mit einer höheren Genauigkeit zu erstellen. Daher soll im Rahmen dieses Projektes eine Modellkombination, also ein Hybrid aus traditionellen Methoden und ML-Techniken aufgebaut werden.
Verfügbare Ressourcen
Seitens des CfADS bietet dieses eine ganzheitliche Forschungsinfrastruktur, um exemplarische Untersuchungen durchzuführen, die sich auf reale Prozesse übertragen lassen.
Die Infrastruktur besteht aus:
- Data-Analytics-Cluster: Rechenzentrum des CfADS mit integriertem Hadoop Big- DataFramework und leistungsstarken GPU-Maschinen für Deep-Learning-Anwendungen
- Industrial-IoT-Factory: Modellfabrik als Nachbildung einer realen Produktionslinie vom Rohstoff zur Lagerung des fertigen Produkts
- Smart Service Lab: Experimentierfeld zur Entwicklung von Smart Services mit Fokus auf den Anwender, der durch den Einsatz von Smart Devices und unterstützenden/kollaborierenden Systemen gewährleistet wird
Die Datengrundlage ist durch die Daten des ERP/CRM-Systems des Projektpartners Bio-Circle Surface Technology GmbH gegeben. Weiterhin steht in diesem Projekt ein Budget für kommerzielle Schnittstellen (z.B. API von Social Media Plattformen oder Wirtschaftsdatenbanken) zur Verfügung. So kann eine breite Basis unterschiedlichster Daten aktiv genutzt werden.
Projektplan
Erstes Semester: Einarbeitung in die CfADS Cloud Infrastruktur und das ERP-System im Hause BioCircle, Konzeption der Grobstruktur für den Smart Demand Forecasting Service, Dokumentation der Bedarfe an die Daten-Schnittstellen zwischen den Systemen, Literaturrecherche, Dokumentation vom Stand der Technik. Prüfungsleistung: Forschungsexposé
Zweites Semester: Qualitäts-Analyse der Stammdaten im ERP/CRM-System des Projektpartners, Aufbereitung der Stammdaten mittels entsprechender Algorithmen, Abgleich der Stammdaten mit Daten aus externen Quellen, Recherche zu relevanten Arbeiten in Themenfeld, Einarbeitung in das Themenfeld Prognose und Maschinelles Lernen, Aufbau eines Demo-Workflows in der CloudInfrastruktur. Prüfungsleistung: Paper zum Stand der Technik von KI-Anwendungen in der Nachfrageprognose
Drittes Semester: Entwicklung und theoretische Erprobung unterschiedlicher Datenanalyse- und Datenvisualisierungsverfahren auf Basis der erhobenen Ist-Daten vom Praxispartner, Automatisierung der optimalen Verfahren, Implementierung einer darauf aufbauenden Entscheidungslogik, Entwicklung einer Benutzerschnittstelle zur Cloud-Plattform, in welcher die Datenanalyseergebnisse abgerufen werden können. Prüfungsleistung: Paper zur Datenanalysesystematik und Entscheidungslogik in einem Demokontext
Viertes Semester: Praktische Erprobung der Bedarfsprognose mit Produktivdaten des Projektpartners, Überwachung und betriebswirtschaftliche Auswertung von den Auswirkungen der neuen automatisierten Bedarfsprognose in einem Feldtest mit ausgewählten Produkten, Konzeption der Integration der KI-Methoden in die ERP/CRM-Systeme des Projektpartners. Prüfungsleistung: Masterarbeit/Kolloquium (Aufbau eines Smart Demand Forecasting Service für ein mittelständisches Chemieunternehmen)
Eignungskriterien
Zwingend:
- Programmierkenntnisse in einer Hochsprache (z.B. Java, C#, C++, idealerweise Python)
- Betriebswirtschaftliche absatztheoretische Grundlagen (z.B. Instrumente des Marketing-Mix, vertriebliche Kennzahlensysteme, Customer Relationship Management, Geschäftsmodellemtwicklung usw.)
- Grundlagen der Statistik
Optional:
- Kenntnisse über Nachfrageprognosen bzw. Prognosemodelle
- Praktische Erfahrung im Marketing und Vertrieb
- Erfahrungen mit Systemen und Paradigmen der Datenspeicherung (z.B. SQL)
- Erfahrungen in der agilen Entwicklung verteilter Softwarelösungen
- Kenntnisse im Hadoop-Ökosystem sowie mit TensorFlow oder Keras
Erwerbbare Kompetenzen
- Aufbau einer übergreifenden Fach- und Methodenkompetenz als Data Scientist und/oder Data Engineer im Kontext von Industrie, Handel und Vertrieb 4.0
- Erfahrungen mit operativen Geschäftsprozessen beim Projektpartner und bei der Ableitung von Kennzahlensystemen in Produktion und Logistik
- Fertigkeiten zur Aufbereitung, Analyse sowie Präsentation entscheidungskritischer Daten
- Umsetzungskompetenz zu aktuellen Verfahren des maschinellen Lernens sowie über die Orchestrierung der Methoden mittels etablierter Tools (z.B. Hadoop und TensorFlow)
- Wissen über die (wirtschaftliche) Planung und Bewertung des Einsatzes von KI-Methoden im Kontext eines digitalisierten Vertriebs und Marketings
- Wissen über kennzahlenbasierte Entscheidungsprozesse im Management
- Praxisrelevante Kenntnisse der agilen Projektarbeit in einem interdisziplinären Team
- Konzeptions- und Implementierungskompetenz für komplexe und verteilte Business- Analytics-Lösungen mit aktuellen Softwarearchitekturen
- Forschungskompetenz durch die fundierte, wissenschaftliche Verwertung der o.g. Themen
- Praktische Anwendung von Methoden des maschinellen Lernens mit realen Daten in Prozessen des Projektpartners