Smart Demand Forecasting

Projektübersicht

Anzahl Studierende	1
Art	gefördertes Projekt mit externem Partner
Projektverantwortung	Prof. Dr. Pascal Reusch
Projektkontext	Projekt in Zusammenarbeit mit dem Center for Applied Data Science Gütersloh (CfADS) und der Bio-Circle Surface Technology GmbH in Gütersloh. Neben den Aufgaben im Rahmen des Studiums ist im Projekt auch eine Anstellung des Studierenden als HiWi beim CfADS möglich
Projektdurchführung	Lina Döring

Kurzbeschreibung

Bei Entscheidungssituationen in der Planung ist es wichtig Entwicklungen in der Zukunft richtig vorhersagen zu können. Entscheider, die ein genaues Modell zur Vorhersage zukünftiger Ereignisse haben, besitzen einen Wettbewerbsvorteil. Dies gilt in Bereichen wie Gaming, autonomen Fahren und grundsätzlich auch in der Realwirtschaft. Für Unternehmen ist insbesondere die Prognose zukünftiger Umsatzentwicklungen wichtig, da von Ihnen Entscheidungen in vielen Unternehmensbereichen (z.B. Personalplanung, Beschaffung, Produktion, Forschung, etc.) abhängen.

In diesem Projekt sollen Modelle zur Vorhersage des zukünftigen Kundenverhaltens mit Hilfe von Methoden des maschinellen Lernens entwickelt werden. Die Vorhersagen sollen dabei in einen Smart Service integriert werden, der KI-basiert und datengetrieben historisches Kundenverhalten interpretieren, Einflussfaktoren auf das Kundenverhalten erkennen und zukünftiges Kundenverhalten vorhersagen kann. Dabei sollen neben realen Unternehmensdaten des Projektpartners eine Vielzahl heterogener Datenquellen in den Ansätzen integriert werden. Aus früheren Projekten stehen die Datenschnittstellen bereits zur Verfügung, so dass aktuell z.B. Verkaufsdaten, Versandinformationen und Vertriebsdaten aus den operativen Systemen des Projektpartners Bio-Circle im Data-Analytics Cluster des CfADS vorhanden sind.

Aufgabenstellung

Maschinelles Lernen auf Datenströmen und Zeitreihenanalysen zur Entwicklung von Prognoseverfahren sind der wesentliche Kern der Problemstellung. Es existieren bereits viele Ansätze um exakte Prognosen zu generieren, häufig ist es jedoch schwer die entscheidenden Signale zu identifizieren und in einem passenden Modell zu verarbeiten. Auch der Kontext, in welchem zukünftige Entwicklungen prognostiziert werden sollen, ist entscheidend.

Im Rahmen dieses Projekts soll aus einem realen Datensatz ein Prognoseproblem formuliert werden und zunächst klassische Prognoseverfahren auf dieses Problem angewendet werden. Die daraus gewonnenen Erkenntnisse fließen dann in die Entwicklung eines KI-basierten Ansatzes zur Vorhersage ein.

Oftmals ist es so, dass mehrere KI-basierte Ansätze kombiniert werden, um die Prognosegüte weiter zu verbessern. Eine wesentliche Aufgabe wird es daher sein, verschiedene Verfahren auf das Problem anzuwenden und die unterschiedlichen Teillösungen zu kombinieren. Diese Lösungen sollen dann wiederum in einem Smart Service abgebildet werden, der in der Lage ist das aktuelle Kundenverhalten zu interpretieren und versucht, es in die Zukunft zu prognostizieren.

Die Ziele des Partnerunternehmens Bio-Circle sind es durch den Smart Service, in Echtzeit auf branchen- und produktrelevante Ereignisse reagieren zu können und entsprechende Handlungen vorzunehmen (z.B. Anpassung von Lagerbeständen auf Basis der Markterwartungen, ein priorisierter Kundenkontakt im Vertrieb oder zielführende Marketingaktivitäten).

Aufgabe des Studierenden ist es, bei der Konzeptionierung und Realisierung des gesamten Data- Workflows mitzuarbeiten. Dies umfasst unter anderem folgende Punkte:

Datenaufbereitung und Vorverarbeitung, Formulierung des Prognoseproblems
Implementierung klassischer Prognosen
Anreicherung der Datenbasis mit weiteren Features aus externen Datenquellen
Recherche, Auswahl, Implementierung und Erweiterung von KI-basierten Ansätzen
Analyse, Auswertung und Optimierung der Verfahren sowie des Trainingsprozesses
Manuelle Datenanalyse und Datenvisualisierung der Ergebnisse

Bezug zum Thema Data Science
Im Rahmen des Projektes muss der Studierenden verschiedene Verfahren aus den Bereichen Regression, Clustering, Deep Learning und spezifische Verfahren für die Erstellung von Nachfrageprognosen identifizieren und auf Ihre Eignung für den Projektkontext untersuchen und bewerten. Beispielsweise könnte es sich hier um Verfahren wie Random-Forest-Algorithmen, Bagging Ensemble- /Random-Forest Regressoren, ARIMA-Verfahren und Evolutionary Neural Networks (EANNs) handeln.

Für die Analyse der Daten sollen zunächst Werkzeuge der Zeitreihenanalyse angewendet werden, bei der eine Reihe zeitlich aufeinanderfolgender Datenpunkte untersucht und deren Entwicklung vorhergesagt wird. Während traditionelle Modelle in ihrer heutigen Evolutionsstufe bereits in der Lage sind äußerst präzise Vorhersagen bei linearen Zusammenhängen der Nachfragedaten zu treffen, nimmt diese Präzision mit abnehmender Linearität, zunehmender Saisonalität, und zunehmendem Trend jedoch dramatisch ab. Artificial Neural Networks (ANNs), Support Vector Machines (SVMs) und Evolutionary Neural Networks (EANNs) sind hingegen in der Lage aus diesen nicht linearen Zusammenhängen Prognosen mit einer höheren Genauigkeit zu erstellen. Daher soll im Rahmen dieses Projektes eine Modellkombination, also ein Hybrid aus traditionellen Methoden und ML-Techniken aufgebaut werden.

Verfügbare Ressourcen

Seitens des CfADS bietet dieses eine ganzheitliche Forschungsinfrastruktur, um exemplarische Untersuchungen durchzuführen, die sich auf reale Prozesse übertragen lassen.

Die Infrastruktur besteht aus:

Data-Analytics-Cluster: Rechenzentrum des CfADS mit integriertem Hadoop Big- DataFramework und leistungsstarken GPU-Maschinen für Deep-Learning-Anwendungen
Industrial-IoT-Factory: Modellfabrik als Nachbildung einer realen Produktionslinie vom Rohstoff zur Lagerung des fertigen Produkts
Smart Service Lab: Experimentierfeld zur Entwicklung von Smart Services mit Fokus auf den Anwender, der durch den Einsatz von Smart Devices und unterstützenden/kollaborierenden Systemen gewährleistet wird

Die Datengrundlage ist durch die Daten des ERP/CRM-Systems des Projektpartners Bio-Circle Surface Technology GmbH gegeben. Weiterhin steht in diesem Projekt ein Budget für kommerzielle Schnittstellen (z.B. API von Social Media Plattformen oder Wirtschaftsdatenbanken) zur Verfügung. So kann eine breite Basis unterschiedlichster Daten aktiv genutzt werden.

Projektplan
Erstes Semester: Einarbeitung in die CfADS Cloud Infrastruktur und das ERP-System im Hause BioCircle, Konzeption der Grobstruktur für den Smart Demand Forecasting Service, Dokumentation der Bedarfe an die Daten-Schnittstellen zwischen den Systemen, Literaturrecherche, Dokumentation vom Stand der Technik. Prüfungsleistung: Forschungsexposé

Zweites Semester: Qualitäts-Analyse der Stammdaten im ERP/CRM-System des Projektpartners, Aufbereitung der Stammdaten mittels entsprechender Algorithmen, Abgleich der Stammdaten mit Daten aus externen Quellen, Recherche zu relevanten Arbeiten in Themenfeld, Einarbeitung in das Themenfeld Prognose und Maschinelles Lernen, Aufbau eines Demo-Workflows in der CloudInfrastruktur. Prüfungsleistung: Paper zum Stand der Technik von KI-Anwendungen in der Nachfrageprognose

Drittes Semester: Entwicklung und theoretische Erprobung unterschiedlicher Datenanalyse- und Datenvisualisierungsverfahren auf Basis der erhobenen Ist-Daten vom Praxispartner, Automatisierung der optimalen Verfahren, Implementierung einer darauf aufbauenden Entscheidungslogik, Entwicklung einer Benutzerschnittstelle zur Cloud-Plattform, in welcher die Datenanalyseergebnisse abgerufen werden können. Prüfungsleistung: Paper zur Datenanalysesystematik und Entscheidungslogik in einem Demokontext

Viertes Semester: Praktische Erprobung der Bedarfsprognose mit Produktivdaten des Projektpartners, Überwachung und betriebswirtschaftliche Auswertung von den Auswirkungen der neuen automatisierten Bedarfsprognose in einem Feldtest mit ausgewählten Produkten, Konzeption der Integration der KI-Methoden in die ERP/CRM-Systeme des Projektpartners. Prüfungsleistung: Masterarbeit/Kolloquium (Aufbau eines Smart Demand Forecasting Service für ein mittelständisches Chemieunternehmen)

Eignungskriterien
Zwingend:

Programmierkenntnisse in einer Hochsprache (z.B. Java, C#, C++, idealerweise Python)
Betriebswirtschaftliche absatztheoretische Grundlagen (z.B. Instrumente des Marketing-Mix, vertriebliche Kennzahlensysteme, Customer Relationship Management, Geschäftsmodellemtwicklung usw.)
Grundlagen der Statistik

Optional:

Kenntnisse über Nachfrageprognosen bzw. Prognosemodelle
Praktische Erfahrung im Marketing und Vertrieb
Erfahrungen mit Systemen und Paradigmen der Datenspeicherung (z.B. SQL)
Erfahrungen in der agilen Entwicklung verteilter Softwarelösungen
Kenntnisse im Hadoop-Ökosystem sowie mit TensorFlow oder Keras

Erwerbbare Kompetenzen

Aufbau einer übergreifenden Fach- und Methodenkompetenz als Data Scientist und/oder Data Engineer im Kontext von Industrie, Handel und Vertrieb 4.0
Erfahrungen mit operativen Geschäftsprozessen beim Projektpartner und bei der Ableitung von Kennzahlensystemen in Produktion und Logistik
Fertigkeiten zur Aufbereitung, Analyse sowie Präsentation entscheidungskritischer Daten
Umsetzungskompetenz zu aktuellen Verfahren des maschinellen Lernens sowie über die Orchestrierung der Methoden mittels etablierter Tools (z.B. Hadoop und TensorFlow)
Wissen über die (wirtschaftliche) Planung und Bewertung des Einsatzes von KI-Methoden im Kontext eines digitalisierten Vertriebs und Marketings
Wissen über kennzahlenbasierte Entscheidungsprozesse im Management
Praxisrelevante Kenntnisse der agilen Projektarbeit in einem interdisziplinären Team
Konzeptions- und Implementierungskompetenz für komplexe und verteilte Business- Analytics-Lösungen mit aktuellen Softwarearchitekturen
Forschungskompetenz durch die fundierte, wissenschaftliche Verwertung der o.g. Themen
Praktische Anwendung von Methoden des maschinellen Lernens mit realen Daten in Prozessen des Projektpartners

Kontakt

Prof. Dr. rer. oec. Pascal Reusch

+49.5241.21143-22

pascal.reusch@hsbi.de