Teilprojekt M2: Lernen der dynamischen Prozess Modelle basierend auf Daten und Expertenwissen
Professor Dr.-Ing. Gerhard Neumann
Professor Dr.-Ing. Luise Kärger
Dr.-Ing. Julius Pfrommer
In diesem Teilprojekt widmen wir uns dem Lernen von dynamischen Modellen des Prozesses gegeben Input/Output Zeitreihen welche durch Simulation (zur Verfügung gestellt von T2) und durch die Prozess-Instrumentierung (zur Verfügung gestellt von T1/M1) erzeugt werden. Diese gelernten Modelle werden anschließend in M3 für eine modell-basierende Parameter-Optimierung und in M4 für die Entwicklung neuer model-basierender Feedback-Controller, welche den Mess- und Aktuations-Unsicherheiten entgegenwirken können, verwendet.
Unsere Dynamikmodelle müssen den Zustand (Geometrieund andere Eigenschaften wie zum Beispiel Temperatur-Verteilung) des Produktes, gegeben verschiedener Prozessparameter und Aktuator-Aktionen, vorhersagen. Dies wird mittels mesh-basierender neuronaler Netzwerkarchitekturen, welche Message-Passing Algorithmen in Graph-Convolutional Neuronalen Netzen (GCNN) verwenden, realisiert. Hierbei wird die lokale Zustandsinformationen des Produkts spatial durch das Mesh-Graphen propagiert um solche Vorhersagen zu machen. Solche Netzwerkarchitekturen wurden schon dazu verwendet, um die Dynamik von Finite-Element (FE) Simulationen vorherzusagen, wobei dies mit wesentlich weniger Rechenaufwand als durch die originalen FE Simulationen möglich ist. Hierdurch können solche Netzwerkarchitekturen von Optimierungsmethoden (siehe M3 und M4) mit realisierbaren Rechenaufwand ermöglichen.
Diese Arten von Modellen können jedoch bis jetzt nur durch Simulation-Daten gelernt werden und wurden auch nicht auf verschiedene Prozess-Parameter oder verteilte Aktuatoren konditioniert. Es ist daher unklar, ob die Vorhersagen über mehrere Zeitschritte auch akkurat genug sind, um eine modell-basierte Optimierung der Parameter und Feedback-Kontroller zuzulassen. Neben den rein daten-getriebenen Lernen werden wir in diesem Projekt auch physikalisches Vorwissen einsetzen, um hybride Architekturen, bestehend aus neuronalen Netzen und physikalischen Priors, zu entwickeln, welche auch mit wenigen Trainingsbeispielen trainiert werden können.
In diesem Projekt werden daher die folgenden wissenschaftlichen Fragestellungen behandelt: (i) Die Entwicklung von neuronalen Netzwerk-Architekturen, welche schnell genug sind, um für eine Optimierung eingesetzt zu werden, (ii) Lernen von echten Daten, um die Genauigkeit von Simulationsmodellen zu übertreffen, (iii) Konditionierung der Dynamik-Modelle auf verteilte Parameter und Aktuatoren des Prozesses, (iv) das Zurechtkommen mit einer kleinen Anzahl von echten Daten durch eine Kombination von daten-getriebenen Modellen und analytischen Physik-Priors und (v) der Transfer von gelernten Modellen auf eine neue, leicht veränderte Struktur der Prozesses.
Dieses Projekt basiert auf den folgenden KI-Methoden: Geometrisches Tiefes Lernen, Graph-Neuronale Netze, Rekurrente Neuronale Netze, Meta-Lernen, Sim-2-Real Transfer, Physics-Informed Neural Network Architectures and Variational Inferenz.