SimLearn
Vervollständigung von Trainingsdaten durch iterativ lernende Simulation
Maschinelle Lernverfahren auf Basis vorhandener Trainingsdaten haben große Leistungsfähigkeit bewiesen, um auch in komplexen Situationen mit vielen Parametern Muster und implizite Abhängigkeiten zu erkennen und mit den erlernten Modellen korrekte Klassifikationen, Vorhersagen oder Entscheidungshilfen zu liefern. In der Praxis sind jedoch die für solche Ansätze notwendigen großen Mengen an korrekt gelabelten Trainingsdaten oft nicht verfügbar.
Anhand konkreter Anwendungsbeispiele aus dem Agrarbereich untersucht SimLearn die Tauglichkeit eines neuen Vorgehensmodells, in dem vorhandenes, in Simulationsmodellen kodifiziertes und operatives Wissen mit den fortschreitenden Erkenntnissen erlernter Modelle iterativ kombiniert wird: Durch vorhandene Simulationsmodelle werden umfangreiche synthetische Trainingsdatensätze erzeugt. Ein damit initiiertes lernendes System wird sodann durch im jeweiligen Anwendungsbetrieb erhobene (wenige) Daten erweitert und verbessert. Durch diese Kombination werden Lücken der vorhandenen Datenbasis gefüllt und ein verbessertes Training ermöglicht. Im Ergebnis entsteht so ein erlerntes, leistungsfähigeres Modell der betrachteten Realität mit entsprechend besseren Nutzungspotentialen.
SimLearn betrachtet exemplarisch die betrieblichen Entscheidungen im Getreideanbau auf operativer und taktischer Ebene in Bezug auf Einkommens- und Umwelteffekte. Das bioökonomische Modellsytem MPMAS_XN der Universität Hohenheim wird für initiale Simulationen der Auswirkungen von Dünge- und Anbauentscheidungen sowohl in biologischer (Pflanzenwachstum) als auch ökonomischer (realisierbarer Gewinn) Sicht genutzt. Diese Informationen werden mit den Ergebnissen kooperierender Versuchsbetriebe sowie mit Standard- und Durchschnittswerten des Kuratoriums für Technologie und Bauwesen in der Landwirtschaft KTBL kombiniert und abgeglichen. DFKI trainiert mit der so erzeugten bewerteten Datensammlung iterativ ein geeignetes lernendes System, das im Ergebnis eine verbesserte Prognose und Bewertung von Handlungsalternativen ermöglicht.
Laufzeit: 01.01.2020 - 30.06.2023
Fördersumme: 1,87 Mio EUR (Gesamt), 0,51 Mio EUR (Universität Hohenheim), BMBF / DLR-Projektträger