- Machine Learning – wie kann ein Computer überhaupt etwas „lernen“
- Reinforcement Learning – wie lernen Computer „intelligente“ Entscheidungen zu treffen?
- Das Beispielproblem „Entkomme aus dem Labyrinth“ und seine Anwendungen
- Formale Grundlagen: Markow Prozesse, Transitionsmodelle und die Bellmann Gleichung
- Praktische Umsetzung des Q-Learning Verfahrens in einem Beispielprogramm
- Fortgeschrittene Themen, Ausblick und Diskussion
Reinforcement Learning
Bei Machine Learning und anderen KI-Algorithmen geht es oft um die Erkennung oder die Klassifikation von Daten.
Ein Computer „trainert“ Zahlen, Sprache o.ä. zu „verstehen“. Der IDV Experten Abend im März 2021 hat sich bereits mit den dabei zugrundeliegenden Mechanismen, insbesondere mit der Modellierung der Neuronen und Synapsen des menschlichen Gehirns als (künstliches) neuronales Netz in Form eines gerichteten Graphen, beschäftigt (zur Aufzeichnung).
Unabhängig davon, ob Sie diesen Vortrag gehört haben, die Grundlagen aus anderen Quellen kennen oder mit KI nur von der Anwenderseite aus vertraut sind, ist aus Alltagsanwendungen bekannt, dass moderne Computer, wenn die ganze Mathematik „irgendwie funktioniert“ und genug Beispieldaten vorliegen, in Erkennungsanwendungen erstaunlich hohe Trefferquoten erzielen. In unbekannten, d.h. in den Trainingsdaten nicht enthaltenen) Schriftstücken werden Zeichen erkannt oder, um ein weiteres Beispiel zu nennen, es werden automatisiert empfehlenswerte Titel aus einer Liste von Filmen oder Musikstücken selektiert.
Tatsächlich entspricht das Lernen in der KI menschlichen Lernprozessen insoweit, dass sich sagen lässt: je mehr Daten der Computer „gesehen“ (= in der Trainingsphase eingespielt bekommen) hat, umso besser unterscheidet er unbekannte Daten. Weniger offensichtlich ist, wie nahe verwandt Unterscheidungs- und Entscheidungsprozesse sind. Wie kann ein Computer lernen, andere Geräte „intelligent“ zu kontrollieren und zu steuern? Beispielsweise ein autonom fahrendes Fahrzeug? Reinforcement Learning (RL) beschäftigt sich mit dieser Fragestellung und ist das Thema unseres Experten Abends im September 2022.
Der Vortrag beinhaltet eine theoretische Einführung in RL anhand der berühmten Bellmannschen Gleichung sowie die praktische Vorführung eines so genannten Agenten anhand eines Programms mit (ein wenig) Einblick in den Quelltext, zur Lösung eines „e-Mobility“-Problems.
Der Experten Abend richtet sich an Software Entwickelnde und IT-Kräfte, die mitdiskutieren und von den künftigen Entwicklungen profitieren wollen.
Ihr Referent:
Prof. Dr. Jan Dünnweber
Prof. Dr. Jan Dünnweber unterrichtet an der Ostbayerischen Technischen Hochschule (OTH) in Regensburg Informatik und betreut bei der IDV AG Studierende, die in Projekten mitwirken.