Vorige Seite (Marketing-Fallstudien) Nächste Seite (Maschinelles Lernen B)
Maschinelles Lernen A

LV-Nummer:
508.065
508.066 Stunden:
2 Vo + 1 Ue (Vorlesung + Übung) Semester:
Winter Institut:
508 (``IGI'' ) ECTS-Punkte:
3.0 + 1.5 credits Vortragende:
O.Univ.-Prof. Dipl.-Math. Dr.rer.nat. Wolfgang Maass (), Univ.-Ass. Dipl.-Ing. Thomas Natschläger () Wahlfachkataloge:
Theoretische Informatik, Bildanalyse Lehrinhalt:
Diese Lehrveranstaltung konzentriert sich in diesem Jahr auf Algorithmen, die Roboter, oder allgemeiner, künstliche Agenten lernfähig machen. Der künstliche Agent kann neben einem Roboter zum Beispiel auch ein Schachprogramm, ein Computerspiel oder ein Internet Browser sein. In der Regel steht dem künstlichen Agenten kein Lehrer zur Seite, der ihm bei jedem einzelnen Schritt sagen kann, welches der optimale nächste Schritt wäre. Typischer ist die Situation, wo der künstliche Agent gelegentlich ein ``Erfolgserlebnis'' hat aber selbst herausbekommen muß, welcher Teilschritt wieviel zu diesem Erfolg beigetragen hat und daraus selbständig erfolgreiche Strategien für die Zukunft entwickeln muß. Am bisher erfolgreichsten haben sich bei dieser Art von Problemen die Algorithmen des Reinforcement Lernen (http://www.cs.brown.edu/people/lpk/rl-survey/rl-survey.htm; http://www.cse.msu.edu/rlr/) erwiesen. Daher stellen wir diesen Ansatz in den Mittelpunkt dieser Lehrveranstaltung und behandeln sowohl den theoretischen Hintergrund (dynamisches Programmieren, Markov Entscheidungsprozesse) als auch konkrete Anwendungen auf den Miniroboter Khepera (http://diwww.epfl.ch/Khepera/) an unserem Institut. Da das Reinforcement Lernen gegenwärtig als aussichtsreichstes Modell für Lernen in lebendigen Organismen angesehen wird, werden wir auch diesen Zusammenhang kurz erläutern. Zusätzlich werden wir das Computer Spiel Creatures 2 (http://www.creatures2.com/) behandeln (das eine Art von Reinforcement Lernen verwendet) und die Studierenden zum Entwurf interessanter Computer Spiele mittels verbesserter Lernalgorithmen anregen. Neben dem Reinforcement Lernen werden wir voraussichtlich auch Bayes'sche Methoden zum Optimieren von Entscheidungen und Lernen und Repräsentieren von unsicherem Wissen mittels grafischer Modelle (http://www.cs.berkeley.edu/ murphyk/Bayes/bayes.html) behandeln. Lehrziel:
Selbständiges Lösen von begrifflich/theoretischen Fragen. Studienbehelfe:
T. M. Mitchell: Machine Learning, McGraw-Hill, New York, 1997. R. O. Duda, P.E. Hart, D. G. Stork: Pattern Classification, 2nd edition, John Wiley & Sons, 2001. I. H. Witten, E. Frank: Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann, 1999. J.R. Quinlan: C4.5: Programms for Machine Learning, Morgan Kaufmann, 1992. V. N. Vapnik: Statistical Learning Theory, John Wiley & Sons, New York, 1998. Prüfungsmodus:
Schriftlich

© 1997-2002: Dieter LUTZMAYR
Letzte Änderung am 27. Dezember 2001