General methods for search and reinforcement learning
Responsabile del progetto all'USI: Jürgen Schmidhuber
Data di inizio: 1 Aprile 2002
Durata: 36 mesi
Sito web: www.idsia.ch/~juergen/
Discipline di riferimento:
- P175 Informatics, systems theory
- P176 Artificial intelligence
- Alexey Chernov - collaboratore
- Matteo Gagliolo - collaboratore
Enti e Istituti coinvolti nel progetto:
Enti finanziatori:
Obiettivo del progetto è la sintesi di algoritmi ottimi di ricerca e apprendimento (Search and Reinforcement Learning), computabili e applicabili nella pratica, basati su concetti della teoria algoritmica dell´informazione, in particolare sul metodo di ricerca universale non incrementale di Levin e sul recente risolutore ottimo di sequenze ordinate di problemi (Optimal Ordered Problem Solver - OOPS), applicabile a problemi di ottimizzazione e previsione. OOPS è un nuovo metodo di apprendimento incrementale, ottimo rispetto all´utilizzo delle risorse temporali, in grado di migliorare attraverso l´esperienza. È già stato utilizzato con successo su problemi non affrontabili con i tradizionali algoritmi di ricerca e apprendimento. Viene attualmente applicato a problemi della teoria dei giochi e di robotica.