Multiagent reinforcement learning using Non-Parametric Approximation

Ver/

respuestas_2019.pdf (1.469Mb)

Fecha

2019-08-28

Autor

Luviano Cruz, David

Metadatos

Mostrar el registro completo del ítem

Resumen

n este artículo se presenta una propuesta hibrida de algoritmo de control para sistemas multiagentes, en donde se aprovechan las ventajas del aprendizaje por reforzamiento y de las funciones de aproximación no paramétricas. Se utiliza una versión modificada del algoritmo Q-learning la cual proveerá de datos de entrenamiento para un Kernel, el cual ofrecerá una aproximación sub optima de acciones a realizar por los agentes. El algoritmo propuesto es probado experimentalmente en una tarea de generación de trayectoria en un entorno desconocido para robot móviles

URI

http://cathi.uacj.mx/20.500.11961/8134

Colecciones

Artículo en revista de investigación [1091]