
Citation
Share
Date
Abstract
En la presente investigación se verifica la viabilidad de obtener un Neurocontrolador para dos grados de libertad: Roll/ Φ y Pitch/θ , de un mini-helicóptero swiftló montado sobre una base de limitación física, de forma simulada, teniendo en consideración lo siguiente: 1. No se cuenta con un modelo matemático de la dinámica del mini-helicóptero swifitló. 2. Es un problema de decisiones secuenciales, "Sequential Decisión Problems (SDPs)", lo que significa que todas las acciones de control están ligadas. 3. El agente o Neurocontrolador, interactúa con un ambiente objetivo desconocido, y donde está en búsqueda de acciones que maximizan su recompensa o aptitud a largo plazo (tiempo en que se evaluará al agente). Con base en las consideraciones antes expuestas el problema se dividió en dos partes. En la primera parte el modelo de la dinámica de la planta es identificado experimentalmente usando redes neuronales; dicho modelo será la base para el ambiente de simulación y experimentación de la segunda parte, en la cual se atacó el problema con una perspectiva de aprendizaje por refuerzo [4], en particular usando una técnica Neuroevolutiva conocida con el nombre de NeuroEvolution of Augmenting Topologies NEAT [1], esta técnica toma una población de individuos, agentes o Neurocontroladores, y los evoluciona conforme pasan las generaciones, y en donde en cada generación se evalúa a cada individuo durante ciento cincuenta incrementos de tiempo secuencial para finalmente obtener su aptitud la cual es la única guía del algoritmo NEAT en el proceso de Neuroevolución general. En base a los resultados de la experimentación realizada, el desarrollo de un Neurocontrolador , utilizando el algoritmo NEAT, dentro del ambiente de simulación basado en el modelo identificado con redes neuronales, se puede considerar posible mientras se tenga especial cuidado en el proceso de evolución incremental, y en una buena identificación de la dinámica de la planta.