2,430 research outputs found

    Una perspectiva de aprendizaje por refuerzos híbridos para el control de robots móviles

    No full text
    The low-level control of autonomous mobile robots has been extensivelyaddressed by classical control techniques. However, the variable operativeconditions and different environmental factors faced by these robots havedriven researchers towards the formulation of adaptive control approaches.In this sense, artificial intelligence techniques seem promising since theycan provide a higher level of abstraction to the robot, allowing for moregeneral decision making. Particularly, within these techniques, the rein-forcement learning paradigm has excelled in solving the most diverse typeof problems, by providing a model free unsupervised solution. Further-more, recent developments in the deep reinforcement learning field haveallowed the use of deep neural networks as function approximators of thepolicy function, increasing the generalization performance. In this thesisthe author studies the capabilities of the reinforcement learning paradigmfor the real time low-level control of mobile robots. Making use of existingclassical control techniques and reinforcement learning, hybrid controllersare obtained that take the best of both worlds, enhancing the overall per-formance and effectively achieving adaptive controllers. Extensive resultsin simulation and on different robotic platforms show the promising ap-plicability of these intelligent adaptive controllers for autonomous robots.El control de bajo nivel de robots móviles autónomos ha sido ampliamente abordado por las técnicas de control clásicas. Sin embargo, las condiciones operativas variables y los diferentes factores ambientales que enfrentan estos robots han llevado a los investigadores hacia la formulación de enfoques de control adaptivo. En este sentido, las técnicas de inteligencia artificial parecen prometedoras, ya que pueden proporcionar un mayor nivel de abstracción a los robots, lo que permite la toma de decisiones más generales. Particularmente, dentro de estas técnicas, el paradigma de aprendizaje por refuerzos se ha destacado en la resolución de los tipos más diversos de problemas, al proporcionar una solución no supervisada y sin requerir un modelo. Además, los desarrollos recientes en el campo del aprendizaje por refuerzos profundo han permitido el uso de redes neuronales profundas como aproximadores de función de la política, aumentando el rendimiento de generalización. En esta tesis, el autor estudia las capacidades del paradigma de aprendizaje por refuerzo para el control de bajo nivel en tiempo real de robots móviles. Haciendo uso de las técnicas de control clásicas existentes y el aprendizaje por refuerzo, se obtienen controladores híbridos que toman lo mejor de ambos mundos, mejorando el rendimiento general y en consecuencia, logrando controladores adaptivos. Los amplios resultados en simulación y en diferentes plataformas robóticas muestran la prometedora aplicabilidad de estos controladores adaptivos inteligentes para robots autónomos.Fil: Carlucho, Ignacio. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ingeniería; Argentina.Fil: Acosta, Gerardo G. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ingeniería; Argentina.Fil: De Paula, Mariano. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ingeniería; Argentina

    An adaptive deep reinforcement learning approach for MIMO PID control of mobile robots

    No full text
    Intelligent control systems are being developed for the control of plants with complex dynamics. However, the simplicity of the PID (proportional–integrative–derivative) controller makes it still widely used in industrial applications and robotics. This paper proposes an intelligent control system based on a deep reinforcement learning approach for self-adaptive multiple PID controllers for mobile robots. The proposed hybrid control strategy uses an actor–critic structure and it only receives low-level dynamic information as input and simultaneously estimates the multiple parameters or gains of the PID controllers. The proposed approach was tested in several simulated environments and in a real time robotic platform showing the feasibility of the approach for the low-level control of mobile robots. From the simulation and experimental results, our proposed approach demonstrated that it can be of aid by providing with behavior that can compensate or even adapt to changes in the uncertain environments providing a model free unsupervised solution. Also, a comparative study against other adaptive methods for multiple PIDs tuning is presented, showing a successful performance of the approach.Fil: Carlucho, Ignacio. Universidad Nacional del Centro de la Provincia de Buenos Aires. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Provincia de Buenos Aires. Gobernación. Comisión de Investigaciones Científicas. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; ArgentinaFil: de Paula, Mariano. Universidad Nacional del Centro de la Provincia de Buenos Aires. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Provincia de Buenos Aires. Gobernación. Comisión de Investigaciones Científicas. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; ArgentinaFil: Acosta, Gerardo Gabriel. Universidad Nacional del Centro de la Provincia de Buenos Aires. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Provincia de Buenos Aires. Gobernación. Comisión de Investigaciones Científicas. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; Argentin

    Deep reinforcement learning approach for MPPT control of partially shaded PV systems in Smart Grids

    Full text link
    Photovoltaic systems (PV) are having an increased importance in modern smart grids systems. Usually, in order to maximize the energy output of the PV arrays a maximum power point tracking (MPPT) algorithm is used. However, once deployed, weather conditions such as clouds can cause shades in the PV arrays affecting the dynamics of each panel differently. These conditions directly affect the available energy output of the arrays and in turn make the MPPT task extremely difficult. For these reasons, under partial shading conditions, it is necessary to have algorithms that are able to learn and adapt online to the changing state of the system. In this work we propose the use of deep reinforcement learning (DRL) techniques to address the MPPT problem of a PV array under partial shading conditions. We develop a model free RL algorithm to maximize the efficiency in MPPT control. The agent's policy is parameterized by neural networks, which take the sensory information as input and directly output the control signal. Furthermore, a PV environment under shading conditions was developed in the open source OpenAI Gym platform and is made available in an open repository. Several tests are performed, using the developed simulated environment, to test the robustness of the proposed control strategies to different climate conditions. The obtained results show the feasibility of our proposal with a successful performance with fast responses and stable behaviors. The best results for the presented methodology show that the maximum operating power point achieved has a deviation less than 1% compared to the theoretical maximum power point.Fil: Avila, Luis Omar. Universidad Nacional de San Luis. Facultad de Ciencias Físico Matemáticas y Naturales. Departamento de Informática. Laboratorio Investigación y Desarrollo en Inteligencia Computacional; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: de Paula, Mariano. Universidad Nacional del Centro de la Provincia de Buenos Aires. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Provincia de Buenos Aires. Gobernación. Comisión de Investigaciones Científicas. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; ArgentinaFil: Trimboli, Maximiliano Daniel. Universidad Nacional de San Luis. Facultad de Ingeniería y Ciencias Agropecuarias. Laboratorio de Control Automático; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Carlucho, Ignacio. State University of Louisiana; Estados Unidos. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentin

    MPPT for PV systems using deep reinforcement learning algorithms

    No full text
    This work proposes the use of reinforcement learning (RL) techniques with deep-learning models to address the maximum power point tracking (MPPT) control problem of a photovoltaic (PV) array. We implemented the deep deterministic policy gradient (DDPG) method, the inverted gradient (IGDDPG) method and the delayed twins (TD3) method to solve the MPPT control problem. Several simulation experiments were performed in the OpenAI Gym platform aiming to evaluate the performance of the proposed control strategies, under different operating conditions in terms of temperature and solar irradiance. The obtained results show that the use of deep reinforcement learning (DRL) achieves a successful performance for the MPPT control problem with a fast response and a stable behavior. Moreover, the algorithms do not require any previous knowledge about the dynamic behavior of the photovoltaic array.Fil: Avila, Luis Omar. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - San Luis; Argentina. Universidad Nacional de San Luis. Facultad de Ciencias Físico Matemáticas y Naturales. Departamento de Informática. Laboratorio Investigación y Desarrollo en Inteligencia Computacional; ArgentinaFil: de Paula, Mariano. Universidad Nacional del Centro de la Provincia de Buenos Aires. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Provincia de Buenos Aires. Gobernación. Comisión de Investigaciones Científicas. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; ArgentinaFil: Carlucho, Ignacio. Universidad Nacional del Centro de la Provincia de Buenos Aires. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Provincia de Buenos Aires. Gobernación. Comisión de Investigaciones Científicas. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; ArgentinaFil: Sánchez Reinoso, Carlos Roberto. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Catamarca. Facultad de Tecnología y Ciencias Aplicadas; Argentin

    Double Q-PID algorithm for mobile robot control

    No full text
    Many expert systems have been developed for self-adaptive PID controllers of mobile robots. However, the high computational requirements of the expert systems layers, developed for the tuning of the PID controllers, still require previous expert knowledge and high efficiency in algorithmic and software execution for real-time applications. To address these problems, in this paper we propose an expert agent-based system, based on a reinforcement learning agent, for self-adapting multiple low-level PID controllers in mobile robots. For the formulation of the artificial expert agent, we develop an incremental model-free algorithm version of the double Q-Learning algorithm for fast on-line adaptation of multiple low-level PID controllers. Fast learning and high on-line adaptability of the artificial expert agent is achieved by means of a proposed incremental active-learning exploration-exploitation procedure, for a non-uniform state space exploration, along with an experience replay mechanism for multiple value functions updates in the double Q-learning algorithm. A comprehensive comparative simulation study and experiments in a real mobile robot demonstrate the high performance of the proposed algorithm for a real-time simultaneous tuning of multiple adaptive low-level PID controllers of mobile robots in real world conditions.Fil: Carlucho, Ignacio. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ingeniería Olavarría. Departamento de Electromecánica. Grupo INTELYMEC; Argentina. Universidad Nacional del Centro de la Provincia de Buenos Aires. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Provincia de Buenos Aires. Gobernación. Comisión de Investigaciones Científicas. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; ArgentinaFil: de Paula, Mariano. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ingeniería Olavarría. Departamento de Electromecánica. Grupo INTELYMEC; Argentina. Universidad Nacional del Centro de la Provincia de Buenos Aires. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Provincia de Buenos Aires. Gobernación. Comisión de Investigaciones Científicas. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; ArgentinaFil: Acosta, Gerardo Gabriel. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ingeniería Olavarría. Departamento de Electromecánica. Grupo INTELYMEC; Argentina. Universidad Nacional del Centro de la Provincia de Buenos Aires. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires. - Provincia de Buenos Aires. Gobernación. Comisión de Investigaciones Científicas. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; Argentin

    Paco Ignacio Taibo II.

    No full text
    Encyclopaedia entry on contemporary Mexican author Paco Ignacio Taibo II

    Jerónimo Nadal (1507-1580) und der "verschriftlichte" Ignatius. Die Konstruktion einer individuellen und kollektiven Identität

    Full text link
    Libro de InvestigaciónNiemand ist mehr verantwortlich für die Entstehung jenes Denksystems, das auf Ignatius von Loyola (1491-1556) und seinen Exerzitien basiert, als Jerónimo Nadal. Ignacio Ramos legt in seiner Studie Jerónimo Nadal (1507-1580) und der verschriftlichte Ignatius: Die Konstruktion einer individuellen und kollektiven Identität die ursprünglichen Konturen der sogenannten ignatianischen Spiritualität dar. Es wird deutlich, wieviel Einfluss Nadal auf die Herausbildung des Ignatianischen hatte. Anhand Nadals lange verkannten Selbstzeugnisses (Chronicon Natalis) wird hermeneutisch herausgearbeitet, wie der gequälte Reifeprozess von Nadal originales Denken erzeugte insbesondere in Bezug auf Ignatius. An diese europäische Schlüsselgestalt des jungen Jesuitenordens heranzutreten, gewährt einen existentiell vermittelten Einblick in manche der gesellschaftlichen und philosophischen Spannungen (converso-Frage, Rolle der Vermittlungen...) z. Zt. des Humanismus und der großen Reformen.Jerónimo Nadal plays a key role in the creation of the tradition of thought based on the person of Ignatius of Loyola (1491-1556) and his Spiritual Exercises. Ignacio Ramos book Jerónimo Nadal (1507-1580) und der verschriftlichte Ignatius unveils the large percentage of too often overlooked Nadalian moments in the origins of Ignatian Spirituality. Leaning on Nadal s autobiographical account ( Chronicon Natalis, fully translated) the author deploys a hermeneutical method to show how Nadal´s stressful maturation process became a source of original thought, especially regarding Ignatius. The reader will gain an existentially mediated insight into some of the social and philosophical hot spots (converso question, role of mediations...) of Humanism and the reformation era.info:eu-repo/semantics/publishedVersio

    Ignacio Ribera's Tree of Life

    No full text
    Supplementary Data with phylogenetic trees built with the COI sequences from Coleoptera that were uploaded to GenBank by studies including Ignacio Ribera as author. Those trees also include sequences from other studies to highlight the impressive work done Ignacio Ribera to contribute to the Coleoptera Tree of Life. This upload also includes the python scripts written to parse GenBank entries and the files to upload in iTOL webpage to highlight on trees the samples coming from Ignacio’s studies. Finally, we also include the 17,499 entries for nucleotide sequences deposited from Ignacio’s articles

    La "marcha" de San Ignacio

    No full text
    En un artículo anterior se mencionaba que el texto de la "Marcha" de San Ignacio se iba a transcribir con la puntuación de los signos rítmicos, sien embargo en el texto no aparecieron. Se transcribe la letra con la puntuaciónIn a previous article mention was made to the fact that the lyrics of the "March" of San Ignacio was going to be transcribed with the punctuation of the rhythmic signs, however, such signs did not appear in the text. The author transcribes the lyrics with the punctuatio

    Why (not) national party systems?

    No full text
    [Electronic resource] / Ignacio Lago. 26 p. : ill. Available through the CEACS Web site (http://www.march.es) Includes bibliographical references (p.20-22)
    corecore