1,721,131 research outputs found
Bioinspired navigation and planning in large indoor environments with a mobile robot
Cette thèse s’inscrit dans le domaine de la navigation robotique bio-inspirée en environnement réel et implique la capacité pour un robot mobile à se déplacer de manière autonome dans un monde a priori dynamique et inconnu. Les travaux décrits au cours de ce manuscrit s’attacheront à montrer comment, en partant des travaux académiques réalisés par l’équipe Neurocybernétique du laboratoire ETIS, il a été possible de concevoir le robot mobile Diya One capable de naviguer de manière autonome dans de grands environnements intérieurs. Depuis une vingtaine d’année, l’équipe Neurocybernétique élabore des modèles de navigation bio-inspirée. De précédents travaux ont montré qu’un modèle de cellules de lieu, enregistrées chez le rat, permet à un robot mobile d’apprendre des comportements de navigation robustes, tels qu’une ronde ou un retour au nid, à partir d’associations entre lieu et action. L’apprentissage et la reconnaissance d’un lieu ne reposent alors que sur des informations visuelles. Cependant, trois problèmes critiques ne permettent pas de naviguer dans de grands environnements : 1- l’ambiguïté de certaines situations visuelles (ou alias perceptif), 2- l’apprentissage sur le long terme et 3- la sensibilité aux conditions environnementales. L’ajout d’autres modalités constitue une solution efficace pour augmenter la robustesse de la localisation. L’équipe a développé plusieurs modèles basés sur la proprioception du robot afin desuppléer, dans les cas limites, les modèles purement visuels. La principale limitation des approches proprioceptives est qu’elles sont soumisesà l’accumulation d’erreurs. Il est donc nécessaire de recalibrer périodiquement les modèles. Fusionner des modalités allothétiques et idiothétiques semblent être une bonne stratégie pour obtenir une estimation fiable de la localisation du robot. Les champs de neurones dynamiques (DNF) ou continous attractor neural network (CANN) constituent un puissant candidat pour mettre en œuvre le type de mémoire requis pour la construction de cellules de lieu. Nous présenterons un premier modèle de fusion utilisant les champs de neurones dynamiques pour maintenir l’orientation du robot puis un second généralisant le principe du modèle de fusion pour la construction de cellules de lieux multimodales.Être capable de produire et commercialiser rapidement un produit est un enjeu majeur pour la survie de Partnering. En plus des capacités de navigation et de localisation, un robot commercialisable requiert un ensemble de comportements indispensables à la mobilité, à la sécurité (loi de contrôle, évitement des obstacles et des trous) et à son autonomie (gestion d’énergie et retour à la station de recharge). Pour aboutir à cette première solution, nous avons suivit une démarche ascendante (bottom-up) défendue par la robotique comportementale. Nous avons développé progressivement la complexité du robot au travers de comportements élémentaires intégrés dans une architecture de contrôle régissant à chaque instant l’expression de ces comportements et la sélection des actions à exécuter.Ce mémoire est découpée en deux parties. Une première partie industrielle relevant d’objectifs à court terme, consistant à mettre en place, à partir des modèles existants développés par l’équipe Neurocybernétique, l’architecture comportementale de la première version du robot Diya One. Puis, une seconde partie plus fondamentale dans laquelle nous traiterons de la réalisation demodèles de fusion multimodale. Ces modèles seront ajoutés incrémentalement au robot afin d’améliorer progressivement ses capacités de navigation.This thesis falls into the field of navigation in bio-inspired robotics in real environment and implies the ability for a mobile robot to move autonomously in a world a priori dynamic and unknown. The work described in this manuscript will show how, starting from the academic work carried out by the Neurocybernetics team of the ETIS laboratory, it was possible to design the mobile robot Diya One able to navigate autonomously in large indoor environments. For the past 20 years, the Neurocybernetics team has been developing bio-inspired navigation models. Previous work has shown that a model of place cells, recorded in the rat, allows a mobile robot to learn robust navigation behaviors, such as a round or a homing, from associations between place and action. Learning and the recognition of a place are based only on visual information. However, three critical problems do not allow to navigate in large environments: 1- the ambiguity of certain visual situations (or perceptual alia), 2- long-term learning, and 3-sensitivity to environmental conditions. The addition of other modalities is an effective solution for increasing the robustness of the location. The team has developed several models based on the proprioception of the robot in order to compensate, in limiting cases, for purely visual models. The main limitation of proprioceptive approaches is that, based on the proprioception of the robot, they are subject to the accumulation of errors. It is therefore necessary to periodically recalibrate the models. Merging allothetic and idiothetic modalities seems to be a good strategy for obtaining a reliable estimate of the robot’s location. Dynamic neural network (DNF) or continous attractor neural network (CANN) constitute a powerful candidate to implement the type of memory required for the construction of place cells. We present a first fusion model using dynamic neuron fields to maintain the orientation of the robot and then a second one generalizing the principle of fusion model for the construction of cells of multimodal places. Being able to produce and market quickly a product is a major challenge for Partnering’s survival. In addition to navigation and location capabilities, a marketable robot requires a set of behaviors that are essential to mobility, security (control law, avoidance of obstacles and holes) and its autonomy (energy management and return to the charging station). To arrive at this first solution, we followed a bottom-up approach defended by behavioral robotics. We have progressively developed the complexity of the robot through elementary behaviors integratedin a control architecture governing at each moment the expression of these behaviors and the selection of the actions to be executed. This manuscript is divided into two parts. A first industrial part with short-term objectives, consisting of implementing the behavioral architecture of the first version of the Diya One robot, based on the existing models developed by the Neurocybernetics team. Then, a second more theoretical part in which we will deal with the realization of multimodal fusion models. These models will be added incrementally to the robot in order to gradually improve its navigationcapabilities
Toward a plausible model of action selection for a mobile robot
Cette thèse étudie les mécanismes de sélection de l'action et de choix de stratégie tels qu'ils apparaissent à travers des expériences animales et des enregistrements neurobiologiques. Nous proposons ensuite des modèles biologiquement plausibles de la sélection de l'action. L'objectif est de mieux comprendre le fonctionnement du cerveau chez les êtres vivants et de pouvoir endéduire des architectures de contrôle bio-inspirées, plus robustes et adaptées à l'environnement. Les modèles étudiés sont réalisés avec des réseaux de neurones artificiels, permettant de modéliser des régions cérébrales et ainsi pouvoir simuler le fonctionnement du cerveau, ce qui permet de tester nos hypothèses sur des robots et des agents virtuels.L'étude de la sélection de l'action pour des robots mobiles implique plusieurs approches. La sélection de l'action peut être étudiée du point de vue du choix entre plusieurs actions basiques, e.g. un choix binaire aller à gauche ou à droite. Ceci passe forcément par l'acquisition et la catégorisation d'instants et d'événements spéciaux, perçus ou effectués, qui représentent des contextes dans lesquels la perception change, le comportement est modifié ou bien la sélection est réalisée. Ainsi, la thèse traite aussi de l'acquisition, la catégorisation et l'encodage de ces événements importants dans la sélection del'action.Enfin, on s'intéressera à la sélection de l'action du point de vue de la sélection de stratégie. Les différents comportements peuvent être dirigés consciemment ou bien être des automatismes acquis avec l'habitude. Le but ici est d'explorer différentes approches pour que le robot puisse développer ces deux capacités, mais aussi d'étudier les interactions entre ces types de mécanismes dans la cadre de tâches de navigation.Les travaux de cette thèse se basent sur la modélisation du fonctionnement de différentes boucles hippocampo-cortico-basales impliquées dans des tâches de navigation, de sélection de l'action et de catégorisations multimodales. En particulier, nous avons un modèle de l'hippocampe permettant d'apprendre des associations spatio-temporelles et des conditionnements multimodaux entre des événements perceptifs. Il se base sur des associations sensorimotrices entre des cellules appelées cellules de lieu qui sont associées avec des actions pour définir des comportements cohérents. Le modèle fait aussi intervenir des cellules de transition hippocampiques, permettant de faire des prédictions temporelles sur les événements futurs. Celles-ci permettent l'apprentissagede séquences spatio-temporelles, notamment du fait qu'elles représentent le substrat neuronal à l'apprentissage d'une carte cognitive, située elle au niveau du cortex préfrontal et/ou pariétal.Ce type de carte permet de planifier des chemins à suivre en fonction des motivations du robot, ce qui permet de rejoindre différents buts précédemment découverts dans l'environnement.This thesis aims at studying the different mechanisms involved in action selection and decision making processes, according to animal experiments and neurobiological recordings. For that matter, we propose several biologically plausible models for action selection. The goal is to achieve a better understanding of the animal's brain functions. This gives us the opportunity todevelop bioinspired control architectures for robots that are more robust and adaptative to a real environement. These models are based on Artificial Neural Networks, allowing us to test our hypotheses on simulations of different brain regions and function, implemented on robots and virtual agents.Action selection for mobile robots can be approached from different angles. This process can be seen as the selection between two possibilities, e.g. go left or go right. Those mechanisms involve the ability to learn and categorize specific events, encoding contexts where a change in the perception is perceived, a change in the behavior is noticed or the decision is made. There-fore, this thesis studies those capacities of acquisition, categorisation and coding of different events that can be relevant for action selection.We also, approach the action selection as a strategy selection. The different behaviors are guided consciously or through automated behavior learned as habits. We investigate different possibilities allowing a robot to develop those capacities. Also, we aim at studying interactions that can emerge between those mechanisms during navigational behaviors.The work presented in this these is based on the modelisation of the hippocampo-cotico-basal loops involved in the navigational behaviors, the action selection and the multimodal categorisation of events. We base our models on a previous model of the hippocampus for the learning of spatio-temporal associations and for multimodal conditionning of perceptive events. It is based on sensorimotor associations between place cells and actions to achieve navigational behaviors. The model involves also a specific type of hippocampic cells, named transition cells, for temporal prediction of future events. This capacity allows the model to learn spatio-temporal sequences, and it represents the neural substrate for the learning of a cognitive map, hypothesised to be localized in prefrontal and/or parietal areas. This kind of topological map allows to plan the behavior of the robot according to its motivations, which is used in goal orientedexperiments to achieve goals and capture rewards
Human Action Recognition in Videos with Shallow and Deep Learning
Ces dernières années, la reconnaissance d’action humaine (HAR) a attiré l’attention de la recherche grâce à ses diverses applications telles que les systèmes de surveillance intelligents, l’indexation vidéo, l’analyse des activités humaines, les interactions homme-machine, et ainsi de suite. Les problèmes typiques que les chercheurs envisagent sont la complexité des mouvements humains, les variations spatio-temporelles, l'encombrement, l'occlusion et le changement des conditions d'éclairage. Cette thèse porte sur la reconnaissance automatique des actions humaines en cours dans une vidéo. Nous abordons ce problème de recherche en utilisant à la fois des approches d'apprentissage traditionnel peu profond et d'apprentissage profond.Premièrement, nous avons commencé les travaux de recherche avec des méthodes d’apprentissage traditionnelles peu profondes, fondées sur des caractéristiques créées manuellement, en introduisant un nouveau fonctionnalité appelée descripteur MOMP (Motion of Oriented Magnitudes Patterns). Nous avons ensuite intégré ce descripteur discriminant aux techniques de représentation simples mais puissantes telles que le sac de mots visuels, le vecteur de descripteurs agrégés localement (VLAD) et le vecteur de Fisher pour mieux représenter les actions. En suite l'PCA (Principal Component Analysis) et la sélection des caractéristiques (la dépendance statistique, l'information mutuelle) sont appliquées pour rechercher le meilleur sous-ensemble des caractéristiques afin d'améliorer les performances et de réduire les coûts de calcul. La méthode proposée a permis d'obtenir les résultats d'état de l'art sur plusieurs bases de données communes.Les approches d'apprentissage profond récentes nécessitent des calculs intensifs et une utilisation importante de la mémoire. Ils sont donc difficiles à utiliser et à déployer sur des systèmes aux ressources limitées. Dans la deuxième partie de cette thèse, nous présentons un nouvel algorithme efficace pour compresser les modèles de réseau de neurones convolutionnels afin de réduire à la fois le coût de calcul et l’empreinte mémoire au moment de l’exécution. Nous mesurons la redondance des paramètres en fonction de leurs relations à l'aide des critères basés sur la théorie de l'information, puis nous éliminons les moins importants. La méthode proposée réduit considérablement la taille des modèles de différents réseaux tels qu'AlexNet, ResNet jusqu'à 70% sans perte de performance pour la tâche de classification des images à grande échelle.L'approche traditionnelle avec le descripteur proposé a permis d'obtenir d'excellentes performances pour la reconnaissance de l'action humaine mais seulement sur de petits bases de données. Afin d'améliorer les performances de la reconnaissance sur les bases de données de grande échelle, dans la dernière partie de cette thèse, nous exploitons des techniques d'apprentissage profond pour classifier les actions. Nous introduisons les concepts de l'image MOMP en tant que couche d'entrée de CNN et incorporons l'image MOMP dans des réseaux de neurones profonds. Nous appliquons ensuite notre algorithme de compression réseau pour accélérer et améliorer les performances du système. La méthode proposée réduit la taille du modèle, diminue le sur-apprentissage et augmente ainsi la performance globale de CNN sur les bases de données d'action à grande échelle.Tout au long de la thèse, nous avons montré que nos algorithmes obtenaient de bonnes performances sur bases de données d'action complexes (Weizmann, KTH, UCF Sports, UCF-101 et HMDB51) avec des ressources limitées.In recent years, human action recognition (HAR) has attracted the research attention thanks to its various applications such as intelligent surveillance systems, video indexing, human activities analysis, human-computer interactions and so on. The typical issues that the researchers are envisaging can be listed as the complexity of human motions, the spatial and temporal variations, cluttering, occlusion and change of lighting condition. This thesis focuses on automatic recognizing of the ongoing human actions in a given video. We address this research problem by using both shallow learning and deep learning approaches.First, we began the research work with traditional shallow learning approaches based on hand-scrafted features by introducing a novel feature named Motion of Oriented Magnitudes Patterns (MOMP) descriptor. We then incorporated this discriminative descriptor into simple yet powerful representation techniques such as Bag of Visual Words, Vector of locally aggregated descriptors (VLAD) and Fisher Vector to better represent actions. Also, PCA (Principal Component Analysis) and feature selection (statistical dependency, mutual information) are applied to find out the best subset of features in order to improve the performance and decrease the computational expense. The proposed method obtained the state-of-the-art results on several common benchmarks.Recent deep learning approaches require an intensive computations and large memory usage. They are therefore difficult to be used and deployed on the systems with limited resources. In the second part of this thesis, we present a novel efficient algorithm to compress Convolutional Neural Network models in order to decrease both the computational cost and the run-time memory footprint. We measure the redundancy of parameters based on their relationship using the information theory based criteria, and we then prune the less important ones. The proposed method significantly reduces the model sizes of different networks such as AlexNet, ResNet up to 70% without performance loss on the large-scale image classification task.Traditional approach with the proposed descriptor achieved the great performance for human action recognition but only on small datasets. In order to improve the performance on the large-scale datasets, in the last part of this thesis, we therefore exploit deep learning techniques to classify actions. We introduce the concepts of MOMP Image as an input layer of CNNs as well as incorporate MOMP image into deep neural networks. We then apply our network compression algorithm to accelerate and improve the performance of system. The proposed method reduces the model size, decreases the over-fitting, and thus increases the overall performance of CNN on the large-scale action datasets.Throughout the thesis, we have showed that our algorithms obtain good performance in comparison to the state-of-the-art on challenging action datasets (Weizmann, KTH, UCF Sports, UCF-101 and HMDB51) with low resource required
Going Beyond Counting First Authors in Author Co-citation Analysis
The present study examines one of the fundamental aspects of author co-citation analysis (ACA) - the way co-citation
counts are defined. Co-citation counting provides the data on which all subsequent statistical analyses and mappings
are based, and we compare ACA results based on two different types of co-citation counting - the traditional type that
only counts the first one among a cited work's authors on the one hand and a non-traditional type that takes into
account the first 5 authors of a cited work on the other hand. Results indicate that the picture produced through this non-traditional author co-citation counting contains more coherent author groups and is therefore considerably clearer. However, this picture represents fewer specialties in the research field being studied than that produced through the traditional first-author co-citation counting when the same number of top-ranked authors is selected and analyzed. Reasons for these effects are discussed
Variations on the Author
“Variations on the Author” discusses two of Eduardo Coutinho’s recent films (Um Dia na Vida, from 2010, and Últimas Conversas, posthumously released in 2015) and their contribution to the general question of documentary authorship. The director’s filmography is characterized by a consistent yet self-effacing form of authorial self-inscription: Coutinho often features as an interviewer that rather than express opinions propels discourses; an interviewer that is good at listening. This mode of self-inscription characterizes him as an author who is not expressive but who is nonetheless markedly present on the screen. In Um Dia na Vida, however, Coutinho is completely absent form the image, while Últimas Conversas, on the contrary, includes a confessional prologue that moves the director from the margins to the center of his films. This article examines the ways in which these works stand out in the filmography of a director who offers new insights into the notion of cinematic authorship
Appropriate Similarity Measures for Author Cocitation Analysis
We provide a number of new insights into the methodological discussion about author cocitation analysis. We first argue that the use of the Pearson correlation for measuring the similarity between authors’ cocitation profiles is not very satisfactory. We then discuss what kind of similarity measures may be used as an alternative to the Pearson correlation. We consider three similarity measures in particular. One is the well-known cosine. The other two similarity measures have not been used before in the bibliometric literature. Finally, we show by means of an example that our findings have a high practical relevance.information science;Pearson correlation;cosine;similarity measure;author cocitation analysis
Dispelling the Myths Behind First-author Citation Counts
We conducted a full-scale evaluative citation analysis study of scholars in the XML research field to explore just how different from each other author rankings resulting from different citation counting methods actually are, and to demonstrate the capability of emerging data and tools on the Web in supporting more realistic citation counting methods. Our results contest some common arguments for the continued
use of first-author citation counts in the evaluation of scholars, such as high correlations between author rankings by first-author citation counts and other citation
counting methods, and high costs of using more realistic citation counting methods that are not well-supported by the ISI databases. It is argued that increasingly available digital full text research papers make it possible for citation analysis studies to go beyond what the ISI databases have directly supported and to employ more
sophisticated methods
Relationship between structure, dynamics and function in neural networks
International audienc
- …
