Et si on montrait aux robots comment conduire une voiture ?

Les chercheurs ont conçu un système qui permet aux robots d’apprendre de manière autonome des tâches complexes à partir d’un très petit nombre de démonstrations, même imparfaites. Alors que les méthodes de pointe actuelles nécessitent au moins 100 démonstrations pour clouer une tâche spécifique, cette nouvelle méthode permet aux robots d’apprendre à partir d’une poignée de démonstrations seulement.

Des robots qui apprennent des démonstrations qui leurs sont faites

Imaginez si les robots pouvaient apprendre en regardant des démonstrations: vous pourriez montrer à un robot domestique comment faire des tâches de routine ou dresser une table. Sur le lieu de travail, vous pouvez former des robots comme de nouveaux employés, en leur montrant comment effectuer de nombreuses tâches. Sur la route, votre voiture autonome pourrait apprendre à conduire en toute sécurité en vous regardant conduire dans votre quartier.

Faisant progresser cette vision, les chercheurs de l’USC ont conçu un système qui permet aux robots d’apprendre de manière autonome des tâches complexes à partir d’un très petit nombre de démonstrations, même imparfaites. Le document, intitulé Learning from Demonstrations Using Signal Temporal Logic, a été présenté à la Conférence sur l’apprentissage robotique (CoRL), le 18 novembre.

Le système des chercheurs fonctionne en évaluant la qualité de chaque démonstration, afin qu’il apprenne des erreurs qu’il constate, ainsi que des réussites. Alors que les méthodes de pointe actuelles nécessitent au moins 100 démonstrations pour clouer une tâche spécifique, cette nouvelle méthode permet aux robots d’apprendre à partir d’une poignée de manifestations. Cela permet également aux robots d’apprendre de manière plus intuitive, la façon dont les humains apprennent les uns des autres – vous regardez quelqu’un exécuter une tâche, même imparfaitement, puis essayez vous-même. Cela n’a pas à être une démonstration «parfaite» pour que les humains glanent des connaissances en se regardant les uns les autres.

«De nombreux systèmes d’apprentissage automatique et d’apprentissage par renforcement nécessitent de grandes quantités de données et des centaines de démonstrations – vous avez besoin d’un humain pour faire des démonstrations maintes et maintes fois, ce qui n’est pas faisable», a déclaré l’auteur principal Aniruddh Puranic, un Ph.D. étudiant en informatique à l’USC Viterbi School of Engineering.

«De plus, la plupart des gens n’ont pas de connaissances en programmation pour indiquer explicitement ce que le robot doit faire, et un humain ne peut pas démontrer tout ce qu’un robot a besoin de savoir. Et si le robot rencontre quelque chose qu’il n’a pas vu auparavant? un défi majeur. « 

Apprendre des démonstrations

L’apprentissage des démonstrations devient de plus en plus populaire pour obtenir un contrôle efficace du robot politiques – qui contrôlent les mouvements du robot – pour des tâches complexes. Mais il est sensible aux imperfections dans les démonstrations et soulève également des problèmes de sécurité car les robots peuvent apprendre des actions dangereuses ou indésirables.

De plus, toutes les démonstrations ne se valent pas: certaines démonstrations sont un meilleur indicateur du comportement souhaité que d’autres et la qualité des démonstrations dépend souvent de l’expertise de l’utilisateur qui fournit les démonstrations.

Pour résoudre ces problèmes, les chercheurs ont intégré la «logique temporelle du signal» ou STL pour évaluer la qualité des démonstrations et les classer automatiquement pour créer des récompenses inhérentes.

En d’autres termes, même si certaines parties des démonstrations n’ont aucun sens en fonction des exigences logiques, en utilisant cette méthode, le robot peut toujours apprendre des parties imparfaites. D’une certaine manière, le système arrive à sa propre conclusion sur l’exactitude ou le succès d’une démonstration.

«Disons que les robots apprennent de différents types de démonstrations – cela pourrait être une démonstration, vidéos ou simulations – si je fais quelque chose de très dangereux, les approches standard feront l’une des deux choses suivantes: soit, elles l’ignoreront complètement, ou pire encore, le robot apprendra la mauvaise chose », a déclaré le co- auteur Stefanos Nikolaidis, professeur adjoint d’informatique à l’USC Viterbi.

« En revanche, de manière très intelligente, ce travail utilise un raisonnement de bon sens sous forme de logique pour comprendre quelles parties de la démonstration sont bonnes et quelles parties ne le sont pas. En substance, c’est exactement ce que font aussi les humains. »

Prenons, par exemple, une démonstration de conduite où quelqu’un saute un panneau d’arrêt. Cela serait classé plus bas par le système qu’une démonstration d’un bon conducteur. Mais, si au cours de cette démonstration, le conducteur fait quelque chose d’intelligent – par exemple, applique ses freins pour éviter une collision – le robot apprendra toujours de cette action intelligente.

S’adapter aux préférences humaines

La logique temporelle du signal est un langage symbolique mathématique expressif qui permet un raisonnement robotique sur les résultats actuels et futurs. Alors que les recherches précédentes dans ce domaine ont utilisé la «logique temporelle linéaire», la STL est préférable dans ce cas, a déclaré Jyo Deshmukh, ancien ingénieur de Toyota et professeur adjoint d’informatique à l’USC Viterbi.

«Lorsque nous entrons dans le monde des systèmes cyber-physiques, comme les robots et les voitures autonomes, où le temps est crucial, la logique temporelle linéaire devient un peu lourde, car elle raisonne sur des séquences de valeurs vraies / fausses pour les variables, tandis que STL permet le raisonnement sur les signaux physiques. « 

Puranic, qui est conseillé par Deshmukh, a eu l’idée après avoir suivi un cours de robotique pratique avec Nikolaidis, qui a travaillé sur le développement de robots pour apprendre des vidéos YouTube. Le trio a décidé de le tester. Tous les trois se sont dits surpris par l’ampleur du succès du système et les professeurs remercient Puranic pour son travail acharné.

« Par rapport à un algorithme de pointe, largement utilisé dans de nombreuses applications robotiques, vous voyez une différence d’ordre de grandeur dans le nombre de démonstrations nécessaires », a déclaré Nikolaidis.

Le système a été testé à l’aide d’un simulateur de jeu de style Minecraft, mais les chercheurs ont déclaré que le système pourrait également apprendre des simulateurs de conduite et même des vidéos. Ensuite, les chercheurs espèrent l’essayer sur de vrais robots. Ils ont dit que cette approche est bien adaptée pour les applications où les cartes sont connues à l’avance mais où il y a des obstacles dynamiques sur la carte: des robots dans les environnements domestiques, des entrepôts ou même des rovers d’exploration spatiale.

« Si nous voulons que les robots soient de bons coéquipiers et aident les gens, ils doivent d’abord apprendre et s’adapter très efficacement aux préférences humaines », a déclaré Nikolaidis. « Notre méthode fournit cela. »

« Je suis ravi d’intégrer cette approche dans les systèmes robotiques pour les aider à apprendre efficacement des démonstrations, mais aussi à aider efficacement les coéquipiers humains dans une tâche collaborative. »

SEO AGENCE est une agence digitale à Lille.

Google s’achète Fitbit, et en sait encore un peu plus sur vous

L’achat de Fitbit par Google, d’une valeur de 2,1 milliards de dollars, montre que le géant de la recherche cherche à pénétrer plus profondément dans nos vies, lui donnant ainsi accès à certaines de nos informations médicales les plus personnelles. Si les efforts antérieurs de l’entreprise en matière de soins de santé en sont une indication, les propriétaires de Fitbit pourraient vouloir déterminer où ces informations pourraient aboutir.

Au cours des trois dernières années, les expériences de Google en matière d’utilisation de l’intelligence artificielle et de données médicales ont abouti à des plaintes et à des poursuites judiciaires, car les détracteurs affirment que la vie privée des patients n’était pas protégée. Dans un cas, Google a reçu des informations identifiables sur le patient, notamment des notes des médecins et des horodatages.

Google n’a pas répondu à une demande de commentaire.

L’action de Google dans le domaine de la santé intervient alors que les législateurs et les consommateurs expriment de plus en plus d’inquiétudes quant à la quantité d’informations personnelles que les grandes entreprises collectent sur les utilisateurs, dont une grande partie est utilisée pour cibler les annonces. Vendredi, quand il a dévoilé le contrat, Google a promis que les données de santé et de bien-être de Fitbit ne sera pas utilisé pour son activité publicitaire massive.

Néanmoins, les analystes estiment que la relation de Google avec Fitbit, le compteur de pas le plus populaire sur le marché, pourrait être encore plus envahissante. Les données sur la santé pourraient être prises en compte dans d’autres projets. Par exemple, il pourrait être utilisé pour des applications médicales ou renforcer les relations de la société avec les prestataires d’assurance maladie, a déclaré Carolina Milanesi, analyste chez Creative Strategies.

« Les données ne doivent pas nécessairement servir à la publicité », a-t-elle déclaré. « En matière de santé, il y a énormément d’argent à gagner sur les services. » Cela pourrait inclure des liens d’assurance maladie ou des applications médicales plus larges, a déclaré Milanesi. Par exemple, l’entreprise pourrait suivre l’exemple d’Apple. Le fabricant d’iPhone a conclu un accord avec la compagnie d’assurance Aetna qui permettrait aux gens de gagner des points pour subventionner le coût d’une Apple Watch.

Google a tenté de minimiser les inquiétudes, affirmant que Fitbit ferait partie de son entreprise grandissante d’appareils grand public, qui comprend son téléphone phare Pixel 4, son haut-parleur intelligent Mini Mini et le maillage Wi-Fi. routeur.

Le géant de la recherche savait également que les questions de protection de la vie privée seraient une priorité et essayait de calmer les inquiétudes. « Semblables à nos autres produits, avec les dispositifs portables, nous allons faire preuve de transparence concernant les données que nous collectons et pourquoi », a déclaré Rick Osterloh, chef du matériel informatique de Google, dans un article de blog. « Nous ne vendrons jamais d’informations personnelles à qui que ce soit. »

Fondé en 2007, Fitbit est un pionnier de la technologie vestimentaire. Cela a contribué à ouvrir l’ère des compteurs pas à pas. Bien que la société ait connu des difficultés financières, Fitbit détenait toujours une part de marché de 10,1% au deuxième trimestre de 2019, avec 3,5 millions d’appareils vendus, selon le dernier rapport d’IDC sur les technologies vestimentaires. Fitbit cherche également à obtenir l’autorisation de la FDA pour mesurer son sommeil et sa fréquence cardiaque.

Google et Alphabet, sa société mère, ont déjà une solide activité autour de la recherche médicale. Le groupe de technologies de la santé d’Alphabet, appelé Verily, a développé ses propres dispositifs portables, Agence SEO Lille y compris une lentille de contact intelligente pour les personnes ayant une vision à long terme liée à l’âge et une montre munie de capteurs pour collecter des données. Etudes cliniques. Calico, une autre entreprise de l’Alphabet, essaie d’allonger la durée de vie moyenne.

Mais Google a dû faire face à un contrecoup pour d’autres projets de santé impliquant des informations personnelles sensibles sur les patients. Il y a deux ans, Google, l’Université de Chicago et un centre médical affilié ont conclu un partenariat permettant au géant de la recherche d’utiliser les données des patients et les dossiers médicaux pour améliorer l’analyse prédictive. Mais en juillet, le géant de la recherche, l’université et le centre médical ont été poursuivis à la suite d’un procès intenté après que le centre médical aurait échangé des informations avec Google sans supprimer des informations identifiables. Ces données incluaient les notes des médecins et les timbres à date de « centaines de milliers » de patients. À l’époque, Google a déclaré avoir agi conformément à la loi. L’Université de Chicago a déclaré que les revendications étaient « sans fondement ».

L’incident à Chicago n’a pas été isolé. Deepmind, une unité d’intelligence artificielle de Google au Royaume-Uni, s’est mise à l’eau chaude pour la façon dont il a utilisé les données obtenues dans le cadre de partenariats avec des hôpitaux. En 2016, Deepmind a dévoilé un pacte avec le Royal Free Hospital de Londres pour la création d’une application permettant d’identifier les patients souffrant de lésions rénales aiguës. Mais tous les patients ne savaient pas que leurs données étaient transmises à Google pour tester l’application.

Fiona Caldicott, du National Data Guardian du ministère britannique de la Santé, a qualifié le projet de « juridiquement inapproprié », selon The Guardian.

Le géant de la recherche est déjà confronté à des problèmes de confiance en ce qui concerne les données et la confidentialité. Le PDG de Google, Sundar Pichai, Référencement internet Lille a publié en mai dans le New York Times un éditorial intitulé « La vie privée ne doit pas être un bien de luxe ». Dans l’article, Pichai promet que la société tentera de faire plus avec moins de données.

En ce qui concerne les données sur la santé, ces préoccupations sont amplifiées, en particulier si ces informations sont partagées avec négligence avec des tiers, violées ou exploitées. Google devra convaincre les consommateurs Fitbit qu’il lui incombe de protéger ses clients information sensible.

« Les atteintes à la vie privée entre les mains des mauvaises personnes sont dévastatrices », a déclaré Brian Solis, auteur et analyste. Il explique comment les données transforment les industries traditionnelles. « Dans ce cas, ce sont des données terriblement personnelles. »