Le nouveau système de reconnaissance vocale utilisé par Google vient du Tessin

Servizio comunicazione istituzionale

26 Ottobre 2015

Les réseaux de neurones récurrents développés par l’Istituto Dalle Molle di studi sull’intelligenza artificiale (IDSIA, USI-SUPSI) sont à l’origine d’une importante innovation technologique annoncée récemment par Google au moyen d’une note officielle et fruit d’un projet de recherche du Fonds national suisse de la recherche scientifique.

 

Il s’agit d’une nouvelle génération d’interprètes pour commandes vocales, utilisée par les applications Google tant sous iOS qu’Android, beaucoup plus précise que la précédente, plus rapide et résistante aux bruits de fond tout en exigeant une moindre puissance de calcul. Les réseaux de neurones récurrents à «Long Short-Term Memory» (LSTM) développés au Tessin par le professeur Jürgen Schmidhuber de la Faculté des sciences informatiques de l’USI qui collabore avec l’IDSIA, l’institut de l’Università della Svizzera italiana (USI) et de la Scuola universitaria professionale della Svizzera italiana (SUPSI) affilié au Dipartimento tecnologie innovative de la SUPSI, sont à la base de cette évolution dont les applications seront utilisées par des milliards de personnes et amélioreront de manière spectaculaire l’interaction «homme-machine». Publié par l’IDSIA en 1997 en collaboration avec la Technische Universität München, le modèle permet à la machine d’apprendre des sons et des mots par entraînement au contact de millions d’exemples. La structure du réseau de neurones artificiels est en effet très semblable à celle du cerveau humain. 

 

À partir de cette architecture, le professeur Schmidhuber et son équipe ont ajouté au réseau de neurones des connexions récurrentes qui aident à faire perdurer le son dans le temps (Connectionist Temporal Classification) de façon à faciliter considérablement le processus d’interprétation. Pour sa nouvelle génération d’interprètes pour commandes vocales, Google a employé cette même innovation, illustrée dans le travail de recherche daté 2006 cité par Google dans sa note. 

 

Ces techniques et d’autres similaires ont récemment permis à l’IDSIA de remporter neuf prestigieux concours internationaux. Google et d’autres sociétés de premier plan comme Microsoft, IBM et Baidu utilisent actuellement les LSTM dans des nombreuses applications comme la traduction automatique, l’interprétation d’images et l’analyse du langage naturel. C’est dans ce cadre que Google a racheté l’an dernier l’entreprise DeepMind spécialisée dans l’apprentissage automatique et qui compte parmi ses fondateurs et collaborateurs quatre anciens chercheurs de l’IDSIA. 

 

Pour plus d’informations

Prof. Luca Maria Gambardella

Directeur de l’Istituto Dalle Molle di studi sull’intelligenza artificiale: [email protected]

 

• Note officielle Google : http://googleresearch.blogspot.ch/2015/09/google-voice-search-faster-and-more.html

• Paper Fonds national suisse : ftp://ftp.idsia.ch/pub/juergen/icml2006.pdf