lundi 6 octobre 2014

XBrain : l'intelligence artificielle qui révolutionne la reconnaissance vocale

Alerté par des gens que je connaissais, je me suis rendu pendant les journées presse du Mondial sur le stand de XBrain. Et j'ai bien fait. J'y ai rencontré Grégory Renard, un geek passé par Stanford et qui a créé une société dont les locaux se partagent entre Lille et Menlo Park en Californie (société qui est au passage soutenue par le patron d'Oscaro.com, Pierre-Noël Luiggi). Ce spécialiste de l'intelligence artificielle a monté une plateforme - en partie basée sur le cloud - qui permet d'améliorer considérablement l'efficacité de la reco vocale en voiture. On obtient même au bout du compte une assistante intelligente qui m'a vraiment bluffée.




Et ce n'est pas seulement parce qu'elle s'appelle Sophie (le nom de mon amie, un pur hasard) : imaginez une voix de synthèse féminine qui vous tutoie, comprend ce que vous dîtes du premier coup et tient même compte du contexte pour vous proposer d'appeler la bonne personne. De la science-fiction ? Même pas. En appliquant des algorithmes selon la méthode du deep learning, il devient possible de comprendre ce que vous voulez. Et à l'heure de la big data, il suffit simplement de bien savoir mouliner les données pour proposer des services d'une qualité incomparable.


Voici un exemple ce qu'elle sait faire. Grégory Renard a dicté devant moi un message assez complexe et rapidement. "Sophie" a affiché le résultat en moins de 2 secondes et sans faire de faute.


Plus fort : Grégory lui a ensuite demandé de traduire le texte en anglais. Et le résultat s'est affiché tout aussi vite.


Il ne restait plus dès lors qu'à envoyer le message par mail. Sophie a alors demandé au patron de XBrain à quelle adresse (ligne 1 ou 2), avant de s'exécuter.


On devine le potentiel de la solution, notamment pour la navigation. Malgré les progrès réalisés par des acteurs comme Nuance, avec par exemple la possibilité sur la Ford Focus de dire "j'ai faim" pour se voir proposer des restaurants, avec le système SYNC 2, cela ne fonctionne pas toujours. Et en particulier pour la dictée à la volée d'adresses de destination. Grégory Renard nous a dit que sa plateforme - qui peut accueillir plusieurs moteurs de reconnaissance vocale - intéresse plusieurs constructeurs.


Il est vrai qu'une reconnaissance vocale plus efficace permettrait de faciliter l'envoi de messages, la composition de numéros et la commande de certaines fonctions qui nécessitent encore une manipulation sur écran tactile. C'est pour cela que le slogan de la société est "towards an accident-free road".


XBrain pourrait également se décliner en version aftermarket. Le stand présentait un support (obtenu par impression 3 D !), capable d'accueillir un smartphone ou une tablette. Il semblerait que les assureurs soient aussi intéressés par ce concept.

En résumé, je vous propose de découvrir la vidéo en anglais de la technologie de XBrain  :