Sirius, une solution libre et open source pour s'attaquer à Siri, Google Now, Cortana, ...

Parmi les fonctionnalités qui ont le vent en poupe on retrouve de nos jours les assistants personnels virtuels. Pas un fabricant d’OS ne laisse ce domaine vide de tentatives, tous souhaitent apporter une solution pour tenter d’y répondre. Apple propose Siri pour iOS, Google intègre Google Now dans Android, Microsoft développe Cortana pour Windows. Les grands groupes tels que Amazon se lancent également dans l’aventure avec Echo. Chez les amateurs on retrouve des solutions superbes avec S.A.RA.H. ou encore L.I.S.A. par exemple. Les universitaires ne sont pas à la traîne non plus comme le montre le projet Sirius.

Sirius est une solution open source, permettant d’installer chez soi un assistant personnel complet. Elle intègre un client qui permet de collecter les ordres et un serveur qui permet de les traiter. Cette solution complète et autonome a pour but de proposer toutes les fonctionnalités des IPA ou Intelligent Personal Assistant. On les connait via leur implémentation sous la forme de Siri dans les appareils Apple, ou Google Now sous Android. Sirius implémente les fonctionnalités de base des IPA tels que la reconnaissance vocale, la reconnaissance d’images, le traitement du langage naturel ou encore les systèmes de questions réponses en vogue sur les smartphones.

Sirius est développé par le Clarity Lab de l’Universitée du Michigan. Les travaux autour de Sirius sont publiés à la International Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS) qui se déroule en ce moment même du 14 au 18 mars 2015 à Istanbul en Turquie. Pour tous ceux qui ne peuvent pas s’y rendre pour faire connaissance avec Sirius , la publication peut être consultée car elle a été mise en ligne.

Sirius est donc un système informatique open-source avec lequel vous pouvez interagir à la voix ou via une image interposée. Il est conçu pour être inclus en tant qu’ “assistants personnels intelligents” dans une nouvelle génération dispositifs “wearables”. Il pourrait également avoir une incidence dans l’infrastructure des centres de données pour pouvoir lui apporter les ressources de connaissances nécessaires. Sirius a été conçu comme une application robuste qui collecte les instructions ou questions vocales, les interprète et y répond avec des mots prononcés dans la langue d’origine.

Ce qui différencie Sirius des solutions commerciales déjà en place c’est quelle n’est pas dépendante de la plateforme matérielle et qu’elle ne demande pas de contreparties commerciales pour être opérationnelles. C’est le principe du libre. Sirius est gratuit. Son côté open source permet à tous de récupérer le code informatique de tous le projet dans le but de l’utiliser tel quel ou bien afin de le modifier pour le personnaliser entièrement.

Les sources de ce système Open Source sont disponibles sur le site de Sirius ou tout simplement sur GitHub. Le système n’en est qu’a ses débuts et est loin d’un produit qui peut être mis tel quel entre toutes les mains. Pour le mettre en place il faut clairement avoir de sérieuses compétences en informatique. Mais si les souhaits des concepteurs sont exaucés on pourrait voir arriver sur le marché des solutions utilisant leurs travaux. Sirius, en tant que solution académique sérieuse s’est ouvert un bel avenir.

La vidéo ci dessous vous permettra de faire connaissance avec Sirius:

Et pour finir voici une démonstration en ligne de commande de ce projet :

3 Comments

Darkjeff said:

Bonne nouvelle

Malheureusement c’est basé sur pocketsphinx pour lequel il faut un model de reconnaissance vocale en français. J’en ai trouvé aucun de bon gratuit, la plupart sont des solutions commercial. SARAH a encore de beau jour devant elle.

17 mars 2015
- idem2lyon said:
  
  Le gros problème de sarah…c est windows… Alors que lisa est unix 😉 tant que sarah restera windows, elle decollera pas
  
  18 mars 2015
  - Darkjeff said:
    
    Je suis d’accord avec toi windows est un problème mais pas le plus gros.
    
    Pour lisa, j’ai voulus le tester mais la doc est vraiment pas bonne. De plus c’est pareil soit tu utilise pocketsphinx soit un service en ligne. Dans un cas tu as pas les modèle acoustique et dans l’autre tu as la latence.
    
    Les softs qui sont derrière n’ont rien de révolutionnaire, c’est une requête -> une action. C’est le client, la capture et la reconnaissance qui saura faire sortir un produit du lot. Et là on à rien pour le moment qui peut être local.
    
    18 mars 2015

Publicité

Sirius, une solution libre et open source pour s’attaquer à Siri, Google Now, Cortana, …3 minute(s) de lecture

Publicité

Publicité

Hervé

3 Comments

Laisser un commentaire Annuler la réponse

Publicité

Sirius, une solution libre et open source pour s’attaquer à Siri, Google Now, Cortana, …3 minute(s) de lecture

Publicité

Ceci pourrait vous intéresser :

Publicité

Hervé

3 Comments

Laisser un commentaire Annuler la réponse