Speechify ajoute la transcription vocale et un assistant vocal à son extension Chrome

Speechify, initialement connu comme un outil permettant d’écouter des articles, des PDFs et des documents, franchit une nouvelle étape en intégrant des fonctionnalités de détection vocale à sa extension Chrome. Ces nouveautés incluent la transcription vocale, une fonction de dictée, ainsi qu’un assistant vocal capable de répondre aux questions de l’utilisateur. Alors que ces outils de reconnaissance vocale connaissent une croissance rapide grâce à l’amélioration continue des modèles de reconnaissance, Speechify cherche à se positionner parmi eux en lançant son propre logiciel de dictée supportant l’anglais.

Ce nouveau logiciel de transcription corrigera les erreurs et éliminera les mots pleins de remplissage pour améliorer l’expérience utilisateur. Cependant, lors de mes tests d’une journée, j’ai constaté que la performance de cet outil nécessitait encore des améliorations notables. Par exemple, la reconnaissance fonctionne convenablement sur des sites comme Gmail et Google Docs, mais rencontre des difficultés sur des plateformes comme WordPress où l’activation de la dictée vocale n’était pas toujours efficace. La société a indiqué qu’elle travaille à l’optimisation progressive pour les sites les plus populaires.

“L’objectif est d’intégrer peu à peu la reconnaissance vocale optimisée à toutes les applications, tout en améliorant la précision du modèle au fil du temps.”

Concernant la précision, le taux d’erreur sur Speechify était supérieur à celui de certains concurrents comme Wispr Flow, Willow ou Monologue. La société a néanmoins souligné que son modèle apprend rapidement avec l’usage, ce qui permettra de diminuer progressivement le taux d’erreurs. Par ailleurs, Speechify déploie également un assistant vocal conversationnel intégré à la barre latérale du navigateur, permettant à l’utilisateur de poser des questions sur le contenu de la page ou demander des explications simplifiées. Contrairement à ChatGPT ou Gemini, où la conversation occupe une place secondaire, Speechify met le voice au premier plan, croyant que beaucoup d’utilisateurs souhaitent privilégier cette interaction au lieu du chat traditionnel.

“Nous sommes convaincus que la voix sera la configuration principale et par défaut pour nos utilisateurs, alors que les autres assistants en ligne traitent la conversation comme un secondaire,” a déclaré Rohan Pavuluri, directeur commercial de Speechify, à TechCrunch. Cependant, un point faible actuel est que l’assistant vocal de Speechify ne fonctionne pas encore avec certains navigateurs ou extensions comportant des assistants intégrés, tels qu’OpenAI’s Atlas ou Perplexity’s Comet. Néanmoins, la majorité des efforts de la société se concentrent sur Chrome et ses nombreux utilisateurs.

Speechify prévoit d’étendre progressivement ces fonctionnalités de dictée vocale et d’assistant vocal à toutes ses plateformes, y compris desktop et mobile, tout en envisageant le développement d’agents capables d’exécuter des tâches à distance, comme prendre des rendez-vous ou gérer le support client. Bien que la société n’ait pas dévoilé tous ses projets, la vision est claire : transformer la voix en un outil central de l’interaction avec l’IA, répondant aux besoins spécifiques d’un marché qui privilégie l’interaction naturelle et immersive.

Partagez cet article
article précédent

Formation des conseillers prud’hommes : publication de la liste des organismes agréés pour la période 2026-2029 – Centre Inffo

article suivant

Le chatbot AI de Microsoft, Copilot, quitte WhatsApp le 15 janvier

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles