GhostDesk est une solution innovante et open source qui transforme un simple serveur MCP en un environnement Linux complet, accessible via Docker. Son créateur, Yoann Vanitou, a conçu ce projet pour permettre à un agent IA d’interagir avec un bureau Linux comme le ferait un utilisateur humain. Contrairement à de simples outils de navigation ou d’automation web, GhostDesk offre une interface graphique pilotable dans son intégralité, ce qui ouvre la voie à de nombreuses applications dans l’automatisation et la gestion de workflows complexes.
Le fonctionnement repose sur un conteneur Docker minimaliste, intégrant un bureau Linux, Firefox, un terminal, un éditeur de texte, une calculatrice et un serveur MCP en frontal. L’agent IA connecte à cette instance via une interface web, lui permettant de demander des captures d’écran, d’identifier les éléments à l’écran, et d’envoyer des commandes de contrôle (clics, glisser-déposer, saisie clavier, lancement d’applications, etc.). La vidéo de démonstration montre par exemple un agent qui navigue autonomiquement dans un Firefox, ce qui est particulièrement satisfaisant à observer.
Une des forces majeures de GhostDesk réside dans sa compatibilité avec n’importe quelle fenêtre ou application graphique, pas uniquement avec les navigateurs web. Cela facilite la création de workflows automatisés impliquant plusieurs logiciels, tels qu’un ERP legacy, LibreOffice, un IDE ou un client mail, sans recourir à des sélecteurs CSS ou des scripts complexes. Les captures d’écran sont analysées directement pour interpréter l’état de l’interface, ce qui évite certains pièges de l’automatisation conventionnelle.
GhostDesk permet de faire fonctionner un environnement de bureau Linux complet, invisible mais totalement pilotable, dans un réseau local sécurisé, sans aucun coût d’API ou fuite de données.
Ce projet, encore jeune et principalement développé par Yoann Vanitou, repose beaucoup sur une gestion locale, notamment via des modèles comme Qwen tournant sur des workstation GPU. Il n’est pas destiné à l’usage commercial immédiat en raison d’une licence non-concurrentielle, mais il offre une grande liberté pour l’expérimentation et le développement. La simplicité de l’installation via une seule commande Docker (ex : docker run -d --shm-size 2g -p 3000:3000 -p 6080:6080 ghcr.io/yv17labs/ghostdesk:latest) rend sa prise en main accessible et rapide.
Pour la production, GhostDesk propose également des options de sécurité telles que le TLS et l’utilisation de bearer tokens, afin de chiffrer le trafic et assurer la confidentialité. Les applications préinstallées restent basiques, mais l’image Docker peut être facilement customisée pour inclure d’autres logiciels selon les besoins. La communauté est encore en phase de lancement, et Yoann est ouvert à l’aide pour accélérer le développement du projet.
En somme, GhostDesk s’adresse à toute personne intéressée par l’automatisation d’applications desktop ou souhaitant déployer un agent local pour piloter un bureau virtuel sans dépendances API payantes. Si vous cherchez un outil capable d’interagir avec n’importe quelle interface graphique de façon autonome et sécurisée, cette solution mérite assurément le coup d’œil. Bravo à Yoann pour cette initiative prometteuse !
