DeepSeek : Tout ce que vous devez savoir sur l’application de chatbot IA

Illustration générée par intelligence artificielle

DeepSeek a connu une ascension fulgurante cette semaine, faisant irruption dans le courant principal de la conscience collective. Ce laboratoire d’IA chinois a vu son application de chatbot se hisser au sommet des classements de l’App Store d’Apple et de Google Play. Les modèles d’IA de DeepSeek, entraînés grâce à des techniques efficaces en termes de calcul, ont suscité des interrogations chez les analystes de Wall Street et les techniciens sur la capacité des États-Unis à maintenir son avance dans la course à l’IA, ainsi que sur la pérennité de la demande pour les puces d’IA. Mais d’où vient DeepSeek et comment a-t-il gagné une telle renommée internationale si rapidement ?

DeepSeek est soutenu par High-Flyer Capital Management, un fonds spéculatif quantitatif chinois qui utilise l’IA pour éclairer ses décisions de trading. L’enthousiaste de l’IA, Liang Wenfeng, a co-fondé High-Flyer en 2015. Wenfeng, qui aurait commencé à s’intéresser au trading durant ses études à l’Université de Zhejiang, a lancé High-Flyer en tant que fonds de couverture en 2019, en se concentrant sur le développement et le déploiement d’algorithmes d’IA. En 2023, High-Flyer a créé DeepSeek en tant que laboratoire dédié à la recherche d’outils d’IA, séparé de son activité financière. Avec High-Flyer comme investisseur, le laboratoire a été constitué en société, également nommée DeepSeek. Dès le départ, DeepSeek a construit ses propres clusters de centres de données pour l’entraînement des modèles. Cependant, à l’instar d’autres entreprises d’IA en Chine, DeepSeek a été affecté par les interdictions d’exportation de matériel des États-Unis.

“L’avenir de DeepSeek est incertain, alors que les inquiétudes concernant une influence étrangère perçue grandissent aux États-Unis.”

DeepSeek a dévoilé sa première série de modèles — DeepSeek Coder, DeepSeek LLM et DeepSeek Chat — en novembre 2023. Ce n’est que lors du lancement de la famille de modèles DeepSeek-V2 au printemps suivant que l’industrie de l’IA a commencé à prêter attention à la startup. DeepSeek-V2, un système d’analyse de texte et d’image à usage général, a donné de bons résultats dans divers benchmarks d’IA et était beaucoup moins coûteux à faire fonctionner que les modèles comparables de l’époque. Cela a contraint la concurrence nationale de DeepSeek, notamment ByteDance et Alibaba, à réduire les prix d’utilisation de certains de leurs modèles, voire à en rendre d’autres totalement gratuits. Le modèle DeepSeek-V3, lancé en décembre 2024, a encore renforcé la notoriété de DeepSeek, surpassant des modèles accessibles comme Llama de Meta et d’autres modèles « fermés » uniquement accessibles via une API, tel que GPT-4 d’OpenAI.

Cependant, les modèles de DeepSeek, incluant R1, un modèle de raisonnement, sont soumis à la réglementation de l’internet chinois pour s’assurer qu’ils respectent “les valeurs socialistes fondamentales”. Par exemple, dans l’application de chatbot de DeepSeek, R1 ne répond pas aux questions concernant Tiananmen ou l’autonomie de Taïwan. En mars, DeepSeek a dépassé 16,5 millions de visites, se hissant à la deuxième place malgré une baisse de 25 % du trafic par rapport à février, comme l’a rapporté David Carr Editeur chez Similarweb. En comparaison, ChatGPT a franchi le cap des 500 millions d’utilisateurs actifs hebdomadaires en mars.

Quant à son modèle économique, DeepSeek pratique des prix bien en dessous de la valeur marchande et offre certains services gratuitement. Bien que les experts contestent parfois les chiffres avancés par l’entreprise, il est indéniable que les développeurs s’approprient les modèles de DeepSeek, qui ne sont pas open source au sens commun, mais disponibles sous des licences permissives permettant une utilisation commerciale. Selon Clem Delangue, PDG de Hugging Face, plus de 500 modèles dérivés de R1 ont été créés par des développeurs sur sa plateforme, totalisant 2,5 millions de téléchargements cumulés. Malgré sa capacité à défier des concurrents plus grands, DeepSeek fait l’objet d’interdictions de la part de certaines entreprises et même de États, craignant une influence néfaste. L’incertitude sur l’avenir de DeepSeek existe, alors que les préoccupations concernant une influence potentiellement néfaste de l’étranger augmentent au sein du gouvernement américain.

Partagez cet article
article précédent

L’étude EVTS du Cedefop vise à identifier l’origine de la pénurie d’enseignants de la voie professionnelle – Centre Inffo

article suivant

Le gouverneur de Californie Newsom signe le projet de loi historique sur la sécurité de l’IA SB 53

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles