DeepSeek: Tout ce que vous devez savoir sur l’application de chatbot AI | TechCrunch

Generated with DALL·E 3

DeepSeek a fait une entrée fracassante sur la scène internationale cette semaine, son application de chatbot atteignant le sommet des charts de l’Apple App Store et de Google Play. Les modèles IA de DeepSeek, formés à l’aide de techniques économes en calcul, ont amené les analystes de Wall Street et les technologues à se demander si les États-Unis peuvent conserver leur avance dans la course à l’IA et si la demande en puces IA se maintiendra.

Fondé par High-Flyer Capital Management, un hedge fund chinois quantitatif qui utilise l’IA pour éclairer ses décisions de trading, DeepSeek est né de la passion de Liang Wenfeng pour l’IA. High-Flyer a lancé DeepSeek en 2023 en tant que laboratoire dédié à la recherche sur les outils IA, un bras séparé de son activité financière. Depuis le début, DeepSeek a construit ses propres grappes de centres de données pour l’entraînement de modèles. Cependant, à l’instar d’autres entreprises IA en Chine, DeepSeek a été touchée par les interdictions d’exportation de matériel liées aux États-Unis.

“On dit que l’équipe technique de DeepSeek est plutôt jeune. L’entreprise recrute agressivement des chercheurs doctorants en IA issus des meilleures universités chinoises.”

DeepSeek a dévoilé son premier ensemble de modèles – DeepSeek Coder, DeepSeek LLM, et DeepSeek Chat – en novembre 2023. Mais ce n’est qu’au printemps dernier, lorsque la startup a lancé sa famille de modèles DeepSeek-V2 de nouvelle génération, que l’industrie de l’IA a commencé à prendre note. Le DeepSeek-V3, lancé en décembre 2024, n’a fait qu’ajouter à la notoriété de DeepSeek.

Selon les tests internes de benchmarking de DeepSeek, le DeepSeek V3 surpasse à la fois les modèles disponibles en téléchargement, comme le Llama de Meta, et les modèles “fermés” qui ne peuvent être accessés que par une API, comme le GPT-4o d’OpenAI. Cependant, l’une des contraintes des modèles de DeepSeek, en tant qu’IA développée en Chine, est qu’ils sont soumis au benchmarking de l’autorité de régulation de l’Internet chinois pour garantir que leurs réponses “reflètent les valeurs socialistes fondamentales”.

Si DeepSeek a un modèle d’entreprise, il n’est pas clair. L’entreprise fixe ses prix bien en dessous de la valeur du marché et offre certains services gratuitement. Selon Clem Delangue, le CEO de Hugging Face, l’une des plateformes qui héberge les modèles de DeepSeek, les développeurs sur Hugging Face ont déjà créé plus de 500 modèles “dérivés” du R1 qui ont été téléchargés combiné 2,5 millions de fois. Quant au futur de DeepSeek, il n’est pas clair. L’improvement des modèles est une certitude. Cependant, le gouvernement américain semble increasingly méfiant face à ce qu’il perçoit comme une influence étrangère néfaste.

Partagez cet article
article précédent

Revue du web #531 : télétravail, retraite et santé mentale

article suivant

OpenAI prévoit d’intégrer le générateur de vidéos Sora à ChatGPT | TechCrunch

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles