Membre du conseil de Mistral et VC a16z, Anjney Midha affirme que DeepSeek n’arrêtera pas la faim des GPU en IA | TechCrunch

Generated with DALL·E 3

Il y a six mois, Anjney “Anj” Midha, associé général chez Andreessen Horowitz et membre du conseil de Mistral, a d’abord observé les performances stupéfiantes de DeepSeek, dit-il à TechCrunch. C’est à ce moment-là que DeepSeek a présenté le Coder V2, qui rivalise avec le GPT4-Turbo d’OpenAI pour les tâches spécifiques de codage, selon un document qu’il a publié l’année dernière. Cela a placé DeepSeek sur la voie pour sortir des modèles améliorés tous les deux mois jusqu’à R1, a-t-il déclaré. R1 est son nouveau modèle de raisonnement open source qui a bouleversé l’industrie technologique en offrant des performances standard à une fraction du coût.

Malgré la vente des actions de Nvidia, Midha dit que R1 ne signifie pas que les modèles fondamentaux de l’IA cesseront de dépenser des milliards pour engloutir des puces GPU et construire des centres de données le plus rapidement possible. Cela signifie qu’elles feront plus avec la puissance de calcul qu’elles peuvent obtenir. “Quand les gens disent, d’accord Anj, Mistral a levé un milliard de dollars”, dit-il. “Cela signifie-t-il que tout ce milliard de dollars est totalement inutile ? Non, en fait, c’est extrêmement précieux pour eux de pouvoir analyser les améliorations d’efficacité de DeepSeek, de les intérioriser, puis de jeter un milliard de dollars dessus”. Il ajoute, “Maintenant, nous pouvons obtenir 10 fois plus de résultats avec la même puissance de calcul”.

Cela ne signifie pas que Mistral est désespérément en retard sur ses rivaux OpenAI et Anthropic, argumente-t-il. Chacun d’eux a levé beaucoup plus de milliards que Mistral.

OpenAI est en pourparlers pour lever encore 40 milliards de dollars de plus. Mistral reste compétitive avec eux parce qu’elle est open source, dit-il. Et sa logique a du mérite. L’open source donne à une entreprise un accès essentiellement gratuit à la main-d’œuvre technique de ceux qui veulent aider parce qu’ils utilisent le projet. Les rivaux du code source fermé gardent leurs secrets et doivent payer pour toute la main-d’œuvre ainsi que pour la puissance de calcul. “Vous n’avez pas besoin de 20 milliards de dollars. Vous avez seulement besoin de plus de calcul que toute autre application open source. Ainsi, Mistral est bien positionnée. Ils ont le plus de calcul de tout fournisseur open source”, a déclaré Midha de sa société en portefeuille. Le Llama de Facebook, le plus grand rival occidental de l’IA en open source face à Mistral, recevra également beaucoup plus d’investissements. Le PDG Mark Zuckerberg a déclaré mercredi qu’il prévoyait toujours de dépenser des « centaines de milliards de dollars » en IA, dont 60 milliards en 2025 en dépenses d’investissement, principalement en centres de données.

Le programme de partage de GPU Oxygen de a16z est surréservé, dit Midha, qui est également membre du conseil de l’entreprise de création d’images IA, Black Forest Labs, et de Luma, fabricant de modèles 3D (et investisseur chez Anthropic, ElevenLabs et d’autres). Il a une autre raison de ne pas voir la faim de l’IA pour les GPU disparaître de sitôt. Il dirige le programme Oxygen de a16z. Les GPU, notamment les H100 de pointe de Nvidia, sont devenus une telle denrée rare que la société de capital-risque a pris les choses en main il y a environ un an et demi. Elle en a acheté un certain nombre pour ses entreprises en portefeuille. Oxygen est “surréservé en ce moment. Je ne peux pas en attribuer assez”, rit Midha. Non seulement ses startups ont besoin de GPU pour l’entraînement des modèles d’IA, mais ensuite elles en ont besoin encore plus pour faire fonctionner leurs produits d’IA en cours pour les clients. “Maintenant, il y a cette demande insatiable pour l’inférence, pour la consommation”, explique-t-il.

C’est pourquoi il pense que les percées techniques de DeepSeek ne changeront pas non plus Stargate. C’est le grand partenariat de 500 milliards de dollars annoncé plus tôt ce mois-ci par OpenAI avec SoftBank et Oracle pour les centres de données d’IA. Le changement majeur introduit par DeepSeek est la reconnaissance par les États-nations que l’IA est la prochaine infrastructure fondamentale, comme l’électricité et l’internet. Midha veut qu’ils envisagent ce qu’il appelle “l’indépendance de l’infrastructure”. Veulent-ils dépendre des modèles chinois, avec leur censure et leurs griffes dans leurs données ? Ou veulent-ils des modèles occidentaux qui respectent les lois et l’éthique occidentales et se conforment aux accords de l’OTAN ? Il plaide évidemment pour que les nations occidentales utilisent des modèles occidentaux, comme son Mistral basé à Paris. Des centaines d’entreprises partagent cette préoccupation et ont déjà bloqué DeepSeek, qui est à la fois un service d’application pour les consommateurs et un modèle open source.

Partagez cet article
article précédent

‘Des centaines’ d’entreprises bloquent DeepSeek en raison des risques de données en Chine | TechCrunch

article suivant

Les systèmes d’IA présentant un “risque inacceptable” sont désormais interdits dans l’UE | TechCrunch

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles