Les avertissements de sécurité d’Anthropic pourraient s’être retournés contre eux — le gouvernement a coupé l’accès à ses modèles d’IA les plus puissants

Le gouvernement américain a ordonné vendredi à Anthropic de désactiver immédiatement l’accès à deux de ses modèles d’intelligence artificielle les plus avancés, Claude Fable 5 et Claude Mythos 5, en invoquant des préoccupations liées à la sécurité nationale. La société a rapidement annoncé qu’elle s’était conformée à la demande, tout en exprimant son mécontentement face à ce qu’elle considère comme une erreur de la part des autorités. Cette décision, reçue à 17h21 heure de l’Est, oblige Anthropic à rendre ces modèles inaccessibles pour tous les utilisateurs dans le monde entier, et pas uniquement pour les étrangers visés par l’ordre de contrôle à l’exportation qui semble avoir motivé cette action.

Ce qui est particulièrement préoccupant, c’est que Mythos 5 représente la gamme la plus performante des modèles d’Anthropic. Présenté en début avril, ce modèle a été gardé sous très haute surveillance en raison de sa capacité exceptionnelle à détecter les failles de sécurité dans les logiciels. Selon l’entreprise, Mythos a identifié des vulnérabilités dans tous les principaux systèmes d’exploitation et navigateurs web qu’il a testé. Plutôt que de diffuser largement ce modèle, Anthropic a lancé un programme contrôlé, appelé Project Glasswing, en le partageant avec une cinquantaine d’organisations triées sur le volet, notamment Amazon, Apple, Google, Microsoft et CrowdStrike, pour des travaux de cybersécurité défensive.

“Les autorités justifient leur décision en évoquant un possible jailbreak de Fable 5, mais Anthropic estime que cette faille, si elle existe, est déjà présente dans d’autres modèles accessibles au public.”

Quant à Fable 5, la version récemment lancée, elle avait été conçue pour répondre aux pressions commerciales en intégrant des garde-fous capables de bloquer ses réponses dans des domaines sensibles comme la cybersécurité et la biologie. Selon Anthropic, ce modèle était devenu le plus performant disponible pour le grand public, comme le montrent des tests de benchmark réalisés par Vals AI. Cependant, la réponse du gouvernement semble vouloir limiter ces capacités au nom de la sécurité nationale, ce qui soulève des questions sur la légitimité et l’impact de telles mesures pour l’industrie de l’IA.

Anthropic a souligné dans un long article de blog que l’action du gouvernement semble principalement motivée par une préoccupation concernant un supposé jailbreak ciblant Fable 5. La société affirme que jusqu’à présent, les preuves données oralement ne concernent qu’un jailbreak très spécifique et limité, qui consiste à faire lire un code précis à l’IA pour mettre en évidence des failles logicielles. Elle note également que des capacités similaires sont déjà disponibles dans d’autres modèles publics, comme GPT-5.5 d’OpenAI, et que ces techniques sont souvent utilisées à des fins de cybersécurité défensive.

Pour Anthropic, le problème réside dans le fait que ses dispositifs de sécurité indépendants du modèle lui-même garantissaient déjà une protection solide contre les utilisations dangereuses. La société insiste sur le fait que même si l’on parvenait à faire dépasser au modèle ses refus, les mesures de sécurité fondamentales resteraient en place. Elle s’étoffe, donc, dans ses contestations, arguant que la réglementation actuelle pourrait freiner inutilement l’innovation dans le secteur et remettre en question le déploiement de modèles avancés à travers l’industrie.

En conclusion, cette intervention gouvernementale intervient dans un contexte où Anthropic, qui prévoit une introduction en bourse cette année, a toujours misé sur sa réputation comme étant le choix sûr face à ses concurrents. Ironiquement, la prudence dont la société a fait preuve pour restreindre Mythos pourrait paradoxalement attirer une surveillance accrue, voire des mesures restrictives, à un moment où elle souhaite attirer des investisseurs avec une image de sécurité renforcée. La situation illustre bien le défi stratégique que représente la gestion de la sécurité de l’IA dans un cadre réglementaire de plus en plus strict.

Partagez cet article
article précédent

Ce été chaud pour les IPO, et les MANGOS sont mûrs

article suivant

« À partir du 1er juin, je repasse en dessous du Smic » : le salaire minimum légal augmente de 2,4% et relance débats et crispations

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles