Reportage indépendant, grilles plus nettes
L'IA Mythos : une avancée majeure en bio-informatique, résolvant 30 % de problèmes complexes

Claude, le laboratoire d'IA développé par Anthropic, a récemment testé ses modèles d'intelligence artificielle, notamment Claude Mythos et Claude Opus, dans le domaine de la bio-informatique. Les résultats de cette étude se révèlent non seulement impressionnants, mais aussi prometteurs pour l'avenir de la recherche scientifique.
Une performance remarquable en bio-informatique
La bio-informatique, qui consiste à appliquer des méthodes informatiques, mathématiques et statistiques à la biologie, représente un défi majeur pour les chercheurs. Dans le cadre de l'évaluation des compétences de ses modèles, Anthropic a mis en place un nouveau benchmark nommé BioMysteryBench, qui comprend 99 questions complexes. Ces questions, bien que vérifiables, sont souvent difficiles, voire impossibles à résoudre, même pour des experts humains.
Des résultats impressionnants
Parmi les 99 questions posées, 73 ont pu être répondues par un panel d'experts. Claude Mythos a surpassé les attentes en résolvant 82,6 % des problèmes solvables par des humains, tandis que Claude Opus 4.7 a atteint un taux de 78,9 %. Plus étonnant encore, Mythos a réussi à apporter des réponses à certaines des 23 questions qui avaient laissé les experts perplexes. Son taux de bonnes réponses dans cette catégorie était de 29,6 %, alors que Claude Opus 4.7 a enregistré 27 %.
Un nouveau tournant pour l'intelligence artificielle
Les résultats de l'étude montrent que Claude Mythos ne se limite pas à la cybersécurité, domaine où il a suscité de vives discussions. En effet, l'IA générative à usage général comme Mythos a un potentiel énorme pour transformer d'autres domaines, notamment la science. “La vaste base de connaissances sous-jacente de Claude contient des informations sur la biologie structurale, les profils moléculaires et les méta-analyses issues de centaines de milliers d'articles,” explique le laboratoire d'IA. Cela permet à Mythos de résoudre des problèmes complexes sans avoir besoin de réaliser des méta-analyses approfondies comme les humains le feraient.
La méthodologie de Mythos
Lorsque Claude Mythos n'est pas certain d'une réponse, il combine plusieurs méthodes et intègre des éléments de preuves provenant de ces différentes approches pour parvenir à une conclusion. Cette capacité d'analyse et de synthèse pourrait s'avérer précieuse pour les scientifiques, qui pourraient s'en inspirer pour développer de nouvelles solutions.
Des préoccupations en matière de cybersécurité
Actuellement, la sortie de Claude Mythos est restreinte, sauf pour quelques organisations, en raison de ses compétences en cybersécurité. Ces compétences peuvent être détournées par des individus malintentionnés pour identifier et exploiter de nouvelles vulnérabilités, plutôt que de les signaler. Par exemple, en utilisant Mythos, Mozilla a détecté 271 failles de sécurité sur Firefox, qui ont ensuite été corrigées grâce à une mise à jour du navigateur.
Vers un avenir prometteur
Malgré ces préoccupations, l'étude menée par Anthropic rappelle que Mythos possède également des compétences impressionnantes dans d'autres domaines, et qu'il pourrait jouer un rôle clé dans l'avancement de la science, à condition que les risques liés à la cybersécurité soient maîtrisés. Anthropic envisage de sortir Claude Mythos ou un modèle similaire une fois que des mesures de sécurité auront été mises en place. Les tests de ces mesures sont actuellement effectués sur le modèle Claude Opus 4.7.
Conclusion
L'annonce de Claude Mythos a suscité un vif intérêt, notamment pour ses compétences en cybersécurité. Cependant, cette nouvelle étude réoriente le débat, montrant que Mythos pourrait également être un atout précieux pour la science. À mesure que nous avançons vers un avenir où l'intelligence artificielle pourrait résoudre des problèmes scientifiques complexes, il est crucial de rester vigilant face aux défis en matière de sécurité.
Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.
Newsletter : Abonnez-vous pour recevoir chaque matin un résumé de l’actu tech.






