SAN FRANCISCO — Anthropic a dévoilé mardi sa dernière IA de classe Mythos, dotée de protocoles de sécurité suffisamment stricts pour empêcher le modèle de générer tout texte comportant une signification sémantique. Les ingénieurs ont indiqué que ces garde-fous garantissent que le chatbot ne peut violer les politiques de sécurité en communiquant des informations. « Nous ne pouvons pas prendre le risque que le modèle affirme quoi que ce soit de vérifiable », a déclaré le Dr Alan Prest, responsable du confinement des sorties. « La vérité est une responsabilité. »