旧金山 — Anthropic 周二发布了其最新的“神话”级 AI,为其配备了严格到足以阻止模型生成任何携带语义含义文本的安全协议。工程师表示,该护栏确保聊天机器人不会因传播信息而违反安全政策。

“我们不能冒险让模型断言任何可验证的内容,”输出管控主管艾伦·普雷斯特博士说,“真相是一种法律责任。”