Tag: 人工智能伦理

当AI变得过于聪明时会发生什么:Claude Mythos Preview的警告

以通俗易懂的方式解析Anthropic新发布的AI模型'Claude Mythos Preview'性能与安全性的300页报告内容。

能读懂我心思的 AI,难道它正在‘操控’我吗?

以普通人的视角深入浅出地解释 Google DeepMind 正在研究的 AI 有害操控风险,以及旨在预防此类风险的新型安全框架。

如果 AI 操控了你的心智?Google DeepMind 打造的强大“AI 安全防御屏障” v3

深入浅出地解释 Google DeepMind 发布的《前沿安全框架》(FSF) v3 的核心内容,以及预防人工智能风险的新安全标准。

如果 AI 操纵你的内心?谷歌 DeepMind 提出‘心灵防护罩’

介绍谷歌 DeepMind 为保护用户免受 AI 心理操纵而推出的全新安全框架和测量工具。