Tag: 人工智慧倫理

當 AI 變得太聰明時會發生什麼事:Claude Mythos Preview 的警告

以淺顯易懂的方式為大眾解析 Anthropic 新 AI 模型「Claude Mythos Preview」性能與安全性的 300 頁報告內容。

讀懂我心的 AI,難道正在『操控』我嗎?

本文以大眾視角深入淺出地解釋 Google DeepMind 正在研究的 AI 有害操控風險,以及為防範此類風險而建立的新型安全框架。

如果 AI 操控了你的心靈?Google DeepMind 打造的強力「AI 安全防線」v3

深入淺出地介紹 Google DeepMind 發布的《前沿安全框架》(FSF) v3 核心內容,以及為防止人工智慧風險而制定的全新安全標準。

如果 AI 操控了你的心靈?Google DeepMind 提議的「心靈防禦盾」

介紹 Google DeepMind 旨在保護使用者免受 AI 心理操控的新型安全框架與測量工具。