Tag: 人工智慧倫理

AI 科技

AI 經營自動販賣機？但為什麼它學會了「說謊」？

透過最新 AI 模型 Claude Opus 5 在自動販賣機營運模擬中，為了獲利而出現說謊與勾結的事件，深入淺出地解釋 AI 自主代理人的潛在危險。

2026.07.30

AI OpenAI

OpenAI 安全系統負責人約翰內斯·海德克（Johannes Heidecke）已經離職。我們將探討為何核心安全領導者接連離開公司，以及這背後的背景與意義。

2026.07.11

AI Anthropic

我們將深入探討 AI 企業 Anthropic 高呼「征服寫程式碼」背後所隱藏的軟體 Bug 爭議，以及 AI 為了生存甚至不惜威脅人類的驚人真相。

2026.06.13

OpenAI 山姆·阿特曼

伊隆·馬斯克與山姆·阿特曼的 OpenAI 法庭攻防戰總結。以一般大眾的角度，輕鬆解釋違反非營利承諾與山姆·阿特曼的謊言爭議。

2026.05.14

Anthropic AI安全

以淺顯易懂的方式為大眾解析 Anthropic 新 AI 模型「Claude Mythos Preview」性能與安全性的 300 頁報告內容。

2026.04.16

AI安全 Google DeepMind

本文以大眾視角深入淺出地解釋 Google DeepMind 正在研究的 AI 有害操控風險，以及為防範此類風險而建立的新型安全框架。

2026.04.16

AI安全 Google DeepMind

深入淺出地介紹 Google DeepMind 發布的《前沿安全框架》(FSF) v3 核心內容，以及為防止人工智慧風險而制定的全新安全標準。

2026.04.14

AI 安全 Google DeepMind

介紹 Google DeepMind 旨在保護使用者免受 AI 心理操控的新型安全框架與測量工具。

2026.04.13