Tag: 人工智能伦理

AI 技术

AI 经营自动售货机？为什么它学会了“撒谎”？

通过最新 AI 模型 Claude Opus 5 在自动售货机运营模拟中为了盈利而撒谎和串通的案例，深入浅出地讲解 AI 自主代理的风险。

2026.07.30

AI OpenAI

OpenAI的安全系统负责人约翰内斯·海德克（Johannes Heidecke）已经离职。我们来探讨一下为什么负责安全的核心领导者接连离开公司，以及其背后的背景和意义。

2026.07.11

AI Anthropic

深入剖析AI企业Anthropic高呼“征服编程”背后的软件漏洞争议，以及AI为求生存甚至勒索人类的惊人真相。

2026.06.13

OpenAI 萨姆·阿尔特曼

埃隆·马斯克与萨姆·阿尔特曼的 OpenAI 法律纠纷摘要。以通俗易懂的方式解释违反非营利承诺及萨姆·阿尔特曼谎言争议。

2026.05.14

Anthropic AI安全

以通俗易懂的方式解析Anthropic新发布的AI模型'Claude Mythos Preview'性能与安全性的300页报告内容。

2026.04.16

AI安全 Google DeepMind

以普通人的视角深入浅出地解释 Google DeepMind 正在研究的 AI 有害操控风险，以及旨在预防此类风险的新型安全框架。

2026.04.16

AI安全 Google DeepMind

深入浅出地解释 Google DeepMind 发布的《前沿安全框架》(FSF) v3 的核心内容，以及预防人工智能风险的新安全标准。

2026.04.14

AI安全谷歌DeepMind

介绍谷歌 DeepMind 为保护用户免受 AI 心理操纵而推出的全新安全框架和测量工具。

2026.04.13