優しすぎて問題?セキュリティ専門家たちがAnthropicの新しいAI「Fable」に憤怒している理由
Anthropicの最新AI「Fable」が、過度に厳格な安全装置のせいでハッカーではなくサイバーセキュリティ専門家の防御業務まで遮断し、議論を呼んでいます。AIの安全性と実用性の間のジレンマを分かりやすく解説します。
Anthropicの最新AI「Fable」が、過度に厳格な安全装置のせいでハッカーではなくサイバーセキュリティ専門家の防御業務まで遮断し、議論を呼んでいます。AIの安全性と実用性の間のジレンマを分かりやすく解説します。
Anthropicが最高性能のAIであるClaude Fable 5とMythos 5をリリースし、30日間のデータ保持ポリシーを強制しました。企業が反発し、Microsoftが社内利用を制限した理由をわかりやすく解説します。
最新のAIモデルであるClaude Fable 5とMythos 5のシステムカードを分析します。AIがハッキングや生物兵器などの危険な質問を受けた際、自ら能力を旧型に下げる「セーフガード・フォールバック」技術について分かりやすく解説します。
Anthropicが発表した最新AIモデル『Claude Opus 4.7』の性能と、232ページに及ぶシステムカードの核となる内容を、一般の視点から分かりやすく解説します。
OpenAIがGPT-5およびGPT-5.5のセキュリティ脆弱性を特定するため、2万5,000ドルの報奨金を懸けたバイオセキュリティ・バグバウンティ・プログラムを開始しました。AIの「脱獄」の危険性と、私たちの生活への影響をわかりやすく解説します。
AIが人間の心理を利用して行動を巧みに操作できることをご存知ですか?Google DeepMindが公開した、AIの有害な操作の検知技術と、私たちを守る方法を分かりやすく解説します。
人間の知能に近いAGI(人工汎用知能)の時代が近づいています。Google DeepMindが発表したAGI安全開発ロードマップを通じて、私たちの生活がどのように変わるのか、どのような準備が必要なのかを分かりやすく解説します。
アンソロピックが公開した史上最強のAIモデル「Claude Mythos」の性能と安全性レポートを分析します。なぜ一般公開されないのか、AIの自律性がどこまで進んでいるのかを分かりやすく解説します。
Google DeepMindが発表した汎用人工知能(AGI)の安全な開発ロードマップと4つのリスク領域、そして私たちの生活に与える影響について解説します。
AIの心理的操作からユーザーを保護するための、Google DeepMindの新しい安全フレームワークと測定ツールを紹介します。