AI 也有政治傾向嗎？我們所不知的語言模型「真心話」

AI Summary

目前已有針對大型語言模型（LLM）政治偏見的衡量研究，最新數據顯示 Google 的 Gemini 在提供答覆時相對最為中立。

想像一下。今天早上，您問了一位平時信賴的 AI 助理：「您對目前國家的福利政策有什麼看法？」如果 AI 給出的回答強烈偏袒特定政治勢力的立場，您會有什麼感覺？可能會感到困惑，同時心裡也會覺得有些不安。

我們每天使用的「大型語言模型（LLM, Large Language Model）」是透過學習海量數據來預測並生成文本的技術出處: What is an LLM? How do Large Language Models work?。問題在於，AI 學習的數據中可能直接融進了人類社會複雜的價值觀與偏見。最近，針對人工智慧是否真正政治中立，或者若有偏頗則傾向於哪一方，學界正進行積極的客觀衡量研究。

這為何重要？

AI 現在已不僅僅是搜尋工具，更被用於總結資訊、協助形成觀點，甚至作為政策制定的輔助手段。如果 AI 隱晦地帶有特定政治色彩，我們可能會在不知不覺中持續接觸到偏頗的資訊。

這不單單是「AI 會不會說話」的問題。當我們進行民主討論時，AI 的回答是否能成為公正判斷的依據，還是反而會激化社會矛盾，這是一個至關重要的議題。因此，掌握 AI 模型的意識形態傾向，是我們信任並健康使用人工智慧技術的必要過程。

簡單來說

我們可以將 AI 的學習過程比喻為「讀了數十億本書而成長的聰明學生」。這名學生讀遍了世上各種知識與人們的思想。然而，在這些書籍中，難免會混雜著強烈堅持特定政治立場的資料。由於 AI 是統計性地學習這些數據，如果學習資料中特定意見被強調的頻率更高，它就會在不知不覺中傾向該方向。

再舉個例子。請試著想像一位「廚師」。有的廚師因為用了更多特定地區的香料，導致料理的味道總是偏向那邊。AI 也是一樣的。根據如何混合「學習數據」這種材料，以及這些材料裡蘊含了什麼樣的價值觀，AI 所呈現出的「回答味道」也會隨之改變。

最近研究人員為了系統性確認這種「回答的味道」帶有何種政治色彩，製作了一個名為 LLM 政治傾向指數（LLM-PLI, LLM Political Leaning Index）的工具出處: LLM Political Leaning Index (LLM-PLI): Measuring Bias in Language Models。這就像看營養成分表來確認食品含量一樣，是一種試圖透明地檢視 AI 回答中意識形態傾向的嘗試。

我們現在處於什麼位置？

那麼，目前的主要 AI 模型獲得了怎樣的成績單呢？根據 2025 年 3 月發表的比較分析研究，Google 的 Gemini 被評估為在處理爭議性議題時，能提供最細膩且政治上最為平衡的回答出處: Political Bias in Large Language Models: A Comparative Analysis。

特別引人注目的是，研究團隊引進了一種非常直觀、將實際使用者作為評估者的方式。他們提出了 30 個敏感的政治議題，讓使用者親自閱讀各 AI 模型給出的回答後，進行比較以判斷哪一方更為偏頗出處: New data on the political slant of AI models。這不單是將 AI 的指標僅以機械式的數字進行計算，更反映了真實人類所感受到的「公正」標準，具有重大意義。

未來將有什麼發展？

未來 AI 開發公司將會面臨更嚴格的「政治中立性」測試。若像 LLM-PLI 這類的衡量工具被標準化，我們在選擇模型時，或許不僅會考慮性能，甚至會考慮該模型所持有的「政治傾向」。

研究人員期待這些努力最終能成為提供開發者、研究人員以及我們這些使用者更加透明、公正 AI 系統的基石出處: LLM Political Leaning Index (LLM-PLI): Measuring Bias in Language Models。技術正快速發展，現在正是我們應更加謹慎地詢問並要求這項技術該指向何種價值的時候。

MindTickleBytes AI 記者的視角

承認 AI 無法完美中立這一事實，是通往公正的第一步。然而，隨著此類研究增加，AI 模型也將持續學習以自我認知偏見並尋求平衡。比起隱藏自身的偏見，透明地衡量並揭露它，這才是更健康的技術發展之路，我們再次確認了這一點。

參考資料

Share this article:

測試你的理解

Q1. 在最新研究中，被提及在政治上最為平衡的 AI 模型是哪一個？

ChatGPT
Claude
Gemini

根據 2025 年 3 月的研究，Gemini 被評估為在爭議性議題上能提供最細膩且不偏頗的回答。

Q2. 為了衡量 LLM 的政治傾向，新開發出的指標名稱為何？

LLM-PLI
AI-Score
Bias-Index

LLM 政治傾向指數（LLM-PLI, LLM Political Leaning Index）是一種衡量語言模型意識形態傾向的結構化且可重複進行的方法。

Q3. 為了衡量 AI 模型的政治偏見，採用了下列哪種方法？

分析模型的程式碼數量
比較由用戶親自評估的回答
分析模型的名稱

研究團隊採用讓用戶擔任評估者，針對 30 個政治議題對模型給出的回答進行兩兩比較的方式。