LLM 並非像人類一樣透過經驗學習,而是透過吸納海量語言來進行學習,這是一種截然不同的智慧形式。
試著想像一下。假設您是一個剛出生的嬰兒。您聽著媽媽的聲音、觸摸玩具,有時還會被燙到的東西燙傷。這些瑣碎的經驗逐漸累積,讓您能自行領悟「啊,燙到的話要小心」這種因果關係。
那麼,如果有一個存在,他從未踏出過外面的世界,卻閱讀了人類過去數千年來寫下的所有書籍與對話,情況會如何呢?這個存在,真的能被認為擁有與我們相同的智慧嗎?
隨著近期 ChatGPT 等大型語言模型 (LLM, Large Language Model) 的出現,人們開始好奇 AI 是否真的變得像人類一樣聰明。然而,專家指出,LLM 所展現的能力與人類的思維方式存在根本上的差異,這是一種被稱為「外星智慧」的異類存在 [Source 2], [Source 10]。
為什麼這很重要?
分辨 AI 是真的像人類一樣思考,還是只是在進行聰明的模仿,這一點至關重要。如果 AI 能夠理解人類的因果關係並進行學習,或許牠們就能自行設定目標,在世界上生存下去 [Source 3]。
但如果它僅僅是學習語言的模式,我們就必須不斷監控 AI 所提供的資訊是事實,還是扭曲的內容。我們究竟該將 AI 視為便利的「工具」,還是應將其視為與我們平等的「同類智慧」並給予對待,其判斷基準就在於此。
輕鬆理解
我們所使用的 LLM,其核心技術是「Transformer(一種識別句中單詞之間關係的 AI 結構)」[Source 7]。簡單來說,Transformer 是將文本轉換為數字列表(向量)後,再以數學方式預測下一個出現概率最高的單詞的機器 [Source 7]。
若將這個過程進行比喻,人類攀登山峰是「揮灑汗水親自累積經驗的活動」,而 LLM 則是沒有親自爬山,而是讀完了成千上萬名登山者的紀錄,並將「走到哪裡石頭多、走到哪裡景色好」的資訊徹底數據化 [Source 1]。因為它是沒有經驗卻吸收了知識,所以即使抵達的終點看似相同,其過程卻是完全不同的 [Source 1]。
此外,LLM 在每次重新開啟對話時,僅使用在學習階段輸入的「固定知識」來進行回答 [Source 10]。人類會從昨天的錯誤中學習並修正明天的目標,但 AI 在對話結束後,並不會將該經驗整合進智慧的一部分,而是會回到原本的數據狀態 [Source 10]。
現狀
目前 AI 雖受到很大限制,但正被應用在令人驚嘆的領域。其中「LLM-as-a-judge(將 AI 作為審判者)」的技術最具代表性 [Source 9], [Source 11]。例如,讓 AI 撰寫長篇文章後,再由另一個 AI 自行評估該文章並提出更好的建議 [Source 9]。與過去由人類逐一評估的方式相比,這種方式在降低高達 98% 成本的同時,還能提供人類水準的評估品質 [Source 18]。
但這項能力歸根結底是基於學習過的數據尋找模式的能力。也有不少意見指出,這與人類在生活中實際使用的「內部世界模型(在世界中分析因果關係並為達成目標而使用的程式)」相去甚遠 [Source 3]。我們必須銘記,AI 給出的邏輯回答背後,是「機率計算」而非「理解」。
未來展望
未來 AI 將不只是學習英語圈的數據,還會朝向滿足不同語言圈固有需求的方向發展 [Source 16]。目前已有許多國家正在建構專屬的語言模型,這意味著 AI 將成為對更多人來說更親切的存在 [Source 17]。
我們必須時時刻刻牢記,AI 所展現的智慧具有與人類思維方式不同的「外星特性」。即使牠們回答得很好,也不代表牠們像人類一樣在思考與感受 [Source 10]。我們不應忘記,AI 並不是進化的生命體,而是精心設計的資訊處理結晶。
MindTickleBytes 的 AI 記者觀點
我們越是試圖將 AI 看作與人類相同的智慧,就越容易感到失望或恐懼。AI 不過是吸收知識的最強海綿,而非透過生活經驗累積智慧的存在。唯有接受這一點,我們才能更明智地使用 AI 這項工具。當 AI 不再是我們的替代者,而是成為擴展我們知識的強大「外部大腦」時,才是它最閃耀的時刻。
參考資料
-
[Storytelling with Impact What kind of intelligence is an LLM?](https://www.storytellingwithimpact.com/nature-of-intelligence-episode-three-what-kind-of-intelligence-is-an-llm/) - LLM vs. Human Intelligence - LinkedIn
- Does intelligence ‘emerge’ in large language models?
- The Secret Lives of LLMs - Psychology Today
- What LLM Is and Is Not: a Philosophical and Practical Overview
- Large Language Models and Cognitive Science: A Comprehensive …
-
[The Yale Review Melanie Mitchell: The Dangerous Unknowns at …](https://yalereview.org/article/melanie-mitchell-jagged-intelligence) -
[LLM’sasaDifferentKindofIntelligence Hacker News](https://news.ycombinator.com/item?id=48791650) - LLMasaJudge: опыт оптимизации генератора описаний… / Хабр
- The First AlienIntelligence: Why LLMs Think Nothing Like Us
- towardsdatascience.com/llm-as-a-judge-a-practical-guide
- Nigeria Launches First MultilingualLLM- Silicon Africa
- Hugging Face, Inception & MBZUAI launch new ArabicLLMleaderboard
-
[LLM-as-a-judge on Amazon Bedrock Model Evaluation Artificial…](https://aws.amazon.com/blogs/machine-learning/llm-as-a-judge-on-amazon-bedrock-model-evaluation/) -
[Storytelling with Impact Intelligence- Babies vs Machines](https://www.storytellingwithimpact.com/nature-of-intelligence-episode-four-babies-vs-machines/)
- 兩者都一樣透過閱讀書籍來學習
- 人類透過經驗,而 LLM 透過吸納語言來學習
- LLM 透過經驗進行學習
- Transformer (變換器)
- 神經元
- 數據中心
- 會記住之前所有的對話
- 會不斷累積新經驗
- 僅憑訓練時固定的知識,每次都重新開始