荷蘭沒有選擇依賴美國大型 IT 企業,而是將完全由合法數據訓練而成的公共 AI「GPT-NL」引入日常生活中,為歐洲的數位主權提出了新的模式。
想像一下。早晨醒來,面對即將到來的搬家,你登入當地市政廳的網站並問道:「我們社區的房屋改建許可證要怎麼申請?垃圾分類規定又是什麼?」如果是在平時,你可能得在複雜的民眾服務佈告欄和搜尋列中翻找半天,但現在,一個親切的聊天視窗彈了出來,並以完美的當地語言和符合社區法規的標準立刻為你解答。
然而,令人驚訝的是,這個聰明又親切的人工智慧(AI)助手,並非出自我們熟知的美國大型 IT 企業之手。如果它是由你所居住的國家、用市民的納稅錢透明地打造出的「社區專屬 AI」呢?而且還是一個完全沒有版權爭議、只吸收乾淨且安全數據成長的助手。
現在在荷蘭,這種令人愉快的想像正在成為現實。荷蘭拒絕了依賴大型科技企業便利系統這條捷徑,轉而著手建構屬於他們自己的語言模型「GPT-NL」,在歐洲的人工智慧歷史上樹立了新的里程碑 [GPT‑NL: a sovereign language model for the Netherlands]。究竟為什麼他們不使用別人花費天文數字資金已經做好的像 ChatGPT 這樣的 AI,非要選擇這條艱辛的道路呢?這其中隱藏著我們必須了解的深意。
為什麼這很重要? (Why It Matters)
今日我們每天都在使用的智慧型手機語音助理、翻譯機,以及能將複雜文章瞬間摘要的大型語言模型(LLM,透過學習大量文本來掌握上下文並像人類一樣對話的 AI 技術),大多被少數美國全球企業所壟斷。無可否認,他們的技術確實令人驚豔且非常便利。但是,只要稍微深入思考,就會發現令人毛骨悚然的地方。因為將國家重要的公共服務、涉及機密的業務,以及與普通市民生活息息相關的核心行政基礎設施,完全交由其他國家企業的伺服器和系統來處理,在國家層面上是一件非常令人不安的事情。
在這種不安之中,近年來全球最受矚目的核心議題便是「數位主權(Digital Sovereignty)」。數位主權不僅僅是進口並使用最新技術,而是國家或市民能夠完全掌握對技術和數據的控制權,不隨外部力量動搖的獨立權利。簡單來說,這就像是我們家大門的鑰匙是要自己保管,還是要永遠交給隔著大海的外國保全公司保管的差別。
用這種比喻來理解會容易得多。想像一下,你們村莊唯一的水源被遙遠海外的跨國礦泉水公司所壟斷。現在他們提供的水很甜美,而且水龍頭一開就源源不絕,非常方便。但是,如果有一天那家公司突然通知要把水價調漲十倍,或者淨水系統因為不明原因出了問題而流出泥水,那該怎麼辦?村民們將毫無辦法,只能忍受口渴,或者含淚接受不合理的要求。
因此,村民們決定集資在自己的土地上挖一口井,並建立一套透明管理的專屬淨水系統。這正是荷蘭投入巨大努力和資金開發 GPT-NL 所要達成的最終目標 [The Netherlands starts realisation GPT-NL..]。荷蘭政府做出了「數位自立」這個勇敢的選擇,以降低對美國大型科技系統的依賴,並親自設計出一個能取而代之的真正歐洲替代方案 [Dutch project GPT-NL could change how Europe thinks about AI]。
為了這項巨大的鑿井工程,荷蘭政府(經濟部轄下的 RVO)果斷地投入了 1,350 萬歐元(這筆龐大的公共預算足以建造一座最先進的大型圖書館) [Netherlands moves GPT-NL from lab to live: first pilots under …]。而且,團結在一起的不是追求企業利潤的商業公司,而是將公共利益放在首位的非營利研究機構。荷蘭應用科學研究院(TNO)、負責教育及研究的 IT 網路機構 SURF,以及荷蘭法醫學研究所(NFI)攜手合作,從基礎開始一步步建立這個獨立的荷蘭語 AI 生態系統 [GPT‑NL: a sovereign language model for the Netherlands]。終於在 2025 年 2 月,他們向世界宣告,專屬語言模型開發的宏大計畫正式啟航 [GPT-NL: Netherlands Builds Sovereign AI Language Model with …]。
輕鬆了解 (The Explainer)
那麼,荷蘭打造的這個 GPT-NL 在技術上與現有著名的對話型 AI 有什麼不同呢?最根本且決定性的差異在於填滿 AI 大腦的「食物(數據)」的純淨度。
近年來讓我們讚嘆並使用的大型 AI,為了變得更聰明,必須不斷吞噬海量的文本 Token(Token,語言模型讀寫文字的最小單位,就像樂高積木或拼圖碎片一樣)。為此,它們往往會肆無忌憚地吸收網際網路上流傳的數百萬篇新聞報導、個人部落格文章、圖片,甚至是別人傾注心血創作的小說來進行學習。這無可避免地導致了未經原作者同意的版權侵權爭議如影隨形,而且連開發者也不知道 AI 究竟是從哪裡、如何獲取知識的,產生了所謂的「黑箱」現象。
但是,荷蘭的 GPT-NL 從起跑線就完全不同。該計畫的創始人自豪地宣稱 GPT-NL 是「首個合法的語言模型」 [Founder GPT-NL: ‘First legal-compliant language model’]。GPT-NL 絕不學習任何透過黑暗管道或未經原作者許可所蒐集的數據。他們最大的武器和驕傲在於,這是首個完全只用經過明確同意程序、合法取得的所謂「乾淨數據」所訓練的大型荷蘭語 AI 模型 [Dutch news publishers contribute to developing GPT-NL]。
簡單來說,如果現有的大型 AI 是一位「雜食性主廚」,不管是在餐廳後巷的垃圾桶,還是別人家牆上的秘密食譜筆記,都照單全收、硬塞進腦袋裡學做菜;那麼 GPT-NL 就是一位「誠實透明的主廚」,只付合理的價格,親自從當地值得信賴的有機農場購買新鮮安全的食材,從基礎開始紮實地學習烹飪。
事實上,為了協助這位誠實主廚的誕生,荷蘭具代表性的新聞媒體(新聞發布者)挺身而出。為了讓 AI 能使用正確無誤的荷蘭語,並完美理解當地的時代背景和文化,他們欣然提供自己合法擁有、數量龐大的高品質新聞報導合集作為訓練數據,展開了合作 [[Large dataset news organizations for Dutch AI language model …](https://www.tno.nl/en/newsroom/2025/07/
參考資料
- GPT‑NL: a sovereign language model for the Netherlands
- GPT‑NL: a sovereign language model for the Netherlands
- GPT-NL opens up: Inside the Dutch bid for sovereign AI
-
[Sovereign AI & Digital Autonomy: GPT-NL Model in Den… AetherLink](https://aetherlink.ai/en/blog/sovereign-ai-digital-autonomy-gpt-nl-model-in-den-haag) - Founder GPT-NL: ‘First legal-compliant language model’
- GPT-NL: An introduction to the Dutch language model
- The Netherlands starts realisation GPT-NL..
- Dutch project GPT-NL could change how Europe thinks about AI
- Large dataset news organizations for Dutch AI language model …
- Netherlands moves GPT-NL from lab to live: first pilots under …
- GPT-NL: Netherlands Builds Sovereign AI Language Model with …
- Dutch news publishers contribute to developing GPT-NL
-
[News Security Delta (HSD)](https://securitydelta.nl/news/overview/gpt-nl-a-sovereign-language-model-for-the-netherlands)
- 隨機收集網際網路上的所有數據進行訓練。
- 首個完全僅使用合法獲取的數據進行訓練的大型模型。
- 專門為了軍事防禦目的而開發。
- 為了不依賴海外大型 IT 企業,完整確保國家的「數位主權」
- 為了打造出比美國最新 ChatGPT 更擅長解數學題的世界第一全能 AI
- 作為一項文化政策,旨在讓荷蘭語取代英語成為全球通用語
- 作為公共行政助手,在海牙市政廳協助引導市政法規、許可要求及政策
- 全球社群媒體平台的即時自動影片翻譯機
- 連結全歐洲自駕車的核心導航系統