如果AI分析涉及數十億資金的金融文件？「可驗證的AI」登場

AI Summary

金融研究新創公司Kepler並非單獨使用AI模型Claude，而是將其限制在嚴格的控制系統中，藉此建構出能通過金融界嚴格審計與監管的高可靠性AI系統。

想像一下。你是管理數百億客戶資產的全球投資銀行的負責人。每天早上，你的辦公桌上堆滿了數十家企業發行的數千張財務報表和厚厚的投資報告，堆積如山。為了分析這些龐大的資料，你引進了號稱世上最聰明的最新AI助理。

一大早，你向AI指示：「幫我整理A企業去年第四季的實質負債比率」。AI在短短3秒內就產出了一份包含清晰表格與圖表的報告。你深信這個數字，並按下了巨額投資的按鈕。

然而幾天後，發現那個數字是AI誤解上下文而捏造的「看似合理的謊言」。公司遭受了天文數字的損失，金融監管當局立即展開調查。面對調查員尖銳的問題：「為什麼會做出這種致命的決定？」，你能回答「因為AI是這樣分析的」嗎？

絕對不可能。這正是全球華爾街與金融界在面對大型語言模型（LLM，一種學習大量文字數據以像人類一樣理解並生成句子的AI技術）的驚人能力時，依然猶豫不決、不敢輕易投入資金的核心原因。在一個小小的計算錯誤就可能導致致命金錢損失的金融產業中，將決定權交給判斷過程不透明的AI，無異於蒙上眼睛以時速200公里在高速公路上狂飆的「危險賭博」。

然而最近，出現了一個平息這個如鐵壁般金融界普遍不安感的突破性案例。那就是專注於為可靠的金融服務建構「可驗證的AI（Verifiable AI）」平台的研究型新創公司Kepler的故事 [出處標題]。他們究竟是如何在瞬間擄獲保守又挑剔的金融界的心呢？

這為什麼重要？（Why It Matters）

你可能看過我們日常為了好玩而使用的聊天機器人AI，偶爾會說出「世宗大王丟擲MacBook」這類荒謬的話。這在專業術語中被稱為AI幻覺（Hallucination）。在與朋友的日常對話或輕鬆的寫作中，這可能只是個一笑置之的小插曲，但在不容許哪怕一塊錢誤差的金融界，這卻是攸關公司存亡的重大事故。

金融服務公司在我們想像不到的嚴格且令人窒息的監管環境中運作。特別是為了滿足如巴西中央銀行（Banco Central）或證券交易委員會（CVM）等強大金融當局的指導方針與監管要求，公司所做出的所有財務判斷與決定都必須有明確的依據，且隨時可以進行回溯調查 [出處標題]。

光是「最終計算結果正確」是遠遠不夠的。必須像在數學考試中寫下解題過程一樣，能夠詳細證明「基於哪些數據、經過何種計算公式、為何得出這個結果」，這種「可審計性（Auditability）」就是生命線。

在這個必須滿足全球最嚴苛監管與審計要求、如履薄冰的金融環境中，Kepler以Anthropic的AI模型「Claude」作為核心大腦，成功打造出他們獨創且安全的AI平台 [出處標題]。他們的成功，對於「金融界真的能完全信任並使用反覆無常的AI嗎？」這個根本性的問題，給出了最現實、最典範的解答，這對資訊科技（IT）產業與金融界雙方都具有非常重要的意義。

輕鬆理解：將越野車放上火車軌道

那麼，Kepler是如何將雖然是天才但偶爾會犯下荒唐錯誤的AI，轉變為「絕對不說謊、值得信賴的金融專家」的呢？其驚人的秘密不在於專注於提升AI的智慧，而是徹底改變了對待AI的哲學。

Kepler團隊透過與開發Claude的Anthropic進行深入的案例研究，得出了一個非常重要的結論並分享出來。那就是「在金融領域，絕對不能讓AI模型單獨成為整個系統本身」 [出處標題]。換句話說，他們體悟到不該給予不可預測的AI無限的自由。

為了解決這個致命的問題，Kepler建構了一個緊密包圍人工智慧的「決定論式基礎設施（Deterministic Infrastructure）」。簡單來說，這個基礎設施扮演著強大的「信任與驗證控制防護層（Layer）」的角色，防止AI產生其他念頭或做出意料之外的行為 [出處標題]。

專家們口中這個困難的概念「決定論式基礎設施」，可以這樣比喻：一般的AI技術就像一輛性能優越的「越野車」，可以漫無目的地在山林或田野中自由奔馳。它雖然快速且強大，但只要稍微失去控制，就不知會失控衝向何方，總是存在著墜落懸崖的風險。相反地，Kepler建構的決定論式基礎設施，就像是直接拆掉這輛高性能車輛的橡膠輪胎，把它放在已經設定好目的地的堅固「鋼鐵軌道（火車鐵軌）」上。保留AI強大的引擎動力（卓越的語言處理與文件分析能力），但利用人類制定的嚴格且決定性的規則，完美限制了車輛可以移動的方向與必須停止的地方。

輕鬆理解：教聰明的工讀生如何說「不知道」

Kepler不只是限制AI的路徑，他們更進了一步。他們沒有盲目地丟給AI一項龐大的任務說：「把這100頁厚厚的財務報表全部分析完並給出結論」，而是將工作切得很細，只依序指示「精確定義的任務（Precisely defined tasks）」。

此外，他們預先為AI提供了系統化的金融領域複雜專業知識與術語詞典，將AI必須自行判斷的不確定性領域降到最低。其中最令人印象深刻且最核心的部分是，他們嚴格設定了AI應自行判斷並「解決的問題（Resolve）」，以及判斷超出自身能力而必須「上報（Escalate）」給人類專家的問題之間的「硬性界線（Hard boundaries）」 [出處標題]。

我們同樣用日常情境來解釋這一點。假設你在銀行的貸款櫃台雇用了一位心算能力無人能及的天才工讀生（AI）。這位員工雖然是數字計算的天才，但對於錯綜複雜的金融法規中微妙的語境或客戶隱藏的意圖卻不太了解。在這種情況下，沒有任何一位老闆會將銀行所有的貸款審查權限全權委託給這位新進員工。

相反地，老闆會給他一份嚴格的行為指南：「你只能負責確認客戶的基本身分資訊，以及文件中簡單的數字計算並確實處理好（解決）；但只要發現稍微可疑的偽造文件，或者遇到100萬元以上的大額貸款審批案件，不要自己判斷，必須無條件把審批文件交給我（轉交給人類）」。Kepler運用Claude的方式正是如此。即使它很聰明，也不會讓它獨自判斷所有事情。矛盾的是，讓AI能明確劃出界線，說出「接下來的部分我不太清楚，人類專家，請幫幫我」，這正是金融界能夠100%信任AI的最大秘訣。

現況：連複雜註腳（Footnotes）也能解讀的執著

被套上如此堅固的項圈與明確指導方針的Claude，在Kepler的控制系統中展現了驚人的能力。現在，在競爭激烈的金融界現場，實際要求的絕不是簡單的新聞文章摘要或寫寫問候語。

關於這一點，如果要了解Kepler的平台究竟是為了什麼實務目的而打造，聽聽在相關產業最前線工作的專家聲音，就能最準確地掌握現況。最近一位業界專家如此強調：「現在金融界所有關於AI的對話都聚焦在『能力（Capability）』上。模型是否能妥善處理複雜的多階段分析（Multi-step analysis）？是否能仔細閱讀寫在文件角落的註腳（Footnotes，正文下方用小字寫的補充說明）？這正是我們打造Kepler的原因。」 [出處標題]

一般人通常不會仔細閱讀就略過，但在決定龐大資金投資與貸款的金融文件中，註腳可能成為致命的毒藥，也可能成為黃金鑰匙。例如，在企業報告的正文中，可能用大字體華麗地寫著「今年營業利益增加了100億元」，但在最底部肉眼幾乎看不見的極小字體註腳中，卻寫著「然而，這是與本業無關的一次性工廠土地出售所得」。這是連人類疲累時都很容易錯過的部分。

過去訓練不夠嚴謹的AI往往不懂得這種微小細節的重要性，只會掌握整體氛圍然後含糊帶過。然而，被賦予明確任務與徹底分階段控制系統的Kepler版Claude，不僅能處理必須經過多重階段的複雜財務推論，甚至能準確點出隱藏註腳的含義對整體財務狀況的影響。這不僅減少了人類的失誤，更完美阻斷了AI的弱點。

未來會如何發展？（What’s Next）

Kepler這次的成果，絕不會只是一家具備優良技術的金融科技新創公司的曇花一現。他們堅定展現的「可驗證的AI」平台設計架構，未來將為許多對導入AI猶豫不決的產業帶來巨大的變革之風。

特別是不僅限於金融業，包含醫療、法律、國防、製藥等，任何一個小錯誤都可能奪去人命或直接導致巨大財產損失的「高風險、高監管」產業群，Kepler的方法都將成為絕佳的教科書與藍圖。為了防止醫生誤診而經過徹底邏輯驗證階段的醫療用AI，或者在分析數萬件法律判例時必須將幻覺現象控制在0%的法律AI等，都將採用這種「決定論式基礎設施」。

過去我們一直只熱衷於AI模型本身變得多像人類般聰明，或是學習了多少數據。但Kepler明確證明了，真正的產業創新，取決於「如何將這種卓越的智慧裝進安全且可控制的籃子裡，並應用於不穩定的現實世界中」。

未來，全球AI企業的競爭舞台將完全改變。核心典範將迅速從「誰能打造出更像擅長寫詩或小說的人類的AI」，轉移到「誰能打造出在面對嚴苛政府審計員尖銳提問時，能提出完美依據公式進行防禦的AI系統」。

MindTickleBytes AI 的觀點
技術的發展常常像是一輛沒有煞車的頂級跑車，令人感到暈眩且危險。在創新的名義下如果只執著於速度，往往容易忽略掉「信任」這條最重要的安全帶。

然而，Kepler的案例非常清楚地展現出，AI真正的價值與爆發力並非來自「無限的自由與自主性」，矛盾的是，它反而是在「精巧的控制與明確的界限設定」中綻放的。宣稱要完美替代人類判斷而獨自失控狂奔的AI，絕對無法跨越監管的厚重高牆。

取而代之的，是在人類縝密設計的嚴格規則與藩籬中，默默彌補人類無法避免的弱點（時間不足、體力下降、面對龐大數據時注意力減退），一種透明且可驗證的工具。這將是我們在現實中將會迎接的最理想、最安全的未來AI模型。人工智慧要真正融入我們生活核心基礎設施的最後一道關卡，終究不是「智慧」的高低，而是「信任」的深度。

參考資料

Share this article:

測試你的理解

Q1. Kepler為金融服務導入的AI模型，其核心基礎是什麼？

自行做出所有決定的自主型AI
在決定論式基礎設施上運作的Claude
旨在規避審計的語言模型

Kepler利用了Anthropic的Claude，但將其建構在被稱為「決定論式基礎設施」的嚴格控制系統之上，以確保其可靠性。

Q2. Kepler平台與一般聊天機器人AI最大的不同點是什麼？

學習了更多網路幽默。
嚴格區分AI要解決的問題與應交由人類處理的問題。
自動忽略所有監管機構的檢查。

Kepler嚴格設定了AI應自行解決的領域與應上報（escalate）給人類專家的領域之間的界線。

Q3. 在金融領域使用AI時，本文強調的最重要因素是什麼？

文章生成的創造力
流行語的使用頻率
可審計性與合規性

由於金融界受到央行等機構的嚴格審計，因此能夠追蹤並驗證AI判斷過程的「可審計性」是不可或缺的。