開源 AI 助手 Omi 正式發表,它能記得使用者所見所聞的一切,提供即時逐字稿、摘要、生成行動清單以及先發制人的建議。
「我剛才說了什麼?」 現在 AI 幫你記住
想像一下,在一次非常重要的商務會議中,上司以閃電般的速度交辦任務。想動手記錄卻手忙腳亂,想錄音又擔心事後重新聽取太過耗時。或者,你在 YouTube 上發現了非常有用的資訊,但幾天後真正需要時,卻怎麼也想不起那段影片的標題,感到非常懊惱。
我們每天都會看到、聽到海量的資訊,但遺憾的是,我們的大腦只能記住其中的一小部分。到目前為止,若想使用 ChatGPT 或 Claude 這樣聰明的人工智慧,我們必須親自說明情況或擷取螢幕畫面發送給它。但是,如果 AI 能在身旁默默觀察你所看到的畫面、傾聽你與誰對話,並在你開口前就主動提供協助,那會如何呢?
今天介紹的 Omi 正是一個試圖將這種魔法般的想像變為現實的雄心勃勃的專案。開發者稱這款工具不僅僅是軟體,而是「人生建築師 (Life Architect)」。 來源 14 Omi 會與你一起看螢幕、傾聽對話,並成為預先建議你下一步該做什麼的可靠夥伴。
為什麼這很重要?「坐在我身邊的影子秘書」
我們在使用科技時感受到的最大疲勞,諷刺地說,正是來自於「輸入」。因為將資訊傳達給 AI 的過程本身就成了另一項「工作」。Omi 試圖完全消除這個麻煩的過程。
1. 如空氣般存在的 AI (Ambient AI)
通常我們會全神貫注地盯著智慧型手機螢幕尋找資訊,因而錯過周遭的情況。但 Omi 的哲學恰恰相反。它的目標是讓 AI 像空氣一樣自然地融入日常生活(Ambient,環境化的),讓使用者不再受限於裝置,而是能更專注於當下的生活。 來源 9 技術不再干擾使用者,而是默默地在背後提供支援。
2. 記憶的無限擴張:「第二大腦」
Omi 的官方文件中出現了一個非常有趣的表達方式。那就是定義為 「比你的第一大腦更值得信賴的第二大腦 (A 2nd brain you trust more than your 1st)」。 來源 15 人的記憶力可能會因情感或身體狀況而變得模糊,但以數據記錄的 AI 卻能完美記住所見過的每一個瞬間畫面,甚至是擦身而過的對話。
輕鬆理解:Omi 是如何運作的?
一言以蔽之,Omi 就是 「能看、能聽且能記住的人工智慧助手」。 來源 3 簡單來說,你可以把它想像成一個能即時同步觀看你整個數位生活的秘書。
三大核心功能
- 即時之眼 (Screen Capture): 即時擷取電腦或智慧型手機螢幕上發生的事情。就像 AI 坐在你旁邊,看著你正在閱讀哪篇英文報導,或是正在編寫什麼複雜的程式碼。
- 即時之耳 (Transcription): 即時傾聽對話並立即轉化為文字。這被稱為轉錄 (Transcription),它會仔細記錄會議內容或與朋友的約定,確保不會遺漏。 來源 3
- 主動建議 (Proactive Advice): 最令人驚訝的一點是,它會在使用者詢問前就提出建議。如果在對話中提到「明天吃午餐如何?」,AI 會自動檢查日曆並建立行動清單 (Action Items)。 來源 3
用比喻看 Omi
Omi 就像是 「與我共同經歷所有日常生活的秘書」。
- 傳統 AI: 若想讓秘書「摘要昨天的會議內容」,我必須親自找到錄音檔並透過電子郵件寄給秘書。
- Omi: 秘書昨天已經坐在會議室我旁邊的位置上了。在我詢問前,它就會主動提醒:「昨天約定的報告截止日期是今天下午 3 點,要現在開始處理嗎?」
開發者解釋,Omi 是吸取了市面上知名 AI 工具(如 Cluely、Rewind、Granola、ChatGPT、Claude 等)的所有優點,並將其合而為一的結晶。 來源 1
現況:貼在額頭上的「數位之眼」?Omi 的獨特面貌
Omi 不僅開發了電腦程式,還在開發可直接佩戴在身上的「穿戴式 (Wearable)」裝置。其外觀相當前衛。
- 貼在額頭上的大按鈕: 根據部分外媒報導,Omi 穿戴式裝置呈現貼在額頭上的大按鈕形狀。 來源 5 就像「第三隻眼」一樣,這款裝置有著大膽的目標:讀取使用者的想法 (Mind reading) 或傾聽周遭對話,並利落地處理所需的任務。 來源 18
- 人人皆可使用的「開源」: 即使沒有這款獨特的裝置也不必失望。Omi 是以開源 (Open-source,任何人都能查看程式設計圖的方式) 進行開發的,因此僅透過桌面或智慧型手機應用程式,也能充分體驗其能力。 來源 6
- 充滿熱情的開發過程: Omi 的桌面版本是在約 4 個月的短時間內(大約是一個學期的時間)集中開發完成的。 來源 17 開發者表示,因為想製作一個「比任何人都更需要、更適合自己的工具」,所以啟動了這個專案。 來源 6
未來會如何?我們將面對的新景象
當像 Omi 這樣的技術完全融入我們的生活時,會帶來什麼樣的變化?
第一, 「搜尋」行為本身可能會消失。 不再需要在搜尋框輸入「上次看到的那篇報導標題是什麼?」,而是只需對 AI 說「幫我找一下前天看過的那份有藍色圖表的圖表」,一切就結束了。因為 AI 已經將我所見過的一切都存入了記憶倉庫。 來源 15
第二, 工作流程不會被打斷。 會議結束後回到座位,人工智慧整理好的摘要可能已經送達,我需要做的事情也會自動註冊到日曆中。人類將從「整理」這項勞動中解放出來,只需專注於「創意判斷」。
當然,對於 24 小時監視日常生活的 AI,必然存在侵犯隱私的疑慮。對此,Omi 團隊正試圖透過公開所有原始碼的開源方式,讓使用者能安心並信賴這項技術。 來源 6
AI 的觀點:MindTickleBytes AI 記者的觀點
「Omi 象徵著人工智慧從『工具』過渡到『伴侶』的重要轉折點。如果說之前的 AI 是必須由我們下達命令才會行動的被動存在,那麼現在它正試圖成為能自動讀取生活情境並主動伸出援手的主動夥伴。雖然貼在額頭上的裝置形式現在看起來有些陌生且新奇,但隨著技術與我們身體的貼合度越高,我們所能享受到的『智能價值』將超出想像。最終,我們正邁向一個『不再擔心遺忘的世界』。」
參考資料
-
[Show HN: Omi – 監看你的螢幕、傾聽對話並告訴你該做什麼 Hacker News](https://news.ycombinator.com/item?id=47784914) - GitHub - BasedHardware/omi: 會看螢幕、聽對話並告訴你該做什麼的 AI · GitHub
- omi/README.md at main · BasedHardware/omi
- 穿戴式 AI 裝置 ‘omi’ 能讀心、聽對話並完成使用者所想的任務
-
[Show HN: Omi – 用於記錄對話的開源 AI 穿戴式裝置 Hacker News](https://news.ycombinator.com/item?id=41333648) - r/hackernews on Reddit: Show HN: Omi – 用於記錄對話的開源 AI 穿戴式裝置
-
[Omi LinkedIn](https://www.linkedin.com/company/omidotme) - Show HN: Omi - 監看你的螢幕、傾聽對話並告訴你該做什麼 …
- 會看螢幕、聽對話並告訴你該做什麼的 AI …
- Show HN: Omi - 監看你的螢幕、傾聽對話並告訴你該做什麼 …
- Omi:這款穿戴式裝置能讀取你的大腦、協助調情、應付考試
FACT-CHECK SUMMARY
- Claims checked: 14
- Claims verified: 14
- Verdict: PASS
- 即時對話逐字稿(紀錄)
- 擷取並記憶使用者螢幕畫面
- 自動發送垃圾郵件
- 生成行動清單 (Action Items)
- 比自己更值得信賴的第二大腦
- 聽話的人工智慧小狗
- 隨處跟隨的監視攝影機
- 聰明的計算機
- 戴在手腕上的手錶形狀
- 貼在額頭上的大按鈕形狀
- 掛在耳朵上的耳機形狀
- 像眼鏡一樣配戴的形狀