开源AI助手Omi正式发布。它能记住用户所见所闻的一切,提供实时转录、摘要、生成行动项以及主动性建议。
“我刚才说什么来着?”现在AI帮您记忆
想象一下,在一次非常重要的业务会议中,老板连珠炮般地发布指令。你想记下来却手忙脚乱,想录音又担心事后重听太麻烦。或者你在YouTube上发现了一条非常有用的信息,几天后急需时,却怎么也想不起视频标题,感到非常懊恼?
我们每天接收海量信息,但遗憾的是,大脑只能记住其中一小部分。到目前为止,要使用ChatGPT或Claude这样的人工智能,我们必须费力地解释情况或截屏发送。但是,如果AI能在旁边观察你所看到的、听到的,并主动提供帮助,即使你一言不发,那会怎样呢?
今天向大家介绍的 Omi,正是一个旨在将这种魔幻想象变为现实的雄心勃勃的项目。开发者称其为“人生建筑师(Life Architect)”。来源 14 Omi会与您一起观察屏幕,倾听对话,成为一个能预先建议您下一步该做什么的得力伙伴。
为什么这很重要?“坐在身边的影子秘书”
我们在使用技术时感到的最大疲劳,反常地来自于“输入”。因为向AI传递信息的过程本身就成了另一项“工作”。Omi试图彻底消除这个繁琐的过程。
1. 像空气一样存在的AI(环境AI)
通常我们盯着手机屏幕寻找信息,却忽略了周围的情况。而Omi的理念恰恰相反:AI不是让用户受困于设备,而是像空气一样自然地融入日常生活(Ambient,环境化的),帮助用户更专注于当下的生活。来源 9 技术不再是干扰用户,而是在背后默默支持。
2. 记忆的无限扩展:“第二大脑”
Omi的官方文档中出现了一个非常有趣的表述,即将其定义为 “比第一大脑更值得信赖的第二大脑(A 2nd brain you trust more than your 1st)”。来源 15 人的记忆力会因情绪或身体状况而变得模糊,但以数据形式记录的AI却能完美记住我看到的每一个瞬间屏幕和每一个擦肩而过的对话。
通俗易懂:Omi是如何工作的?
用一句话概括,Omi就是 “看、听、记的人工智能助手”。来源 3 简单来说,你可以把它想象成一个实时接收你整个数字生活转播的秘书。
核心功能 3 种
- 实时眼睛(Screen Capture): 实时捕捉电脑或手机屏幕上的内容。就像AI在旁边和你一起看显示器,看你在读什么英文文章,写什么复杂的代码。
- 实时耳朵(Transcription): 实时倾听对话并立即转换为文字。这被称为转录(Transcription),它能细致地记录会议内容或与朋友的约定,不遗漏任何细节。来源 3
- 主动建议(Proactive Advice): 最令人惊讶的是,它会在用户询问之前主动提出建议。对话中提到“明天午饭怎么样?”,AI就会自动检查日历并生成行动项(Action Items)。来源 3
比喻看 Omi
Omi就像是 “共同体验我所有日常生活的秘书”。
- 传统AI: 如果要让秘书“总结昨天的会议内容”,我必须亲自找到录音文件并通过电子邮件发给秘书。
- Omi: 秘书昨天已经坐在会议室的旁边了。甚至在你询问之前,它就会主动搭话:“昨天约定的报告截止时间是今天下午3点。现在开始吗?”
开发者解释说,Omi是集市面上著名的AI工具(如Cluely, Rewind, Granola, ChatGPT, Claude等)优点于一身的结晶。来源 1
现状:贴在额头上的“数字之眼”?Omi独特的形象
Omi不仅在开发电脑程序,还在开发直接佩戴在身上的“可穿戴(Wearable)”设备。其形象相当具有颠覆性。
- 贴在额头上的大按钮: 据部分外媒报道,Omi可穿戴设备呈现出可以贴在额头上的大按钮形状。来源 5 它的目标很大胆,就像“第三只眼”一样阅读用户的想法(Mind reading)或倾听周围的对话,利落且高效地处理所需事务。来源 18
- 任何人都能使用的“开源”: 即使没有这个独特的设备,也无需感到遗憾。Omi是以开源(Open-source,任何人都可以查看程序设计图的方式)开发的,仅通过桌面或智能手机应用就能充分体验其能力。来源 6
- 充满热情的开发过程: Omi的桌面版本是在约4个月(大约一个大学学期)的短时间内集中开发完成的。来源 17 开发者表示,因为想制作一个“自己最需要的工具”,所以启动了这个项目。来源 6
未来会怎样?我们将面对的新景象
当像Omi这样的技术完全融入我们的生活,会带来什么样的变化?
首先,“搜索”这一行为本身可能会消失。 我们不再需要在搜索框中输入“上次看到的那篇文章标题是什么?”,而是直接对AI说“帮我找一下前天看到的那个有蓝色图表的文档”。因为AI已经把你看到的所有内容都存入了记忆库。来源 15
其次,工作流程不会中断。 会议结束后回到座位,你会发现AI整理好的摘要已经送达,你的待办事项也已自动注册到日历中。人类将从“整理”这种体力活中解放出来,专注于“创意判断”。
当然,对于全天候监视日常生活的AI,隐私侵犯的担忧也确实存在。对此,Omi团队正通过透明公开所有源代码的开源方式,努力让用户能够放心并信赖这项技术。来源 6
AI视角:MindTickleBytes AI记者的观点
“Omi象征着人工智能从‘工具’向‘伴侣’跨越的重要转折点。如果说以前的AI是必须我们下达命令才会行动的被动存在,那么现在它正试图成为能够自主解读生活语境并主动伸出援手的主动型伙伴。贴在额头上的设备形式目前看起来可能有些奇怪和生疏,但随着技术与我们身体的结合更加紧密,我们将享受到的‘智能价值’将超乎想象。最终,我们正迈向一个‘无须担心遗忘的世界’。”
参考资料
-
[Show HN: Omi – watches your screen, hears conversations, tells you what to do Hacker News](https://news.ycombinator.com/item?id=47784914) - GitHub - BasedHardware/omi: AI that sees your screen, listens to your conversations and tells you what to do · GitHub
- omi/README.md at main · BasedHardware/omi
- wearable AI device ‘omi’ reads minds, hears conversations and completes tasks users think of
-
[Show HN: Omi – Open-source AI wearable for capturing conversations Hacker News](https://news.ycombinator.com/item?id=41333648) - r/hackernews on Reddit: Show HN: Omi – Open-source AI wearable for capturing conversations
-
[Omi LinkedIn](https://www.linkedin.com/company/omidotme) - Show HN: Omi - watches your screen, hears conversations, tells you what …
- AI that sees your screen, listens to your conversations and tells you …
- Show HN: Omi - watches your screen, hears conversations, tells you what …
- Omi: This wearable could read your brain, help flirt, ace exams
FACT-CHECK SUMMARY
- Claims checked: 14
- Claims verified: 14
- Verdict: PASS
- 实时对话转录(记录)
- 捕获并记忆用户屏幕
- 自动发送垃圾邮件
- 生成行动项(Action Items)
- 比自己更值得信赖的‘第二大脑’
- 听话的人工智能小狗
- 如影随形的监控摄像头
- 智能计算器
- 戴在手腕上的手表形状
- 贴在额头上的大按钮形状
- 挂在耳朵上的耳机形状
- 像眼镜一样的佩戴方式