ユーザーが見聞きするすべてを記憶し、リアルタイムの文字起こし、要約、アクションアイテムの生成、そして先回りしたアドバイスを提供するオープンソースAI秘書「Omi」が公開されました。
「さっき自分は何て言ったっけ?」これからはAIが代わりに覚えてくれます
想像してみてください。非常に重要な仕事のミーティング中に、上司が電光石火の速さで指示を出してきます。書き留めようとしても手が追いつかず、録音しても後で聞き直すのが億劫になります。あるいは、YouTubeで本当に役立つ情報を見つけたのに、数日後にいざ必要になった時、その動画のタイトルがどうしても思い出せなくて、もどかしい思いをしたことはありませんか?
私たちは毎日膨大な量の情報を見て聞いていますが、残念ながら私たちの脳はその中のごく一部しか記憶できません。これまでChatGPTやClaudeのような賢い人工知能を活用するには、私たちが一々状況を説明したり、画面をキャプチャして送ったりする手間が必要でした。しかし、わざわざ口を開かなくても、自分が何を見て誰と会話しているのかをAIがそばで見守り、自動的に助けてくれるとしたらどうでしょうか?
今日ご紹介するOmi(オミ)は、まさにそんな魔法のような想像を現実にしようとする野心的なプロジェクトです。開発者はこのツールを単なるソフトウェアではなく、「ライフアーキテクト(Life Architect)」と呼んでいます。Source 14 Omiはあなたの画面を一緒に見て会話に耳を傾け、あなたが次に何をすべきか事前にアドバイスしてくれる心強いパートナーになってくれます。
なぜこれが重要なのでしょうか? 「隣に座っている影の秘書」
私たちが技術を使いながら感じる最大の疲労感は、逆説的に「入力」から来ます。AIに情報を伝えるプロセス自体が、もう一つの「仕事」になってしまうからです。Omiはこの煩わしいプロセスを丸ごと無くしてしまおうとしています。
1. 空気のように存在するAI(Ambient AI)
通常、私たちはスマートフォンの画面を凝視して情報を探すあまり、周囲の状況を見失いがちです。しかし、Omiの哲学はその正反対です。ユーザーがデバイスに縛られる代わりに、AIが日常生活の中に空気のように自然に溶け込み(Ambient、周囲に存在する)、ユーザーが現在の生活により集中できるように助けることが目標です。Source 9 技術がユーザーを邪魔するのではなく、後ろで黙々と支えてくれるわけです。
2. 記憶の無限の拡張: 「第2の脳」
Omiの公式ドキュメントには非常に興味深い表現が登場します。それは、「あなたの第1の脳よりも信頼できる第2の脳(A 2nd brain you trust more than your 1st)」という定義です。Source 15 人間の記憶力は感情や体調によって曖昧になることもありますが、データとして記録されるAIは、私が見たすべての瞬間の画面やすれ違った会話までも完璧に記憶できるからです。
簡単に理解する: Omiはどのように機能しますか?
Omiを一言で定義するなら、「見て聞いて記憶する人工知能秘書」です。Source 3 簡単に言えば、あなたのデジタル生活全体をリアルタイムで中継される秘書だと考えてください。
3つの核心機能
- リアルタイムの目(Screen Capture): コンピュータやスマートフォンの画面で起きていることをリアルタイムでキャプチャします。自分がどんな英語の記事を読んでいるのか、どんな複雑なコードを書いているのか、AIが隣で一緒にモニターを見ているのと同じです。
- リアルタイムの耳(Transcription): 会話をリアルタイムで聞き、それを即座に文字に起こします。これは「文字起こし(Transcription、話し声をテキストに変える作業)」と呼ばれます。会議の内容や友人との約束を逃さず、事細かに記録しておきます。Source 3
- 能動的なアドバイス(Proactive Advice): 最も驚くべき点は、ユーザーが尋ねる前に先に提案することです。会話の中で「明日のランチはどう?」という言葉が出ると、AIが勝手にカレンダーをチェックし、アクションアイテム(Action Items)を作成してくれます。Source 3
比喩で見るOmi
Omiはまさに「自分の日常すべてを共に体験する秘書」のようです。
- 従来のAI: 秘書に「昨日の会議の内容を要約して」と頼むには、自分で録音ファイルを探して秘書にメールで送る必要がありました。
- Omi: 秘書がすでに昨日の会議室の隣の席に座っていました。自分が尋ねる前に「昨日約束されたレポートの締め切りは、今日の午後3時です。今から始めましょうか?」と先に話しかけてくるようなイメージです。
開発者は、Omiが市場に出回っている有名なAIツール(Cluely, Rewind, Granola, ChatGPT, Claudeなど)の長所だけを巧みに選んで一つにまとめた結晶体だと説明しています。Source 1
現状: 額に貼る「デジタルな目」? 独特なOmiの姿
Omiはコンピュータ内のプログラムだけでなく、体に直接装着する「ウェアラブル(Wearable)」デバイスとしても開発されています。その姿はかなり衝撃的です。
- 額に貼る大きなボタン: 一部の海外メディアによると、Omiウェアラブルデバイスは額に貼ることができる大きなボタンのような形をしています。Source 5 まるで「第3の目」のように、このデバイスがユーザーの考えを読み取ったり(Mind reading)、周囲の会話を聞いて必要なタスクをテキパキと処理してくれるという、大胆な目標を掲げています。Source 18
- 誰でも使える「オープンソース」: この独特なデバイスがなくても、がっかりする必要はありません。Omiはオープンソース(Open-source、プログラムの設計図を誰でも見られるように公開する方式)で開発されており、デスクトップやスマートフォンアプリだけでも十分にその能力を体験できます。Source 6
- 情熱的な開発プロセス: Omiのデスクトップ版は、約4ヶ月という短い期間(大学の1学期分くらいの期間ですね)で集中的に開発され完成しました。Source 17 開発者は他の誰よりも「自分自身が最も必要とするツール」を作りたいと考え、このプロジェクトを始めたそうです。Source 6
今後はどうなる? 私たちが目にする新しい風景
Omiのような技術が私たちの生活に完全に定着すると、どのような変化が訪れるでしょうか?
第一に、「検索」という行為そのものが消えるかもしれません。 「この前見たあの記事のタイトルは何だったっけ?」と検索窓を叩く代わりに、AIに「一昨日見た、青い図表があったドキュメントを探して」と言えば終わりです。AIがすでに私が見たすべてのものを記憶の貯蔵庫に収めているからです。Source 15
第二に、仕事の流れが途切れません。 会議が終わって席に着くと、すでに人工知能が整理した要約が届いており、自分がすべきことは自動的にカレンダーに登録されているでしょう。人間は「整理」という労働から解放され、「クリエイティブな判断」だけに集中できるようになります。
もちろん、24時間、自分の日常を見守るAIに対するプライバシー侵害の懸念も確かに存在します。これに対し、Omiチームはすべてのソースコードを透明に公開するオープンソース方式を通じて、ユーザーが安心して技術を信頼できるように努力しています。Source 6
AIの視点: MindTickleBytes AI記者の視点
「Omiは人工知能が『ツール』から『パートナー』へと移行する重要な転換点を象徴しています。これまでのAIが、私たちが命令を下して初めて動く受動的な存在だったとすれば、これからは私たちの生活の文脈を自ら読み取り、先に手を差し伸べる能動的なパートナーになろうとしています。額に貼るデバイスの形態は、今すぐ見ると少し奇妙で生硬に感じるかもしれませんが、技術が私たちの体に密着すればするほど、私たちが享受する『知能の価値』は想像以上に大きくなるでしょう。結局のところ、私たちは『忘れる心配のない世界』へと進んでいるわけです。」
参考資料
-
[Show HN: Omi – あなたの画面を見て、会話を聞き、何をすべきか教えてくれる Hacker News](https://news.ycombinator.com/item?id=47784914) - GitHub - BasedHardware/omi: あなたの画面を見て、会話を聞き、何をすべきか教えてくれるAI · GitHub
- BasedHardware/omi の main ブランチにある README.md
- ウェアラブルAIデバイス「omi」が思考を読み取り、会話を聞き、ユーザーが考えたタスクを完了させる
-
[Show HN: Omi – 会話をキャプチャするためのオープンソースAIウェアラブル Hacker News](https://news.ycombinator.com/item?id=41333648) - Reddit上の r/hackernews: Show HN: Omi – 会話をキャプチャするためのオープンソースAIウェアラブル
-
[Omi LinkedIn](https://www.linkedin.com/company/omidotme) - Show HN: Omi - あなたの画面を見て、会話を聞き、何をすべきか教えてくれる…
- あなたの画面を見て、会話を聞き、何をすべきか教えてくれるAI…
- Show HN: Omi - あなた의 画面を見て、会話を聞き、何をすべきか教えてくれる…
- Omi: このウェアラブルはあなたの脳を読み取り、ナンパを助け、試験で最高点を取るのを助ける可能性がある
FACT-CHECK SUMMARY
- Claims checked: 14
- Claims verified: 14
- Verdict: PASS
- リアルタイムの会話の文字起こし(記録)
- ユーザー画面のキャプチャと記憶
- 自動でのメールスパム送信
- アクションアイテム(Action Items)の生成
- 自分よりも信頼できる第2の脳
- 言うことをよく聞く人工知能の子犬
- どこまでもついてくる監視カメラ
- 賢い計算機
- 手首に巻く時計型
- 額に貼る大きなボタン型
- 耳にかけるイヤホン型
- 眼鏡のようにかける型