Tag: 多模態

進入我筆記型電腦的 AI 助理,能看又能聽?「Gemma 4 12B」的秘密

Google 發布的全新 AI 模型 Gemma 4 12B 毋需複雜的翻譯過程,即可直接理解圖像、聲音與影片。本文將為您淺顯易懂地解說這項能在一般筆記型電腦上運作的驚人技術。

如果我的筆記型電腦能在沒有翻譯員的情況下理解世界的聲音和圖像呢?Google Gemma 4 12B 的秘密

深入淺出地了解 Google DeepMind 的最新開源模型 Gemma 4 12B,如何在一台配備 16GB 記憶體的普通筆記型電腦上同時處理文字、圖像與音訊。

我的筆記型電腦能同時理解視覺、聽覺和文字的 AI 誕生了?Google「Gemma 4 12B」的秘密

Google DeepMind 發表了能在筆記型電腦上運行的強大 AI「Gemma 4 12B」。這款無需編碼器即可一次處理圖片、影片和音訊的 AI 將如何改變我們的日常生活?我們將為您深入淺出地解析。

AI能看著我的電腦螢幕代替我工作?阿里巴巴 Qwen3.7-Plus 登場

過去只懂閱讀文字的AI,現在能看懂螢幕並移動滑鼠了。我們將淺顯易懂地為您解析,阿里巴巴全新推出的多模態智能體 Qwen3.7-Plus 將如何改變我們的工作方式。

無需網路也能在智慧型手機上運作?Google「Gemma 3」如何改變我們的口袋生活

以大眾視角深入淺出地介紹 Google 最新開放模型 Gemma 3 的特點、性能以及對我們日常生活的影響。

如你所說,隨心所畫?Google Gemini 2.0 Flash 開啟『影像生成』新大門

介紹 Google 最新 AI Gemini 2.0 Flash 的原生影像生成功能。以一般人的視角輕鬆解說這款能透過文字建立與編輯影像的多模態 AI 特點及應用案例。

手機裡的 AI 能看、能聽、還能說?Google 聰明的小老弟「Gemma 3n」故事

為您深入淺出地介紹 Google 的新 AI「Gemma 3n」,它能在沒有網路連線的情況下,直接在智慧型手機上理解影片與聲音,並探討它將為我們的生活帶來哪些變化。

您知道在電腦中擁有「眼睛」的 AI 嗎?Google 的新禮物「Gemma 3」隆重登場

本文將以大眾化的視角,深入淺出地介紹 Google 最新開放 AI 模型 Gemma 3 的特點、性能,以及它對我們生活的影響。

AI 現在會「思考」後再回答?探索 Google 最強模型「Gemini 2.5」

為您深入淺出地介紹 Google 最新 AI 模型 Gemini 2.5 如何像人類一樣思考並解決複雜問題,以及它將為我們的生活帶來哪些改變。

我手心中的聰明助手:Gemma 3n 登場——當人工智慧走進我們的口袋

為您輕鬆解說 Google 全新 AI 模型 Gemma 3n 的特點與優勢,以及它將如何改變我們在智慧型手機與筆記型電腦上的生活。

邊說邊畫?Google Gemini 2.0 Flash「原生圖像生成」實驗體驗記

Google 最新 AI Gemini 2.0 Flash 現在具備了在對話過程中直接生成和編輯圖像的功能。本文將為您深入淺出地解釋什麼是原生圖像生成,以及它將如何改變我們的生活。

我口袋裡的聰明助手:Google「Gemma 3n」如何改變我們的日常生活

深入淺出地介紹 Google 全新 AI 模型 Gemma 3n 的特色及其對生活的影響。這款模型能直接在手機上理解文字、圖片與聲音,且無需連接網路。

我手機裡的 AI 睜開『眼』了?Google 全新寶藏 Gemma 3 深度解密

Google 全新輕量級 AI 模型 Gemma 3 正式亮相。這款能同時理解文字與圖片,並精通 140 多種語言的模型將如何改變我們的日常生活?本文將以非專業人士也能秒懂的觀點為您輕鬆解讀。