谷歌打造的'天才实习医生' AI，MedGemma 免费开放了？

AI Summary

谷歌发布了能够同时理解医疗文本和图像的高性能开源 AI 'MedGemma'，为所有人开发安全、智能的医疗服务开辟了道路。

想象一下。深夜，由于突如其来的疼痛，你慌忙赶到医院急诊室。医生因为要照顾数百名患者而显得疲惫不堪，但在他身边，有一位 24 小时待命、永不疲倦的“天才助手”。这位助手能在 1 秒钟内读完患者几年前的病历，从刚拍的 X 光片中发现极其微小的异常迹象并提醒医生。此外，它还能立即将充满复杂医学术语的处方翻译成患者易于理解的日常语言。

让这种电影般的场景变为现实的主角，正是谷歌 DeepMind (Google DeepMind) 最近发布的 “MedGemma”。MedGemma：我们最强大的健康 AI 开发开放模型 MedGemma 不仅仅是一个口才好的聊天机器人，它是为了解决医疗现场复杂且严苛的问题而经过特殊训练的智能 AI 模型。

为什么这很重要？“公开秘密配方”

医疗领域关乎人的生命，因此准确性比任何地方都重要，同时保护患者隐私的安全也是重中之重。到目前为止，大多数性能卓越的 AI 模型通常是“封闭型”的，只在大型企业的服务器内部运行，外界无法了解其内部结构，也难以随意使用。

然而，MedGemma 却果断地以 “开放模型 (Open Model)” 的形式公开了。[MedGemma

健康 AI 开发者基础

Google for …](https://developers.google.com/health-ai-developer-foundations/medgemma)

为什么这对我们来说是个重要的消息？打个比方，这就好比世界顶级的餐厅将他们的“秘密配方”免费分享给了全世界的厨师。现在，各地区的医院或研究所可以根据自己的环境对这个配方（MedGemma 模型）进行微调。特别是，医院可以在自有的计算机系统中安全地运行 AI，而无需担心患者宝贵的个人信息泄露到外部服务器。MedGemma 是为医疗文本优化的开放模型集合…

轻松理解：MedGemma 的两大“超能力”

MedGemma 与其他普通 AI 的主要区别在于以下两点：

1. 拥有眼睛和耳朵的 AI (多模态, Multimodal) 如果说普通的 AI 是只能读书的“学者”，那么 MedGemma 则具备了同时理解文字（文本）和图像（医疗影像）的能力。谷歌发布 MedGemma：用于医疗文本和图像的开放 AI 模型… 简单来说，它可以一边阅读医生撰写的诊疗病例，一边分析患者的 MRI 或 X 光片。对于“这张照片中出现的阴影是否与患者诉说的疼痛部位有关？”这类复杂问题，它能结合两项数据给出答案。MedGemma 技术报告 - arXiv.org

2. 解释答案理由的 AI (临床推理, Clinical Reasoning) MedGemma 不仅仅是背诵记忆的知识，它还懂得在复杂情况下逻辑性地思考“为什么会得出那样的结论”。MedGemma 会根据医学依据解释自己的判断理由，甚至会为自己的回答给出确信度评分。MedGemma 技术报告 - rivista.ai 这就像一位熟练的实习医生向教授条理清晰地报告诊疗内容一样。

现状：来到我们身边的 MedGemma 军团

谷歌准备了多个版本的 MedGemma，以便根据医院的情况或所使用的设备性能进行选择。

MedGemma 1: 分为两个级别。一种是像智能手机应用一样轻便快速运行的“40 亿参数 (4B)”版本，另一种是像脑子里装着整个图书馆、能处理极其复杂任务的“270 亿参数 (27B)”版本。[MedGemma

健康 AI 开发者基础

Google for …](https://developers.google.com/health-ai-developer-foundations/medgemma) 这里的参数是指 AI 的“脑细胞连接点”，数字越大代表能处理越深奥、广泛的知识，但也需要性能更好的计算机。

MedGemma 1.5: 这是今年 1 月新推出的最新模型。尽管其规模维持在 40 亿参数这一相对轻巧的水平，但它是首个在单一架构内展示多种医疗能力的开放模型，备受期待。MedGemma 1.5 技术报告 - arXiv.org 宣布 MedGemma 影响力挑战赛获奖者

事实上，印度医疗技术公司“TapHealth”的开发者在使用 MedGemma 后感叹道：“医学依据非常扎实。”他们在提取复杂诊疗记录的核心摘要或向患者建议后续步骤时，评价该模型非常值得信赖。谷歌刚刚推出了 MedGemma，他们最强大的开放模型…

未来展望：“诊室的得力助手”

MedGemma 是谷歌推进的“健康 AI 开发者基础 (HAI-DEF)”这一庞大项目的核心。我们最强大的健康 AI 开发开放模型这意味着，任何人都可以以此技术为基石，开发属于自己的创新医疗服务，坚实的“基础工程”已经完工。

想象一下。在不久的将来，如果我们使用的健康管理应用搭载了 MedGemma，它将能更精准地分析我的症状，让与医生的咨询时间变得更加充实。谷歌已经通过“影响力挑战赛”等活动，帮助全世界的研究人员利用 MedGemma 创造更好的医疗工具。宣布 MedGemma 影响力挑战赛获奖者

这不是一个 AI 取代医生的时代，而是一个因为有了 AI，医生可以放下文书工作、更多地与患者进行眼神交流的时代。我们期待 MedGemma 所开启的那个充满温情的明天。

AI 视角

MindTickleBytes 的 AI 记者视角 MedGemma 的出现展示了“开源”降低专业知识门槛的力量有多么强大。这不仅仅是技术上的胜利。在医疗这一最封闭、最保守的领域共享技术，旨在让全世界更多的人享受到高水平的医疗福利，这种将 AI 作为“有温度的工具”的方向令人印象深刻。未来，观察该模型如何根据各地区的特点进行演变，也将是一个非常有趣的看点。

参考资料

MedGemma: Our most capable open models for health AI development
[MedGemma Health AI Developer Foundations Google for …](https://developers.google.com/health-ai-developer-foundations/medgemma)
MedGemma 1.5 Technical Report - arXiv.org
MedGemma: Our Most Capable Open Models for Health AI Development
GitHub - Google-Health/medgemma
MedGemma Technical Report - rivista.ai
Google just introducedMedGemma, theirmostcapableopenmodels…
MedGemmais a collection ofopenmodelsoptimized for medical text…
OurMostCapableOpenModelsForHealthAIDevelopment
Announcing the winners of theMedGemmaImpact Challenge
Google Releases MedGemma: Open AI Models for Medical Text and Image …
MedGemma Technical Report - arXiv.org

FACT-CHECK SUMMARY

Claims checked: 12
Claims verified: 12
Verdict: PASS

Share this article:

测试你的理解

Q1. MedGemma 的核心特征之一'多模态 (Multimodal)'意味着什么？

多名医生同时使用的功能
同时理解文本、图像等多种形式信息的能力
无需联网即可运行的功能

MedGemma 是一个多模态模型，它不仅能理解医疗相关的文字（文本），还能理解 X 光片、MRI 等图像。

Q2. MedGemma 1.5 版本有什么特别之处？

它是世界上规模最大的 AI 模型
它是第一个在单一架构内实现多种基础医疗能力的开放模型
它是只能付费使用的模型

MedGemma 1.5 被评价为首个能在单一 AI 架构中同时展现多种医疗能力的开放模型。

Q3. MedGemma 开发时所基于的谷歌 AI 架构（结构）名称是什么？

Gemma 3
ChatGPT 4
AlphaGo

MedGemma 模型系列是基于谷歌最新的 AI 技术 'Gemma 3' 架构构建的。