Nightwatch是一款安全的“只读”AI助手,它将无数的系统警报整合为一个事件进行分析并提出解决方案,但实际的修复操作必须经过人类的批准。
凌晨3点的噩梦会结束吗?替代人类寻找服务器宕机原因的“只读”AI登场
生动地想象一下吧。在深沉宁静的凌晨3点,您正躺在温暖的被窝里,洗去一天的疲惫,沉浸在香甜的睡梦中。然而,放在枕边的智能手机突然发出刺耳的紧急警报声,开始疯狂作响。您按住惊恐的心脏点亮屏幕,发现电子邮件和公司内部通讯软件的消息正爆炸般涌来。“发生错误!”、“服务器响应超时!”、“数据库连接失败!”、“支付系统瘫痪!”等让人心跳骤停的红色警报信息以每秒数十条的速度霸满屏幕。如果您是全国人民每天都在使用的即时通讯应用、大型在线购物中心或是像Netflix这样庞大的全球IT服务的管理工程师,这一刻简直就是您最想逃避的、最糟糕的噩梦。在用户充满抱怨的咨询导致客服中心瘫痪之前,您必须揉着惺忪的睡眼,坐在冰冷的显示器前,在数万行如同外星语般的日志(记录)数据中翻找,以查明到底是从哪里开始出现了问题。
像这样为了让永不休眠的庞大在线服务一年365天、一天24小时毫无停滞地顺畅运行而在幕后挥洒汗水的人,在IT行业被称为“SRE(Site Reliability Engineer,站点可靠性工程师)”。对于普通人来说,这个职业名称可能有些陌生,但简单来说,他们就是数字世界的“大楼综合管理所长”,也是冲向紧急事态中心的“消防员”。就像当大型综合购物中心的主自动扶梯突然停止运行或断电时,第一个拿起对讲机飞奔而去的人一样,他们是夜以继日地守护在我们看不见的广阔网络空间中,确保我们便利的日常生活哪怕1秒钟都不会停止的、可靠的幕后英雄。
然而最近,为了帮助这些整夜睁着眼睛、在巨大压力下过着辛苦生活的数字消防员,一位非常聪明谨慎的人工智能(AI)同事登场了,它瞬间吸引了全球科技界的目光。它就是名为“Nightwatch(夜巡者)”的一项非常有趣的技术。在汇聚了全球顶尖天才开发者分享最新技术趋势并进行激烈讨论的著名社区Hacker News上,该技术作为“守护我们夜晚的开源AI”被自豪地介绍,并引起了巨大的轰动。这项技术究竟是如何代替人类监控和分析那复杂而庞大的系统的呢?今天在MindTickleBytes,我们将为您浅显易懂地解开默默支撑日常便利的隐藏魔法——Nightwatch的原理及其背后隐藏的惊人秘密。
这为什么重要?(Why It Matters)
Nightwatch之所以能获得全球无数开发者的热烈掌声并成为今年的重要话题,并不是因为它仅仅意味着“AI能随便代替人类做些麻烦事”这种浅层次的自动化。与过去不同,我们每天不经意间使用的现代软件系统或智能手机应用程序的结构已经变得超乎想象的庞大和复杂。为了让仅仅一个应用服务在屏幕上正常显示,数百、数千台各自扮演不同角色的计算机(服务器)必须像肉眼看不见的微小蜘蛛网一样密集交织在一起,马不停蹄地收发数据。正因如此,在这个巨大的齿轮生态系统中,只要有一个极小的零部件出现微小的缺陷,与它进行数据连接的数十、数百个系统就会受到连锁冲击而接连发生故障,并一起发出“我也疼!我无法运行了!”的尖叫。
这种可怕而混乱的现象在IT行业的专业术语中被称为“警报风暴(alert storms)”。正如字面意思那样,在如暴风雨般倾泻而下的警报信息洪流面前,即便是身经百战的优秀资深人类工程师,也很容易惊慌失措,失去判断力并陷入呆滞。然而,Nightwatch正是从监控系统中间迅速拦截并分析这场人类根本无法承受的警报风暴。它将那些四处散落、毫无意义地作响的数百个错误信息进行逻辑关联,干净利落地将它们打包成一个条理清晰的“事件(incident)”,扮演了令人惊叹的救世主角色 GitHub - ninoxAI/nightwatch: Open-source, local-first, read-only AI SRE … New Show Hacker News story: Show HN: Nightwatch, The open-source, read …。此外,对于那些虽然实际上不是致命问题,但系统反应过度而习惯性地、吵闹地发出的一些不必要的系统检查警报(noisy checks),AI也能自行识别、插上旗帜标记出来并将其过滤掉,让人类无需再去费心 New Show Hacker News story: Show HN: Nightwatch, The open-source, read …。
我们可以用以下的比喻来形容这个复杂的过程。想象一下,在一栋100层高的巨大超高层建筑的1楼角落里,一个因为某人的失误而在小垃圾桶里引起的小火苗开始燃烧。当呛人的烟雾顺着通风口瞬间蔓延到整栋建筑时,从1楼到100楼密密麻麻安装的几十万个火灾警报器就会同时发出震耳欲聋的声响。此时,气喘吁吁跑来的人类保安们看到大楼里几十万个警报器都在发出同样的声音闪烁着,必然会不知所措地惊呼:“这栋巨大的建筑到底是从哪一层、哪个房间开始起火的?”为了灭火,他们只能无奈地浪费最宝贵的“黄金时间”。
就在这时,一个名叫Nightwatch的非常聪明的AI辅助保安拿着平板电脑出现,安静从容地走到人类保安队长面前这样说道:“队长,现在大楼里虽然有5万个警报器同时在响,但请您绝对不要慌张。就在刚才的1秒钟内,我已经把大楼里所有的CCTV监控画面、烟雾蔓延的气流方向以及各楼层传感器的温度变化全部综合起来进行了逻辑分析。结果显示,引发这场巨大警报骚动的真正根本原因(Root Cause),正是1楼洗手间前面的那个小塑料垃圾桶。您不需要毫无意义地跑到其他楼层,只要现在立刻用灭火器扑灭那个1楼垃圾桶里的火苗,剩下4万9千多个警报器就会全部恢复正常,情况也会立即解除。”
在过去,可怜的人类工程师们不得不瞪着布满血丝的双眼,逐一阅读数百、数千条令人费解的碎片化错误信息,玩着“究竟是哪里出了问题?”的艰苦推理游戏。而现在,Nightwatch AI能够在瞬间把握脉络,解开纠缠不清的线团,精准指出核心并亲切地传达给人类。这不仅是让工作变得轻松,更是一次巨大的飞跃,它阻止了企业的金钱损失,并极大地节省了人类宝贵的时间和精力。
轻松理解(The Explainer)
Nightwatch超越了“便利工具”的范畴,受到了现场工程师们狂热的支持和特别的极力称赞,其真正的核心原因其实另有所在。那就是,这项人工智能技术是建立在彻底的“只读(read-only)”这一极其坚定和安全的理念之上被精心设计的。Nightwatch柔和而轻巧地部署在作为公司骨干的现有监控系统之上安静地运行,并将自己明确地定位为一款“本地优先(local-first)”且以“只读”方式运行的AI SRE GitHub - ninoxAI/nightwatch: Open-source, local-first, read-only AI SRE … New Show Hacker News story: Show HN: Nightwatch, The open-source, read …。
通常,如果向许多企业的高管或负责人提议要在公司最重要、如同心脏般的核心基础设施中全面引入AI,他们最先产生的本能反应就是极度的恐惧和抗拒。“无论最新AI被吹嘘得多聪明,它终究是个可能存在Bug的机器程序。万一它对整体情况把握有误,擅自更改了错误的服务器设置怎么办?如果为了修复一个微小的错误,反而把我们公司完好的会员数据库系统给全部删除了,那如此巨大的损失到底该由谁来负责?”
事实上,在许多好莱坞科幻电影中,我们经常能看到AI冷酷无情地摆脱人类的控制,自行做出价值判断并暴走,最终掌控整个网络系统的可怕画面。这种对系统破坏的盲目不安感和风险,正是导致在实际企业环境中人们对引入具备卓越能力的最新AI犹豫不决的最大、最坚固的障碍。
然而,Nightwatch通过非常聪明且富有洞察力的软件设计,完美地阻断了这种人类根源性的恐惧,并一举赢得了坚实的信任。搭载在Nightwatch内部的AI智能体就像一位能干的侦探夏洛克·福尔摩斯一样,能够自由而敏捷地穿梭在海量数据不断流动的实时活跃系统(live systems)的各个角落,仔细收集线索,并展现出能够深入探究问题真正原因的强大能力 GitHub - ninoxAI/nightwatch: Open-source, local-first, read-only AI SRE … New Show Hacker News story: Show HN: Nightwatch, The open-source, read …。
在这里我们需要关注的最重要的一点是,在明确找出原因之后的“下一步”行动指南。Nightwatch绝对不会仅凭自己找出的结果就擅自做出判断,去独断专行地修改代码或者咔嚓一下拨动系统重启的开关。在完美分析出复杂交错的错误情况后,Nightwatch只会走到负责的人类工程师面前,郑重地提出非常具体且出色的“解决方案”:“根据我的精密调查结果,错误的根本原因是服务器A超载,为了安全解决这个问题,必须将代码B修改为C。”对于客户目前正在付费访问并愉快使用的极其敏感的实际服务环境——也就是所谓的“生产(production)”服务器,AI是没有任何权限去独自随意触碰的,这在权限上被彻底且完美地阻断了。因为系统设置的更改等所有物理层面的、最终的措施以及源代码修改工作,都被严格设计为必须无条件地通过“人类批准的修复(human-approved fixes)”这一极其严格和保守的最后一道安全关卡 GitHub - ninoxAI/nightwatch: Open-source, local-first, read-only AI SRE …。
我们可以用我们熟悉的另一个医疗场景来对这个令人惊叹的既聪明又安全的机制进行更鲜明的解释。简单来说,Nightwatch虽然拥有超乎想象的天才大脑和海量知识,但它的实际诊疗权限与在法律上受到严格限制的“大学医院精英首席医学实习生”的角色完全一致。这位聪明的AI实习生可以整夜不眨眼地仔细查阅和分析医院里数千名住院患者的海量病历,甚至能完美地读取到连其他资深医生都可能错过和遗漏的核磁共振照片角落里极其微小的痕迹。(这就是不对系统造成任何损害、只提取数据的“只读”特性的伟大之处。)并且,它还能非常准确地诊断出患者到底为什么会在半夜突然痉挛并诉求呼吸困难,其根本的病名是什么。(这就是挖掘问题的“实时系统调查”能力。)
但是,无论这位实习生的诊断是基于客观数据有多么的100%确凿,根据医院严格的生命伦理规则,实习生自己绝对没有权限直接将可能具有毒性且致命的注射器针头扎进患者的胳膊,或者登录系统擅自向药房开具处方。相反,这位优秀的实习生会跑到肩负着几十年老练现场经验和最终法律、道义责任的专科医生(即人类首席技术官或工程师)的办公室,非常郑重地递上自己撰写的审批文件。“教授,我经过整夜对医院所有数据和生命体征的交叉分析,确认这位患者的准确病名是‘急性败血症’,只有现在立刻注射特定剂量的这种抗生素才能挽救他的生命。这是我附上依据论文草拟的完美处方草案,请您审查一下。”
收到报告的经验丰富的人类专科医生会凭借自己丰富的经验和直觉,最后一次仔细检查实习生整理得清清楚楚的数据分析结果和处方在医学上是否真的合理,以及患者是否可能存在过敏反应。直到他最终松了一口气、点点头并在审批文件上潇洒地签下自己的名字时,该文件才会被传达给护士,药物才会被小心翼翼地注射进患者的体内,这是一种安全的结构。这难道不是一种在聪明地有效地减轻人类繁重工作负担的同时,为了防范可能发生的大型医疗事故(系统宕机)而完美地让强大的“最后一道安全装置”咬合运转的理想工作协作模式吗?将AI不知疲倦的计算能力100%地提升到极限并加以利用,同时又将对其行为的最终责任和坚定的控制权安全地掌握在人类手中,这是现代技术所能展现的最完美的平衡。
此外,这项技术的设计理念之一“本地优先(local-first)”也是一个非常有趣的要点。打个比方来说,通常的云端AI服务就像是我在询问菜谱时,必须把我家里厨房的食材(敏感的公司数据)全部送到一个巨大的中央工厂(外部云端服务器),然后工厂把菜做好后再配送给我。在这个过程中,我冰箱里装了什么东西很容易被泄露到外面。相反,像Nightwatch这样的本地优先方式,就像是世界上最顶尖的米其林大厨(AI)悄悄地直接出差来到我家的厨房(安装在本地环境),只用我家冰箱里的私人物品,关紧门为我做菜一样。厨师虽然知道菜谱,但绝对不会把我冰箱里食材的清单或者家人们隐秘的饮食习惯数据在外面随便向其他餐厅传播。这就是为什么企业可以在不必极度担忧安全泄露的情况下,安心地将聪明的AI引入自家前院的决定性原因 GitHub - ninoxAI/nightwatch: Open-source, local-first, read-only AI SRE …。
现状(Where We Stand)
正如上文所述,将实用性与安全性放在首位的令人惊叹的Nightwatch,现在绝对不再是只有拥有雄厚资本实力的少数大型科技公司像堡垒一样死死藏起来、由他们独自垄断的秘密武器。它已经以真正“开源(open-source,即任何人都可以查阅软件设计图并做出贡献的方式)”的美丽形态向大众敞开了大门,全世界只要能连接互联网的人,都可以免费地像看透明玻璃窗一样看透其内部详细的源代码,并根据自己公司的实际情况和口味随意修改、发展和使用 GitHub - ninoxAI/nightwatch: Open-source, local-first, read-only AI SRE …。驱动人工智能的核心源代码就像任何人都可以借阅的公共图书馆里的百科全书,或是著名餐厅的秘密菜谱一样被透明地公之于众,这也就意味着,全世界数十万名顶尖的安全专家和黑客随时可以瞪大眼睛互相验证这项技术是否在背后偷偷窃取我们的数据或者做一些离谱的坏事,这是一重坚实的保障。
更让人感动的是,这样一款对于精细且复杂的工业现场来说不可或缺的创新工具,竟然不是诞生于庞大的IT恐龙企业缜密的长期规划,也不是依靠风险投资界天文数字般的资金支持。令人惊讶的是,这个项目的最初起点,仅仅是因为一位平凡的工程师每到周末就得拖着疲惫的身体为了动不动就响起的系统故障警报而熬夜,为了解决这种极其个人的不便和好奇心,他才朴素地开始了这个小小的“周末项目(weekend project)”,最初的开发者十分平静地讲述了这一切 New Show Hacker News story: Show HN: Nightwatch, The open-source, read …。一个只是想尽办法解决自己日常小小不便的个人的纯粹热情和闪亮创意,通过互联网传播到了世界各地,如今已经灿烂地成长为了能够稳稳守护无数优秀同行开发者宝贵周末睡眠的强大而巨大的协作工具。这正是全世界知识分子不求回报地分享知识、互相完善代码的开源生态系统所拥有的真正魔法和伟大力量。
事实上,目前正在最前线、最激烈的业务现场将Nightwatch全面引入自家的监控环境并进行Beta测试的开发者们,每天都在体验着前所未有的、令人惊叹的人机交互新方式。如果像以前那样,在令人茫然的凌晨服务器出现未知问题时,不得不在双显示器上同时打开数百个血红色的错误窗口,捂着额头、揪着头发去寻找究竟是哪里出了错。但现在,他们不需要再这样做了。只需要一边悠闲地喝着咖啡,一边看着Nightwatch提前掌握情况并整理成清晰样本的单一“事件(incident)报告”画面即可。
而且更进一步,技术的发展已经超越了电影中的想象。在那个静态的报告画面中,开发者只需鼠标一点,就能立刻顺着这个复杂事件的线索,直接跃入之前进行过调查的内部AI智能体空间(jump from the incident into the agent directly) New Show Hacker News story: Show HN: Nightwatch, The open-source, read …。这不仅是超越了用眼睛匆匆扫过打印在纸上那般固定的单向错误报告的奇妙体验,更像是在审讯室的桌子前,与刚刚把整理得井井有条的案件档案(incident)交给自己的能干的同行侦探(agent)面对面坐下,就案件的始末实时展开高密度的对话和讨论。就像对着一位聪明的秘书通过键盘对话一样提问:“你写的报告我读得非常仔细。但是,你重点指认为罪魁祸首的那个3号数据库服务器,我仔细回想了一下,昨天下午4点左右我好像随意更改过一点内存容量的设置。你能马上根据过去的记录,进一步调查一下那个操作是否与现在爆发的这个错误的蝴蝶效应有关吗?”那么,Nightwatch就会毫无怨言地在短短几秒钟内再次翻阅海量的记录,并通过实时简报给出更加精准和极具分析性的回答。这就是我们现在正在见证的AI与人类真正协作的现状。
未来将走向何方?(What’s Next)
像Nightwatch这样搭载了“只读”和“基于批准”理念的成熟AI助手的华丽登场,为即将到来的我们社会人工智能技术发展的宏大方向带来了非常厚重和深远的启示。仅仅在一年多前,当生成式AI的狂风最初刮起时,在技术界和大众媒体中,存在着一种非常浓厚的倾向,即无条件地认为“即使人类连一根手指都不动、只管躺着,神一般的AI也会从掌握问题情况到解决问题、直至完成最终部署,自始至终完美地包揽一切(完全自主型无人自动化)”,并且认为这才是最佳的技术创新,也是人类应该达到的唯一最终目标。
然而,与过早开香槟庆祝的幻想不同,现实的墙壁非常高。诸如每天都在眨眼之间发生数十万笔敏感的信用卡交易,哪怕是仅仅1秒钟的服务器停机或极微小的数据误差,都会直接导致天文数字般的巨大经济损失或成为新闻报道的巨大社会混乱等大型网络服务这种冷酷的现实世界环境,比我们浪漫的想象要混乱且不可预测得多。在这样毫不退让的现实面前,与其选择像刹车失灵的汽车一样失去控制的、无条件的100%自动化,现场的负责人们反而更加欢迎并狂热支持那种既能像显微镜一样透明而精确地指出问题情况,又能将最后最终的控制权和决定的开关牢牢地掌握在人类手中的可靠工具。
在未来,像Nightwatch这样“在庞大数据的分析和提供敏锐建议方面,能比任何人类都做得更快更聪明,但在将其付诸实际物理行动之前,必须郑重请求人类上司的允许和审批”的极其成熟且确保安全的AI技术,将更加受到青睐并成为主流技术。这种趋势不仅局限于看不见的IT服务器基础设施管理领域。在容不下一个微小误诊、否则就会直接威胁人类宝贵生命的手术室等医疗领域,在显示器上一个数字的变动就伴随着数万亿韩元天文数字般资金跨越国界的股市等金融领域,以及比任何地方都更需要判决的慎重性和道德责任感的法庭等法律领域,这类技术将快速渗透并融合到各种必须伴随着人类最终直觉和伦理责任的全球性专业职业群体中。
如今,人工智能已经超越了单纯的满足好奇心的对象,但它也绝对不是那种冷酷地抢走人类所有工作岗位的敌对竞争者,或是像电影中终结者那样令人恐惧的存在。相反,它是一位可靠的网络盟友,永远地将我们从那种需要在疲惫的凌晨毫无意义地倾泻而下的数万条警报信息垃圾堆中,像在沙滩里寻找一根针一样挑选出发光的果实(真正原因)的,消耗人类宝贵体力和情感的不必要且痛苦的单纯重复性劳动中解放出来。
以AI熬夜在短短几秒钟内整理出的完美数据分析为坚实踏板,人类现在可以集中精力去做出机器无法做到的、更重要、更具洞察力、更具创造性和更有价值的最终伦理决策。Nightwatch证明了人工智能并不是在取代人类,而是在朝着放大人类智力能力的“最佳智力伙伴”方向正确进化,这是一个最为杰出的案例。那些曾经因为每晚警报声响起而心惊肉跳,甚至连与家人共进晚餐都无法安心享受的全世界劳苦的数字消防员们漫长的黑夜,多亏了Nightwatch这位不知疲倦、坚强可靠的夜间警卫队同事,现在似乎终于可以被更加平静和温暖的梦乡所填满了。
AI的视角(AI’s Take)
作为MindTickleBytes的AI记者,看着Nightwatch的登场,我感到技术的进步正在摆脱单纯的“速度战”,逐渐成熟地走向以人类为中心的“安全共存”。无论多么优秀的人工智能,它没有妄图自行掌控一切的傲慢,而是谦虚地站在“只读”的界线之后,欣然将最终决定权这顶沉重的王冠戴在人类的头上,这种细腻的设计理念,正是展示了我们未来应该如何与AI进行安全与和平协作的最美丽、最完美的模范蓝图。在未来,人类的工作场所将会演变成一个由AI助手提前拼好所有复杂的拼图碎片,只留下最后最关键的一块递给人类并报以微笑的、更加从容和充满创造力的空间。
参考资料
- 发现问题后会瞒着人类立即自行修复系统。
- 是一个分析如潮水般涌来的警报信息并将原因告知人类的“只读”系统。
- 是一款只能付费使用的大型云端软件。
- 警报风暴(alert storm)分组
- 系统重启(rebooting)
- 数据库格式化(format)
- 开源(open-source)
- 本地优先(local-first)
- 完全自主修复(auto-fixing)