0°

百度版AI医生叫板ChatGPT:会看CT片子,也会分诊管理

  脊髓栓系综合征(TCS),一种在新生儿中发病率约为0.005~0.025%的罕见病,近日被ChatGPT成功诊断——此前,不幸罹患TCS的Alex已经问诊了17名医生。

  ChatGPT的成功,无疑让AI大模型在医疗界掷出了不小的水花。

  实际上,自2023年5月以来,国内外如谷歌、英伟达、亚马逊、腾讯、京东等科技巨头,都已经率先开始了医疗大模型的布局——据不完全统计,截至2023年8月,光国内就发布了40多个医疗相关的AI模型。各家模型落地的场景也大同小异,主要集中在智能问诊、影像诊断、知识查询。

  2023年9月19日,百度交了一份医疗大模型的作业:“灵医大模型”。

  除了大模型技术的总体跃进,百度发布医疗大模型撞上了政策开闸的东风。国家药监局器审中心针对新一代AI技术,接连发布了《深度学习辅助决策软件审评要点》《人工智能医疗器械注册审查指导原则(征求意见稿)》等文件,在构建监管机制的同时,也释放出了加快AI辅助医疗落地的信号。

  至于商业化的底气,则在于百度前期的客户合作案例。

  比如在和人民卫生出版社的合作中,灵医大模型补足了标签搜索的短板,让医生和病患通过自然语言描述就能够找到相应的知识;

  再比如,北大口腔医院信息中心副主任曹战强提到,大模型除了在疾病诊断上展现出更强的能力,同时还能处理多维度、复杂的医院管理数据,提高医疗工作的效率和安全。比如一个病区有50个病人,包括不同阶段的高血压和心脏病患者,大模型就能根据病人数量、疾病严重程度等灵活安排医生提前介入和手术的时间。

  百度想把技能点加满,模型要会看病、分诊管理、医生培训

  上述的实战经验,一方面为灵医大模型的诞生积攒了脱敏临床数据。

  据官方介绍,灵医大模型的训练数据总量达到了千亿Token,主要涵盖“医-患-药”场景。比如医院方的数据包括脱敏的临床数据、知识图谱等,患者的数据则主要来源于百度搜索积累的健康问答数据。

  灵医大模型的训练数据来源。图源:百度

  另一方面,合作案例也为灵医大模型的商业化落地探索了更多的场景。

  红杉资本整理的医疗大模型的落地场景。图源:红杉资本

  百度将灵医大模型称为国内“首个产业级”医疗大模型,原因在于灵医一口吃下了目前大模型能落地的大部分医疗场景,包括文档理解、病历理解、医疗问答等。与此同时,百度的商业化野心不仅局限于医院,还延伸至药企、药店、线上医院等不同的医疗场景。

  文档理解

  病历理解:病历生成、病历问答

  医疗问答:

  具体到部署方式,由于各地医疗改革后,不少费用需要医院科室承担,成本昂贵的医疗大模型一开始就会“劝退”不少机构。

  对此,百度采取的是因需制宜的策略,参数由大到小,推出了旗舰版(千亿参数)、Lite版(十亿、百亿参数)、定制版(基于客户数据定制)三种模型服务,可根据客户对数据的敏感程度,采用私有部署或者公域部署的方式。

  灵医大模型的服务模式。图源:作者拍摄

  不过,将AI与事关生命健康的医疗结合,无异于刀尖起舞。

  落地的阻力,首先在于监管政策的空白。此前,国家卫健委卫生发展研究中心副主任游茂在《第一财经》的采访中就表示,AI医疗器械的专利数据,多集中在“机器学习”“医学影像”领域,“自然与语言处理”“知识库”等领域研究相对不足,“决策规则”领域研究几乎空白。

  更重要的问题是,目前医疗大模型的能力,是否足以与人类医生媲美。

  要想得知医疗AI的能力,“人机一致性测试”往往必不可少。所谓的人机一致性测试,指的是让人和机器在同一场景下进行技能比拼。比如医联集团的MedGPT与三甲医院医生的诊断一致性达到96%;谷歌的Med-PaLM在医学问答测试中,92.9%的答案与临床医生相当,92.9%的长篇答案符合科学共识。

  即便在问诊一致性上,部分医疗大模型已经达到一般医生的水准,但落地到具体的诊疗场景仍然存在一定问题。比如MedGPT在问诊过程中无法进行查体,以及无法给予患者更人性化的关怀。

  灵医大模型的能力,“接近三甲医院的主治临床医生”

  光从一场发布会,我们难以掂量灵医大模型的真实斤两。

  “我也看了非常多的大模型的发布会,总体感觉大家都是在比参数、比性能、比排行榜。”百度集团资深副总裁、百度大健康事业群总裁何明科一开场,就直指国内大模型赛道“群模乱舞”。

  那么百度的灵医大模型的性能能否在“群模”中脱颖而出?以及在落地过程中,医疗机构对AI大模型的接受度如何?

  36氪同各家媒体,与百度大健康事业群AI产业部总经理刘军伟、百度大健康事业群AI产业部研发负责人黄海峰等人展开了一场对话(内容略经编辑):

  问:灵医大模型在训练数据这方面主要来源是哪些?在专业数据来源上相较于其他友商有哪些优势?

  黄海峰:首先大模型的数据其实是涵盖了“医-药-患”三个方面,这也是百度做医疗大模型的优势,能够同时拿到医院、线上患者、药品的数据。百度有百度健康,有智慧医疗,还有医疗信息数据提供商GBI,在数据维度上更全。

  在数据质量上,百度搜索每天有2亿次健康的检索,包括智慧医疗的产品,在项目落地中对数据的理解更全面,包括数据的治理和数据质控的技术,也能保障用于训练的数据从质量上更好。

  问:那么医疗大模型最为核心的训练数据是哪一部分?问诊记录、临床数据这些不同种类的数据的重要性是否有区别?

  黄海峰:首先哪部分更核心没有标准答案,面向不同的场景有不同的核心数据。比如要做病历生成,对这个任务最有用的是真实的病历数据,如果是一些科普问答类,最有用的可能是医典的数据、医患对话和真正的在线问诊数据。

  问:国内比较稀缺的训练数据是什么?百度获取这些数据的渠道是什么?

  黄海峰:这些类型的数据我们基本上都有,在类型上是比较全的。从获取的渠道上来讲,公开和私有化都有。公开的是互联网的数据,我们会做严格的质量筛选,因为质量参差不齐。我们也会经过多种的策略,通过一些小模型,首先对数据做一些预处理、清洗以及筛选的工作。

  一些高质量的数据,像电子病历的数据,一方面需要做严格的脱敏,甚至在医院的环境下做小模型的训练,让这个模型能够学到知识,然后做到数据不出院、模型出院。

  在获取数据上,最难的就是医院的病历数据。其他一些知识类的数据,像人卫出版社权威的知识数据,其实对于整个大模型来讲是比较关键的。同时药品相关的数据也很重要,我们今年收购了GBI,覆盖了全球95%的跨国药企,这么多年积累的数据对模型有很大的帮助。

  问:发布会没有特别提到关于灵医大模型性能方面的一些数据。此前百度有没有做过类似人机一致性的评比?比如把医生和大模型放在同样一个场景下进行一些比较。

  朱东纬(百度大健康事业群AI产业部产品负责人):分两层,文心大模型的底座肯定会做通识性的测评,医疗大模型就跟人去比,评测集有两个层级,第一个是百度内部的医生团队,第二个会找外部的三甲医院医生。

  问:效果如何?

  朱东纬:我们测试的结果是接近三甲医院的主治临床医生。

  问:医疗的严肃性可能决定它对差错容忍度更低,相较于大模型在其他领域的应用,医疗场景的商业化会更困难一点吗?

  刘军伟:首先做医疗有一个基本的理解:医疗本身是一个民生工程,它既有商业属性,还有社会价值。

  现在很多客户会主动找我们来合作,之前我们都是做好服务、做好产品,自己主动找各种合作伙伴,今天我们发现有很多人,比如说刚才提到的不管是药店甚至门诊,都愿意主动跟百度合作。同时我们的产品线是可以开放测试的,通过这些测试也发现确实有价值,因此商业化的路径还是不错的。

  问:对于医疗产业来说,引入大模型的成本有多高?

  刘军伟:对我们来讲,做这样的灵医大模型,客观的来讲成本可控。刚才我们说了有已有的这些能力,甚至在文心大模型预训练的过程中,用一些闲置的资源就可以把灵医大模型跑出来,这就是其他公司相对来说要从0-1去做,或者之前没有大模型的积累甚至行业知识的话,相对有一定的门槛。

  问:目前医疗机构对于大模型的付费意愿如何?此前AI影像辅助诊断技术也是因为成本较高比较难商业化落地。

  刘军伟:这里面医疗机构看分几部分,第一就是大家理解传统的公立医院,现在也在探索,不管是刚才说的北大口腔,通过联合课题的方式,我们现在跟复旦中山也在合作,通过部署我们的Lite轻量版本做一些合作。

  其次关于医疗大模型的需求,首先我们在科研的场景看到大量的需求,另一方面我们也发现大模型在信息化方面,比如在病历生成等方面有提升。

  另一方面,我们也看到连锁集团、药店等ToB的场景的应用空间更大一些。公立医院更代表严肃医疗,而ToB的场景里面有更大的想象空间,比如互联网医院也有分导诊、预问诊。大家也反复强调,**公立医院积攒的产品的大模型能力,可以快速复制到ToB医院的场景里面去,增加我们商业化空间**。

  问:刘总也提到很多公司他们是在蹭热点,所以请教一个问题,怎么判断医疗AI大模型是不是靠谱,我们可以从哪些方面进行判断?

  刘军伟:我认为从三个维度看一家公司在大模型方面是不是靠谱。

  第一是不是有数据集的子评测,有没有经过三甲医生或者权威机构的认证。

  第二有没有开放产品让大家体验。很多公司其实没有看到过产品,停留在研发阶段。今天我们推出的灵医BOT这样的产品,大家可以真的去体验测试。

  第三个最重要的就是有真实的客户案例,尤其是有商业化的合作,能够说明行业的认可度。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论