ChatGPT跟人类聊一下，就能识别老年痴呆，准确率80%

　　大数据文摘出品

　　ChatGPT最近凭借强大的功能席卷了互联网，起草法律合同、写小说都不在话下，甚至还能帮你编程。

　　不过这些好像都是人类在测试AI，那ChatGPT能不能反过来从和人类的对话中获得一些有用的信息呢?

　　但事实证明，ChatGPT的技术确实可以做到，比如帮助发现阿尔茨海默氏病的早期症状。

　　阿尔茨海默氏病俗称“老年痴呆”，这种疾病最常见和最明显的症状之一是语言问题，比如语法错误、停顿、重复或忘词义，费城生物医学工程卓克索大学的一项研究发现，ChatGPT就可以通过和人类的对话，发现是不是有这样的症状，从而及时提示患病风险。

　　论文地址：

　　https://journals.plos.org/digitalhealth/article?id=10.1371/journal.pdig.0000168

　　用ChatGPT发现早期阿尔茨海默氏病，准确率80%

　　早期发现阿尔茨海默氏症可以显著改善治疗选择，给患者时间改变生活方式，从而减缓病情恶化。诊断这种疾病通常需要脑部成像或长时间的认知评估，但是这可能既昂贵又费时，因此不适合进行广泛的筛查。

　　随着AI技术流行起来的自动语音分析是早期发现阿尔茨海默氏症的一个有前途的途径，费城生物医学工程卓克索大学教授Liang表示，这种疾病最常见和最明显的症状之一是语言问题，比如语法错误、停顿、重复或忘词义，这使得人们对利用机器学习来发现人们说话方式中疾病的早期迹象越来越感兴趣。

　　“我们的希望是，我们可以利用机器学习来获取这些信号，使我们能够进行早期诊断。”

　　通常情况下，这一技术依赖于专门建立的模型，但是Liang和他的同事想看看他们是否可以重新利用ChatGPT背后的技术——OpenAI的大型语言模型GPT-3——来发现阿尔茨海默氏症的迹象。

　　他们发现ChatGPT确实可以区分阿尔茨海默病患者和健康志愿者的语音记录，准确率达到80%。

　　“像 GPT-3这样的大型语言模型非常强大，它们能够发现这些微妙的差异，”Liang说。“如果研究对象有某种(涉及)阿尔茨海默氏症的问题，而这种问题已经在语言中得到了反映，我们希望能够利用机器学习来获取这些信号，使我们能够进行早期诊断。”

　　研究人员对从健康志愿者和阿尔茨海默氏症患者身上采集的237段录音进行了测试，这些录音使用预先训练好的语音识别模型转换成文本。为了获得 GPT-3的帮助，研究人员利用了它不太为人所知的能力之一。它的 API 使得向模型中输入一段文本成为可能，并让模型输出“embedding”——一段文本的数字表示，这段文本对其含义进行编码，可用于评估其与其他文本的相似性。

　　尽管大多数机器学习模型都处理“embedding”，但是GPT-3的一个新特性是它足够强大，可以为整个段落生成“embedding”。并且由于模型的巨大规模和用于训练它的海量数据，它能够产生非常丰富的文本表示。

　　研究人员利用这种能力为来自老年痴呆症患者和健康个体的所有转录本创建“embedding”。然后，他们选择了这些“embedding”，结合标签来说明它们来自哪个组，并用它们训练机器学习分类器来区分两个组。

　　微调反而使得准确率降低，未来还有工作要做

　　根据《公共科学图书馆 · 数字健康》杂志的一篇论文报道，当在看不见的转录本上测试时，最好的分类器达到了80.3%的准确率。

　　这明显好于研究人员对语音数据采用更传统的方法得到的74.6%的结果，后者依赖于声学特征，而这些特征必须由专家精心识别。他们还将自己的技术与几种使用大型语言模型的尖端机器学习方法进行了比较，这些方法还包括一个额外的步骤，即利用从训练数据中获得的一些文本对模型进行微调。

　　有趣的是，当研究人员尝试微调时，GPT-3的性能实际上下降了。这似乎有违直觉，但是 Liang指出，这可能是由于用于训练GPT-3的大量数据与可用于微调的少量领域特定训练数据之间的大小不匹配。

　　多伦多大学计算机科学副教授 Frank Rudzicz 说，虽然研究小组确实取得了最先进的成果，但是依靠私人拥有的模型进行这种研究确实会带来一些问题。

　　他说：“这些封闭的 API 之所以受到限制，部分原因在于我们无法检查或深入修改这些模型的内部结构，也无法进行一系列更完整的实验来帮助阐明我们需要避免或纠正的潜在错误来源。”

　　Liang对这种方法的局限性也持开放态度。他说，这个模型还远远不够准确，不足以正确诊断阿尔茨海默氏症，任何现实世界部署这种技术将作为一个初始筛选步骤，旨在引导人们到专家那里进行全面的医疗评估。与许多基于人工智能的方法一样，当模型检测到阿尔茨海默氏症时，也很难确切地知道该模型检测到了什么，这可能是医务人员的一个问题。“医生会很自然地问你为什么会得到这些结果,”梁说。“他们想知道什么特征是真正重要的。”

　　尽管如此，梁认为这种方法有很大的前景，他和他的同事们正计划开发一个应用程序，可以在家里或医生的办公室使用，以简化疾病的筛查。