一项新的研究发现,专门设计的计算机程序可以通过分析退伍军人的声音来帮助他们诊断创伤后应激障碍(PTSD)。
该研究于4月22日在线发表在《抑郁与焦虑》杂志上,该研究发现,一种人工智能工具可以在有或没有PTSD的人的声音之间进行区分(准确度为89%)。
“我们的发现表明,基于语音的特征可以用于诊断这种疾病,并且在进一步的完善和验证中,可以在不久的将来用于临床,” Lucius N的高级研究作者Charles R. Marmar说。 Littauer纽约大学医学院精神病学系教授兼系主任。
全球超过70%的成年人在生活中的某个时刻经历过一次创伤事件,在一些处境艰难的国家中,多达12%的人患有PTSD。当被提醒触发事件时,患有这种情况的人会经历强烈的持续困扰。
研究作者说,创伤后应激障碍的诊断通常是通过临床访谈或自我报告评估来确定的,这两种方法固有地容易产生偏差。这导致人们努力开发PTSD进展的客观,可测量的物理指标,这与医学状况的实验室值非常相似,但进展缓慢。
学习如何学习
在当前的研究中,研究团队使用了一种称为随机森林的统计/机器学习技术,该技术能够“学习”如何基于示例对个体进行分类。这样的AI程序会建立“决策”规则和数学模型,从而随着训练数据量的增加而以越来越高的准确性进行决策。
研究人员首先记录了标准的,长达数小时的诊断性访谈,称为“临床医生管理的PTSD量表”(CAPS),涉及53名伊拉克和阿富汗退伍军人与军事相关的PTSD,以及78名无此疾病的退伍军人。然后将录音从SRI International(也是发明Siri的机构)输入到语音软件中,以产生总共40,526个基于语音的特征,这些特征在简短的谈话中被捕获,该团队的AI程序筛选出了模式。
随机森林程序将特定语音特征的模式与PTSD相关联,包括语音清晰度较差和无生气的金属音调,长期以来,据传闻两者均有助于诊断。尽管当前的研究并未探讨PTSD背后的疾病机制,但该理论认为,创伤事件会改变处理情感和肌肉音调的大脑回路,从而影响人的声音。
展望未来,研究团队计划用更多数据训练AI语音工具,在独立样本上进一步对其进行验证,并申请政府批准以在临床上使用该工具。
首席作者亚当·布朗博士(Adam Brown)说:“语音可以在自动诊断系统中使用,可能是未来PTSD智能手机应用程序的一部分,因为它可以廉价,远程和非侵入式地进行测量,因此很有吸引力。”在纽约大学医学院精神病学系任教。
SRI International语音技术和研究(STAR)实验室主任Dimitra Vergyri表示:“目前在PTSD检测研究中使用的语音分析技术属于我们称为SenSay AnalyticsTM的语音分析平台所具有的功能范围。”“该软件结合语音的频率,节奏,语调和发音特征来分析单词,以推断出说话者的状态,包括情绪,情感,认知,健康,心理健康和沟通质量。该技术已涉及到一系列行业应用程序,这些行业应用程序在Oto,Ambit和Decoded Health等新兴企业中可见。”