美国科学家利用机器学习技术明确了“长新冠”特征

医牛资讯原创 2022-05-18 长新冠|机器学习|N3C (3023)

由美国国家卫生研究院(NIH)支持的一个研究团队已经确定了长期新冠病毒病(Long COVID,长新冠)和可能感染者的特征。科学家们使用机器学习技术,分析了可用于COVID-19研究的前所未有的电子健康档案(EHR),以更好地识别长新冠患者。

美国科学家使用机器学习技术分析了可用于COVID-19研究的前所未有的电子健康记录(EHR),以便更好地识别有长新冠的人。研究人员在国家COVID队列协作(N3C)中探索未识别的EHR数据,N3C是一个由NIH的国家推进转化科学中心(NCATS)领导的国家中央公共数据库。研究小组利用这些数据发现,截至2021年10月,可能长新冠病例超过10万例(截至2022年5月,超过20万例)。该研究结果发表新近出版的国际著名医学期刊《柳叶刀 数字健康》杂志上。

长新冠具有以下广泛的症状特征,包括呼吸短促、疲劳、发烧、头痛、“脑雾”和其他神经问题。这种症状可能在首次确诊COVID-19后持续数月或更长时间存在。长新冠难以识别的一个原因是,它的许多症状与其他疾病和条件相似。更好地描述长新冠的特征可能会改善诊断和新的治疗方法。

该研究报告的合著者、北卡罗来纳大学教堂山分校临床信息学家Emily Pfaff博士表示,利用现代数据分析工具和N3C等独特的大数据资源是有意义的,N3C可以代表长新冠的许多特征。”

N3C数据区目前包括全国1300多万人的信息,其中包括近500万例COVID-19阳性病例。该资源使人们能够对COVID-19的疫苗、治疗方法、风险因素和健康结果等新出现的问题进行快速研究。

这项新研究是一项相关的、更大的跨国家卫生研究院倡议的一部分,该倡议名为“研究COVID-19以促进恢复(RECOVER)”,旨在提高对COVID-19的长期影响的理解,称为SARS-CoV-2感染的急性后后遗症(PASC)。RECOVER将准确识别PASC患者,并制定预防和治疗方法。该项目还将通过临床试验、纵向观察研究等回答有关COVID长期影响的关键研究问题。

在《柳叶刀 数字健康》的这项研究中,科罗拉多大学安舒茨医学院的Pfaff、Melissa Haendel博士和他们的同事调查了N3C中97995名成年COVID-19患者的健康档案中的患者人口统计数据、医疗保健使用、诊断和药物数据。他们利用这些信息,以及来自三个长冠肺炎诊所的近600名长冠肺炎患者的数据,创建了三个机器学习模型,以识别长新冠患者。

在机器学习中,科学家“训练”人工智能算法,以快速筛选大量数据。这些模型在数据中寻找模式,这些模式可以帮助研究人员了解患者的特征,并更好地识别患有这种疾病的个体。

这些模型侧重于在N3C数据库的三组中识别潜在的长新冠患者: 即所有COVID-19患者、因COVID-19住院的患者和患有COVID-19但未住院的患者。事实证明,这些模型是准确的,因为长时间感染新冠肺炎的人与长时间感染新冠肺炎的诊所看到的患者相似。机器学习系统在N3C数据库中对大约10万名患者进行了分类,他们的档案与长时间感染COVID的患者非常匹配。


循证来源:医牛独家循证原文(点击获取链接)