大规模数据集

数据科学家成为焦点

CU Anschutz的研究人员正在利用美国历史上最大的患者隐私有限数据集的力量

一分钟读

文/ Wendy Meyer2022年7月20日

梅丽莎Haendel,博士,教授生物化学与分子遗传学系“,科罗拉多大学医学院她和她的数据科学家团队以闪电般的速度工作了两年,解开了长冠病毒的一些奥秘。他们不仅在美国历史上最大的、公开可用的hipaa限制数据集的开发中发挥了重要作用全国新冠肺炎队列协作(N3C)-但他们利用这些数据进行的研究正在成为头条新闻,并得到了白宫的关注。

今年春天,他们发表了一篇论文《柳叶刀》数字健康他们的工作是使用机器学习方法来确定谁在美国长时间感染了COVID。这篇论文的特色来源多种多样,如NIH Director’s Blog市场,只是举几个例子。N3C本身也在《自然》、《新闻周刊》、《麻省理工学院评论》和《统计新闻》上得到了突出报道。

安妮塔瓦尔登湖她是国家健康数据中心副主任,与首席研究信息官Haendel合作,并一直是N3C的原始架构师之一。

“我告诉我的家人,我做的是技术背后的科学,”瓦尔登说生物医学信息系.“我们在这里帮助使信息更容易获得和更有用——获取数据并从中创造知识。”

班纳特告诉医学博士,医学硕士,生物医学信息学部门临床信息学副主席,也在N3C的发展中发挥了关键作用,并发表了多篇论文,重点关注儿科人口

Haendel, Walden和Bennett在科罗拉多临床和转化科学研究所.这三人都是创建了一种机器学习算法的团队的成员,该算法可以在患者得到诊断之前识别出潜在的长冠病毒。Haendel说:“使用机器学习模型,我们已经确定了超过15万名N3C成年患者,他们可能患有长冠病毒。”

她解释说,研究人员正在全国各地验证这些数据。医生们将检查算法确定的长冠病毒患者的图表和记录,看看数据科学家的发现是否准确。

“验证将帮助我们完善我们的算法,”Haendel继续说道。Once the information is validated, scientists may be able to develop useful tools that doctors may use in the clinic, suggesting diagnostic and treatment options.

Now that Haendel and team have identified potential long COVID patients, the information can help identify potential recruitment candidates for clinical trials to treat the disease.Moreover, Haendel said, her team has multiple studies underway, for example, looking at the impact of vaccination on long COVID or reinfections during different variant waves.

Haendel and Walden and the N3C team have also been looking into the effectiveness of the antiviral treatment Paxlovid.Coronavirus experts from President Biden’s administration approached Haendel and her colleagues to tell them about the effectiveness of Paxlovid in keeping individuals out of the hospital, the effects of drug on the kidney and the rebound phenomenon of whether patients still test positive after treatment.

N3C关于Paxlovid的数据有限,因此很难得出明确的结论。然而,Haendel说她有信心,她的团队将在不久的将来向总统的管理层提供更多的信息。

“For the White House to come and ask us for data is pretty special,” Haendel said.

Haendel说,N3C已经成功地证明了使用真实世界的数据来评估合并症、干预措施和结果,而且使用大规模数据集还有很多东西需要学习。她指出,新的数据治理结构正在进行试点,以创建用于所有疾病领域的新型共享基础设施,这可能会导致阿尔茨海默病、糖尿病等方面的新型研究。

瓦尔登说:“如果我们能够继续利用在数据治理、数据协调和协作分析等其他问题上的惊人社区工作,如阿片类药物滥用或罕见疾病,这将是惊人的。”

有特色的专家
员工提

梅丽莎·汉德尔博士

员工提

告诉贝内特,医学博士,医学博士

员工提

安妮塔·沃尔登

Baidu
map