数据挖掘

有了大量的数据,CU Anschutz准备挖金

大数据挖掘在推进研究发现和病人护理方面处于中心地位

一分钟读

你需要知道的

CU Anschutz的领导人在基础设施建设方面“做得很大”收集资源,开辟被称为大数据挖掘的新领域。其中一些专家分享了通过生物信息学改变校园使命的计划和可能性加州大学安舒茨发展办公室

要想在医疗领域保持竞争力,现在需要一种新型的采矿方式。虽然不需要戴安全帽,但从大量资源中提取数据是推进研究和患者护理的新前沿。和科罗拉多大学安舒茨医学院准备开挖。

Chancellor说:“在CU Anschutz,我们在扩大我们有才华的团队和投资推动他们工作所需的资源方面做得很大。唐Elliman5月10日,一场关于生物信息学、数据科学和人工智能的虚拟小组讨论拉开帷幕。

Elliman说:“我们知道这些领域将是未来医学和医疗保健的基础和真正的基础——影响从我们如何理解疾病和疾病,到我们如何解决预防和治疗,再到提供者如何实时做出临床决策。”“而这只是冰山一角。”

中大医学院迪安约翰·赖利该小组包括该大学新组建的团队中的一些人,他们准备推进大数据挖掘:

数据挖掘的丰富环境

专家们说,他们面临的主要工作几乎影响到校园里的每个人,需要前所未有的合作。但CU Anschutz社区的独特品质为这项任务提供了肥沃的土壤,Haendel说,她说自4月1日加入校园以来,她对伙伴关系的坚定承诺感到震惊。

汉德尔说:“我指的不仅仅是医院和校园之间的合作或伙伴关系,而是在数据层面上的深度合作。”“就我们的数据而言,我们像所有机构一样有很多竖井,但我们有巨大的意愿和投资,让这些数据协同工作。”

这些竖井包括校园内两家顶级地区医院的电子医疗记录(EMRs),安舒茨大学许多专业医疗中心的宝藏生物库,以及横跨校园的基础研究实验室的多个数据集。

医学领域应该有金矿

布鲁克斯说:“在科罗拉多个性化医疗中心,我们的生物库是一个绝对的明星系统,到目前为止,已经有超过18万名同意的患者。”他说,随着中心继续对这些患者的DNA进行测序,一个宝贵的信息缓存也在增长,迄今为止,大约有3.5万名患者的基因组数据。

“就我们的数据而言,我们像所有机构一样有很多竖井,但我们有巨大的意愿和投资,让这些数据协同工作。”– Melissa Haendel, PhD

布鲁克斯说,潜力是“巨大的”。“我们正在努力做的是扩大药物基因组学的临床渠道,”他举例说,他指的是研究基因组在药物反应中的作用。他说:“目标之一是,如果出现药物相互作用等问题,电子病历可以为临床医生注册警报。”

他说,除了可操作的临床数据外,生物库还拥有丰富的对照数据,流行病学潜力也很大。“我们想尝试从广泛的角度考虑,为预防健康创造个性化的药物。我们正在努力开发新的渠道,以分析和调动校园内其他来源的这些数据。”

安舒茨大学准备分享这笔财富

我们的目标是将这种影响扩大到国家层面。Haendel说:“我们希望将我们对患者的了解与全国患者进行比较。”他指出,由于全球合作的巨大需求,COVID-19大流行推动了这项工作。

“特别是在大流行之初,没有一家医院有足够多的病人来真正了解这种疾病的本质。但是通过协调和汇总来自全国各地的数据,我们能够看到我们在当地看不到的趋势。这对精准医疗的未来非常重要,”汉德尔说。

“有了人工智能(AI)和机器学习,一切都是关于提取正确的信息,并在正确的时间将其放在正确的人面前,这样他们就可以利用这些信息并采取下一步行动,”格林说,他的实验室开发了整合多个数据集数据的算法。

Greene将生物信息学定义为一个专注于使大规模数据可用、可访问和可解释以推动行动的领域,他说数据可能是研究人员在发现的边缘工作中缺失的部分。它可以是医生为患有罕见疾病的患者提供的治疗方案,也可以是让医学生对某个概念产生兴趣的信息。

他说,生物信息学本质上是“使偶然发现成为常规”。

为更大的回报寻找更好的工具

在2017年与谷歌达成的开创性合作伙伴关系中,CU安舒茨校区开始扩大数据的可访问性和可用性。

布鲁克斯说:“据我所知,我们是国内第一个转移到云端的临床数据仓库系统。”他说:“所以现在我们不只是利用某个机器上的这些封闭物理结构,而是实际上分布在多个数据中心和巨大的仓库大小的操作中,那里有成千上万个这样的服务器在运行。”

他说:“处理能力和存储能力的数量超出了我们在预置条件下可以完成的数量级。”他补充说,其好处超出了存储能力。“我们有一整套可用的工具,可以让我们解锁数据中隐藏的宝石。这就是云的力量。”

把财宝放在正确的箱子里

安全性是数据挖掘领域的首要任务,尤其是在医疗领域。布鲁克斯和CCPM的团队与校园内的医院(其领导层在中心的安全与合规委员会中)和机构审查委员会(监督所有人体研究)密切合作,建立了一个隐私和安全框架。

“我们有一整套可用的工具,可以让我们解锁数据中隐藏的宝石。——伊恩·布鲁克斯博士

布鲁克斯说:“我们建立了机制和框架,这样我们就可以在适当的许可和监督下安全地共享这些数据。”他说,下一个目标是在全国范围内扩大安全覆盖面。

布鲁克斯说:“我认为,Haendel博士作为CRIO的角色将在建立治理和支持网络方面发挥至关重要的作用,这样那些信任我们的数据的患者,无论是来自生物库还是在我们的医院寻求治疗的患者,都知道我们正在尽可能地推动最前沿的研究,但我们这样做的方式总是保护他们的安全和隐私。”

韩德尔说,疫情再次推动了以创新和有效的方式安全共享和控制数据访问的工作。“我们能够将正确的数据传递给正确的人,不仅是我们地区的医院,而且是全国各地的医院,这样我们就可以集体利用国家的数据,改善科罗拉多州患者的护理。”

平衡每个人的支出

戴维斯说,随着生物信息学领域继续向前发展,该领域的专家面临许多需要解决的关键问题。

他说:“当数据变得足够大,以至于我们不太容易看到它们时,我们需要思考数据是如何收集的,这将如何导致潜在的偏见,数据如何被使用或滥用,以及当它们不再存储在某人的Excel电子表格中时,我们如何合乎道德和公平地使用这些数据集。”“这是我们在安舒茨要做的事情的关键或核心。”

虽然他们知道未来的任务艰巨,但数据挖掘工作人员也相信,结果将是突破性的。格林说:“我真的认为,在安舒茨校区,改变我们的教学方式、开展研究的方式、治疗病人的方式,以及最终如何改善科罗拉多人的健康,已经成为了一个舞台。”

在下面的视频中观看完整的讨论。

主题:研究创新

有特色的专家
员工提

凯西·格林博士

员工提

梅丽莎·汉德尔博士

员工提

肖恩·戴维斯,医学博士

员工提

伊恩·布鲁克斯博士

Baidu
map