通过数据和团队合作解决罕见病难题

顶尖的CU Anschutz信息学专家分享了她的团队如何帮助收集碎片

一分钟读

你需要知道的

在被指定为卓越中心之后,CU Anschutz最近招募了校长研究信息学官员介绍了校园研究人员如何在罕见疾病方面发挥作用——正好赶上2月28日的罕见病日。

梅丽莎Haendel作为一名杰出的数据科学家和世界上第一个数据科学家,他有很多目标首席研究信息学官科罗拉多大学安舒茨医学院她的团队擅长新兴的数据科学领域,在学术医学校园的所有研究都将受益。

但有一个领域,在2月份得到了全国认可,是Haendel和她的信息奇才同事们的主要关注点:罕见疾病。据估计,全球有1万多种罕见疾病影响着2500万到3000万美国人,其中许多人未被诊断出来,大多数人没有得到治疗,这个问题的范围超出了“罕见”的定义。

国家罕见疾病组织(NORD)最近将科罗拉多大学安舒茨医学校区命名为a罕见病卓越中心

在罕见的情况下,绝大多数(80%以上)已知有遗传成分,这提出了复杂的科学难题。Haendel说:“诊断可能需要数年时间,涉及多个数据集、资源和思想,有时一个诊断需要多达100人。生物化学与分子遗传学在哥伦比亚大学医学院

与此同时,患者(其中三分之二是儿童)患有经常致残,有时甚至致命的疾病。他们中的许多人患有未经研究的“孤儿病”,独自承受痛苦。

改变这一点是Haendel和她的研究小组的首要任务,TISLab.她说,她的工作就是把玩家们组成一个同步的团队来解决谜题。下面,Haendel讲述了信息学和罕见病世界是如何结合的,以及这个团队是如何包括科学家、临床医生、患者和父母的。

术语

  • 信息:研究计算创新的设计、开发和应用以改善医疗保健的多学科领域。
  • 罕见的疾病:一种影响不到20万人的疾病(美国定义)。
  • 孤儿疾病:制药公司没有兴趣采用这种疾病来开发治疗方法。
  • N (1):一种只有一个已知病人的罕见疾病。
  • 表型:特征:生物体可观察到的特征或特征
  • 本体:一种对特定领域或知识领域(如疾病或解剖学)知识的正式的、计算性的表示。
  • 外显子组:一套完整的外显子(在蛋白质中表达的基因的一部分)存在于有机体中。
  • 基因:序列:存在于一个有机体中的一整套序列

问答头

你能解释一下为什么被标记为罕见的东西在医学领域是如此大的焦点吗?

每周都会发现一种新的罕见疾病。据估计,10%的人患有罕见疾病。虽然并非所有的疾病都危及生命,但它在人口中占很大一部分。所以,总的来说,罕见情况一点也不罕见。罕见的情况在某些地理区域可能很罕见,而在其他地区则不然,例如镰状细胞性贫血。

CU Anschutz是否是患有未确诊疾病的患者家庭的目的地医学校园,如果是的话,为什么?

是的,CU Anschutz,特别是儿童医院,以诊断和治疗罕见疾病而闻名。我们有一个很好的诊断实验室科罗拉多州儿童医院该公司服务于落基山脉地区。如果你认为你的孩子可能患有罕见疾病,这是一个主要的诊断目的地。我们在不同的罕见疾病方面也有很好的临床专家,这也包括成人方面。

在诊断罕见病方面,您的团队致力于克服哪些挑战?

大多数临床医生在看到患有罕见疾病的病人之前不太可能见过这种罕见疾病,也不太可能在他们的职业生涯中再次见到这种疾病。那么你如何帮助这些临床医生确定病人得了什么病,从而我们可以确定疾病的原因呢?然后我们可能会进行干预,改善病情,甚至挽救病人的生命。

另一个挑战是帮助病人找到彼此。对于非常罕见的情况,如果我们只有一个N = 1(一个患有这种疾病的患者),就很难知道这个人是否代表所有患有这种疾病的人。但一旦我们发现另一个家族有同样的疾病,我们就可以开始了解其机制基础,无论是基因组的特定变异还是环境原因。因此,我们努力推广为全世界的患者配对的想法,试图找到其他患有相同疾病的家庭。

你能描述一下开放科学对你工作的重要性吗?

我们所做的一切都是巨大的开放科学爱好者,但在罕见的情况下,对开放科学的需求尤其迫切。罕见病是一个全球性问题。如果我们公开分享这些关于疾病的知识和关于个别患者的数据,就有可能找到N(2)患者来验证诊断。

你能定义一下公民科学及其在罕见病研究中的作用吗?

公民科学本质上是由不一定在该科学领域受过训练的人进行的科学。在罕见的情况下,这通常包括患有罕见疾病的患者或患者的家庭成员。仅仅通过生活,这些患者和家属就成为了这些罕见疾病的专家,并希望将这些专业知识贡献给他人。

我坚定地致力于让患者参与到科学研究的过程中——从诊断到发现机制,再到临床试验或其他研究。我认为病人绝对是一个基本的合作伙伴。即使是在患者积极参与研究的层面上——学习,研究所有的论文,为科学家提供关于如何评估某些结果或验证某些假设的想法——从罕见疾病的角度来看,这也是基础。

你能分享一个公民科学在罕见疾病发现方面发挥作用的例子吗?

我最喜欢的一个例子是我亲爱的朋友兼同事Matt Might。他是一名计算机科学家,他有一个患有罕见疾病的孩子,他基本上是在网上寻找其他有相同症状的病人。他真的帮助他的孩子得到了诊断,然后成立了一个基金会。他现在已经找到了大约50个家庭。这是一个非常伟大和著名的故事,但有很多这样的故事。

您的团队如何将患者纳入您的工作,请举一个例子?

我们有这个资源叫做人类表型本体论。它基本上是描述个体表型特征为患者症状的标准指南。你在诊所里发现的很多相关的术语或编码系统,比如ICD(国际疾病分类),是为计费或护理质量而设计的;它们不包含描述患者特征的术语。

例如,如果一个病人有“蜘蛛手指”,这不是我们能解决的问题,所以它不会出现在任何当前的常规账单术语中,但它对诊断非常有用。所以HPO,这个我们开发的本体论,现在已经成为描述罕见病患者特征的全球标准。

我们把它翻译成了外行语言。基本上,病人现在可以描述自己了。所以蜘蛛手指是通俗的术语,而arachnodactyly是临床术语。病人可能不知道蜘蛛状手指,但他们能够认出他们的孩子有细长的蜘蛛状手指。所以我们创建了一个翻译指南,然后还有一些工具,让患者能够对自己进行显型,然后与他们的临床医生分享这些信息。

然后,临床医生将其与他们自己对患者的描述结合起来,当他们被派去进行诊断工作时。

您能否举例说明您的团队是如何收集和重新分配信息以帮助诊断的?

为了让我们真正建立良好的机制发现工具和诊断工具,我们需要更多关于每个个案的细粒度细节。我们需要实际的个体相关性。因此,在全球基因组学与健康联盟(GAGH)的工作中,我们创建了一个叫做Phenopackets的标准。经过6年的改进和社区协调,phenopacket也作为ISO(国际标准化组织)标准发布。

基本上,它是这样说的:我们可以用这些方法来描述一个病人,并以完全保护隐私的方式收集这些信息。然后我们可以看到疾病的模式和症状进展,描绘出该疾病的亚型,可能有不同的潜在机制,因此有不同的治疗发展目标。

更一般地说,当你有了这种层次的情况描述时,找到n(2)族会容易得多。最后,当临床医生联系Phenopackets进行诊断检查时,Phenopackets可以帮助临床实验室。一般来说,如果临床医生订购了整个外显子组或整个基因组,试图找出导致患者罕见疾病的变异可能是什么,他们会发送整个电子健康记录(EHR)的PDF或候选诊断。

这两件事对临床实验室来说都没有计算上的用处。Phenopacket允许临床医生在足够细粒度的水平上发送这种病例级别的信息,这在计算上是有用的。我们已经一次又一次地证明了仅仅基于序列的诊断通过将表型数据与基因组数据结合使用可以大大增强。

你还有什么想补充的吗?

包括数据共享、标准化和整合在内的信息研究确实有助于推动罕见疾病的研究,这也是我们团队的主要目标:为任何类型的研究提供这些技术,尤其是罕见疾病的研究。我们在基础科学、临床研究和患者之间建立这些合作伙伴关系是绝对关键的。来自这三个区域的数据流也必须是可互操作的。这就是所谓的“三位一体”:凳子的三根柱子。如果没有信息学这三大支柱的良好配合,罕见病研究就无法有效开展。

注:为篇幅和清晰度考虑,本文已经过编辑。

主题:研究遗传学

有特色的专家
员工提

梅丽莎·汉德尔博士

Baidu
map