设为主页

您当前所在的位置:首页 > 新闻资讯

PNAS:有了基因组序列,预测外貌不再远

发布时间:2017-09-07 20:52:16点击次数: 作者:Bioradars

根据人类的遗传密码来预测他们的外貌特征,这一直是科学家们的梦想。然而,从DNA联想到外表的科学仍然是少得可怜。外貌特征可能是由数百个或数千个基因所塑造的,而每一个的影响都非常小。

如今,研究终于有了新进展。根据本周发表在《美国国家科学院院报》上的一项研究,在没有其他信息的情况下,通过基因组序列数据预测的外貌特征可能足以分辨某个人。这项研究的通讯作者之一是著名科学家J. Craig Venter

美国和新加坡的研究人员将1000多名个体的身体表型和全基因组序列数据相关联,并借助一种新开发的算法,根据遗传数据来预测生物特征。他们表示,这种算法可以预测大多数人的三维面部结构、种族、身高、体重及其他特征。

不过,这也涉及到基因组隐私的问题。将基因组数据与表型测定相关联,这项工作挑战了目前基因组隐私的概念,Craig Venter及其他作者写道。它将对个人隐私、知情同意、数据去识别,以及警察办案产生重大的伦理和法律影响。

在这项研究中,Venter及其同事以1,061名个体作为研究对象,其祖籍分别为非洲、欧洲、拉丁美洲、东南亚等地。首先,他们利用统计模型来研究全基因组序列与身体表型之间的关系,以预测三维面部结构、语音特征、生物学年龄、身高、体重、BMI指数、眼睛颜色、皮肤颜色、秃发或头发颜色。

当研究人员在基因组序列(平均覆盖度为30倍)上应用个体预测模型和综合学习模型时,他们发现,遗传上简单的特征可以相当准确地预测,比如眼睛或皮肤的颜色。不过,其他特征也能慢慢理清。

例如,根据体细胞突变、性染色体嵌合的丢失以及端粒缩短,研究人员可以对个体的年龄进行估计。同时,他们也可以从基因组的SNP模式入手,对身高做出相对靠谱的预测,不过体重和BMI指数都比较棘手。基因组数据还实现了面部特征和声音特征的预测,从而进一步提供年龄和祖先的线索。

根据这些,研究人员提出了一种整合预测信息的方法,并利用他们所谓的最大熵算法将其他人的基因组序列和表型相匹配。在随机选择的100人中,他们能够根据基因组序列将人们分为10人的亚组,距离个体识别又近了一步。

作者指出,这些知识对法医学可能很有用。不过,这些结果也带来了如何正确使用和保护基因组序列的严重问题。为保护个人隐私,美国发布了健康保险携带和责任法案(HIPAA),以确保患者信息是去识别的,但基因组序列目前还不算识别数据。

如果以不道德的目的开展研究,这种方法可能会损害那些将基因组贡献给数据库的个人的隐私,Venter及其同事总结道。尽管基因组数据的分享是非常有价值的,但我们的研究表明,基因组不能被认为是完全不可识别的,应通过适当的安全水平来分享。

上一篇:一口痰测肺癌:试剂盒已获准生产,可与影像学检测相互补充 下一篇:血液中的游离DNA——未来的“分子听诊器”

首 页|公司产品| 公司资讯|联系我们| 版权所有 2017-2020 北京佰瑞达生物科技有限公司

电话/传真:010-87265571 电子邮件:bioradars@yahoo.com 北京市丰台区石榴园北里42号楼2单元411 ICP:京ICP备18031683号-1