| 主页 | 频道首页 | 本站地图 | 论坛留言 | 合作联系 | 本站消息 | |
科技动态 技术发展 文化研究 生物生态 人的研究 生命起源 基因工程 科学普及 科学探索 专题其他

数了20年,科学家为何还在争论人到底有多少个基因

2018-06-29
人到底有多少个基因
数了20年,科学家为何还在争论人到底有多少个基因?
原创: Nature自然科研 Nature自然科研

原文以New human gene tally reignites debate为标题

发布在2018年6月19日的《自然》新闻上

原文作者:Cassandra Willyard

研究人员对人类基因组进行测序已有十五年左右的时间,但是人类究竟有多少基因,仍未有统一答案。


一群微醺的遗传学家、美国纽约州冷泉港的一间酒吧、纯粹的猜测,这些元素构成了估算人类基因组基因数目的最初几次尝试之一。

在人类基因组项目完成十多年后,鉴定基因仍然是一个挑战。

来源:Alan Phillips/ Getty

时间回到2000年,当时人类基因组测序仍处于绘制草图的阶段;遗传学家则在进行一场“豪赌”:人类究竟有多少个基因。有的认为有几万,有的认为有几十万。将近二十年过去了,手握实际数据的科学家们依然无法就这一数字达成一致意见——他们认为这个知识缺口会阻碍人们发现疾病相关的基因突变。


5月29日,人们为填补这个缺口而做的最近一次尝试,其结果发布在了预印本服务器BioRxiv上。这项研究使用了来自数以百计的人体组织样本的数据,发现了约5000个之前未曾发现的基因,其中近1200个带有制造蛋白质的指令。得出的蛋白质编码基因总数超过21000个,较之前的估算——20000个左右——有了较大提升。


然而很多遗传学家并不相信所有这些新基因都能经受住学界进一步的推敲。他们的批评凸显了鉴定新基因,甚至定义基因是什么有多么地困难。


美国约翰·霍普金斯大学的计算生物学家Steven Salzberg说:“人们在这一领域已经努力了20年,但却依然没有得到答案。”正是他的团队得出了最新的基因计数。


难下定论

2000年,基因组学学界对能发现多少个人类基因的问题争论不断,在这样的背景下,现任欧洲生物信息学研究所(EBI)联席主任的Ewan Birney发起了一项名为GeneSweep的比赛。他在一次遗传学年会期间在一间酒吧里下了第一笔赌注,比赛最终吸引了超过1000名参与者,总奖池达3000美元。针对基因数目的下注范围低至26000个以下,高至312000个以上,平均在40000个左右。时至今日,人们的预估范围已经缩小了——大多数估计都在19000至22000个之间,但分歧依然存在(详见“基因计数”)。

来源:M. Pertea & S. L. Salzberg

考虑到分析数据、分析工具和剔除假阳性的标准的不同,基因计数可能存在差异。在最近的这次计数中,研究人员选用了一个规模更大的数据集、与以往不同的计算方法以及一个较宽泛的基因定义。


Salzberg团队使用的是来自基因型-组织表达(GTEx)项目的数据。GTEx对几百具尸体的30多种不同组织的RNA进行测序。RNA是DNA和蛋白质中间的媒介。研究者想鉴定出编码蛋白质的基因和那些非编码但仍然在细胞里扮演重要角色的基因,因此他们把GTEx的9000亿微小RNA片段组装起来与人类基因组进行比对。


然而仅凭一段DNA可以被表达为RNA这一点,并不能说明它就一定是一个基因。因此,团队尝试采用了一系列手段滤除数据噪音。例如,他们把自己得到的结果与其它物种的基因组进行比较,这背后的逻辑是亲缘关系较远的生物间共有的序列很可能是因为有某种用处而被演化所保留,所以这些序列有可能是基因。


最后,研究团队得到的是21306个蛋白质编码基因和21856个非编码基因——远远超过目前使用最广泛的两个人类基因数据库。EBI维护的GENCODE基因数据库包括19901个蛋白编码基因和15779个非编码基因,美国国家生物信息技术中心(NCBI)运行的数据库RefSeq则包括20203个蛋白编码基因和17871个非编码基因。


NCBI的基因组研究人员、RefSeq前负责人Kim Pruitt认为数目上的差异在某种程度上可能是由Salzberg团队所分析的数据量导致的。另外还有一个重大的区别:GENCODE和RefSeq都依靠手动管理——有专人审核每一个基因相关的证据并做出计入与否的最终决定,而Salzberg团队则完全由计算机程序来筛选数据。


“如果人们认可我们的基因清单,那么也许几年后我们将成为人类基因研究领域的权威。”Salzberg如是说。


模棱两可的计数

但是许多科学家都说他们需要更多的证据才能相信清单是准确的。EBI的计算生物学家Adam Frankish负责协调GENCODE的手动注释工作,他说他和他的小组扫描了Salzberg团队鉴定出的约100个蛋白质编码基因。根据他们的评估,其中似乎只有一个是货真价实的编码基因。


Pruitt的团队检查了十几个Salzberg小组得到的新蛋白编码基因,但发现没有哪一个能满足RefSeq的标准。其中一些与似乎属于逆转录病毒基因组的部分区域重叠(这些病毒过去侵入了人类祖先的基因组),而另一些则属于其它重复片段——它们很少被翻译成蛋白质。


但Salzberg认为有些重复序列可以被认为是基因。ERV3-1就是其中一例:它被收录在RefSeq中并且编码一种在结直肠癌中过表达的蛋白质。Salzberg也承认他的团队所发现的新基因还有待他们自己和其他研究组的进一步验证。


基因并没有一个明确且不变的定义,这使得计数工作变得更为复杂。生物学家过去认为基因就是编码蛋白质的序列,但后来了解到一些非编码的RNA分子在细胞里也起重要作用。裁定哪些序列是重要的、应该被视为基因,是存在争议的,这或许可以解释Salzberg与其他人的计数之间存在的部分差异。


瑞士日内瓦大学的遗传学家、GTEx项目的联席主席Emmanouil Dermitzakis认为,Salzberg团队鉴定出的基因至少有一部分仍可能被证明有效。考虑到GTEx数据集巨大的规模,在看到该研究团队得出的蛋白质编码基因计数较之前增加5%时,他并没有感到太惊讶。


准确掌握人类基因的全部数量对于揭示基因与疾病之间的关联具有重要意义。Salzberg说没有被统计进来的基因即便是带有致病的突变,也常会被人们忽略,但Frankish则认为贸然添加新基因亦有其风险。被错误计入的基因可能会误导遗传学家,导致真正的问题被无视。


数据库不一样,基因数目就不一样,Pruitt认为这对研究人员来说是个棘手的问题。“人们只需要一个答案,”她补充道,“可生物学是很复杂的。”ⓝ

Nature|doi:10.1038/d41586-018-05462-w



双胞胎太空实验,DNA发生神秘突变
转基因已经OUT,基因编辑食物或会端上餐桌
DNA译码,身体生病是因为意识生了病
一篇文章揭秘转基因食品真相
用DNA做的「有机计算机」可以处理人体内的数据
人类胚胎DNA是条不得跨越的界线
市民起诉农业部升级:北京法院追加孟山都为转基因连带被告
世卫组织称孟山都农达除草剂可能致癌
日媒:美国借转基因技术谋求世界粮食霸权
最新研究发现人体存在145个“外来基因”
文化如何影响人类的基因
许智宏院士在转基因问题的立场是科学和理性的吗
注入人脑基因Foxp2老鼠破解迷宫变快了
医学诺奖得主:警惕转基因对物种的影响
湖北多地种转基因大米 农民种两稻一种吃一种卖
科学家通过基因剪辑技术首次“删除”艾滋病毒
转基因利益集团浮出水面:科研工作者与大型企业联姻
藏人带有已灭绝的古人类基因
老鼠吃转基因长肿瘤的论文经过同行评议,再次发表!
中国出台:转基因食品未标识不得销售
转基因食品辨识上的两个误导
科学家称:我们的DNA此时此刻正在变异
广州军区:禁向驻军提供转基因粮油
武汉大米检测三成样品含转基因 公众被实验十年
美将用双胞胎对比太空对DNA的影响
袁隆平:转基因不能一概而论 抗虫抗病者应特别谨慎
表观遗传学及其相关研究进展
表观遗传学
环境如何影响人类基因
美国孟山都陷入转基因漩涡 成消费者公敌
生物学家:遗传非决定一切 思维可掌控基因
农业部“引导”骨干种子企业研发转基因新品种
美或搜集华人基因 欲用基因战不战而胜
农业部:坚定不移推进转基因重大专项研究
陈锡文:中国食用转基因农产品只有木瓜
农业部:转基因研发要积极 推广应用要慎重
袁隆平:正研究把玉米基因转入水稻 可提高产量
美日高价进口中国非转基因大豆:不仅吃还做药
转基因种子能不能留种
科学家发现了DNA暗藏的第二套编码
专家:转基因技术灭绝人类 学界支持因利益诱惑
新技术可确定DNA源于母亲还是父亲
美国科学家发现DNA生物时钟
农业部刊文:吃转基因食品会导致绝育纯属造谣
上海自贸区禁止投资转基因
事实胜于雄辩——“转基因”不增产
院士联合签名发公开信称郎咸平等造谣转基因
含有草甘膦的转基因大豆严重危害人类健康
我为郎咸平说几句话-转基因事件
如何辨别转基因农产品和传统农产品
安徽转基因大米调查:常规检测无转基因一项
如何科学理智地对待转基因产品?
转基因作物影响生猪健康 胃炎比例高于传统饲养
Science:大型研究寻找“高学历”基因
农业部公布我国部分转基因食品名单
转基因抗虫效果存疑 基因污染或致超级杂草
隐藏在转基因作物中的“秘密病毒”
转基因三十问
转基因玉米和非转基因玉米的营养区别
孟山都在农业院校颁奖揽人才
“反转基因斗士”倒戈,却称自己不吃转基因
人类细胞中发现四螺旋DNA结构
领导基因rs4950决定你是否未来会当领导
饶毅:转基因期待理性
孟山都第一帝国兴衰史
我们97%的DNA都有着更高级的目的而不是“垃圾”
“垃圾DNA”的逆袭
科学家发现人类400万基因开关有助控制疾病
参加《“黄金大米”疑云》网络访谈感想及再说伦理问题
“黄金大米试验合法且有意义”
科学家成功将一本书的内容写进DNA序列
全球首批“转基因婴儿”诞生引发伦理争论
中国输欧大米踏"刃"起舞 欧盟将实施最严苛检查
巴西五百万农户起诉孟山都公司
教授质疑孟山都转基因大豆审批 美国广告成科学依据
DNA测序和活体细胞内实现DNA可擦写数据存储
英公众与科学家爆发“转基因冲突”
日研究发现一个基因能遏制癌症
印度: 祸起“转基因棉花” 13年棉农自杀近20万
中山大学年轻帅气教授找到调节基因突变的方法
袁隆平谈转基因实验
科学家发现离婚基因-催产素受体基因
基因组序列新技术重现远古人类DNA全貌
匈牙利摧毁了孟山都所有的转基因玉米田
我国进入RNA诊断新时代
诺贝尔得主称DNA分子可以被“空间传送”―量子点印记实验效果
男性晚育更易引起基因突变但“效果”存在不确定性
欧盟加强管控中国大米产品值得关注
转基因后院起火,孟山都表现异常
自杀行为与自杀基因有关
科学家已证实DNA能够通过词汇和频率 进行重新编码
纽约大学科学家研制出可自我复制的人造DNA结构
转基因农作物安全评估
微小RNA研究报道汇总
微小RNA调控人体内靶基因表达的方式影响人的生理功能
曹明华:转基因食物在美国的争议
基因预测能“定命”你信不信
基因组分析和渐进性的演化改变
美用DNA制造出首个人造神经网络
研究发现与男性不育有关的基因突变
全球转基因作物累计种植面积逾10亿公顷
基因改造猪角膜皮肤内脏都可移植给人
全世界都在反对转基因ZT
人类学家颠覆经典理论:文化发展源自基因突变
中国转基因猴子诞生记
郑风田:印度为什么拒绝了转基因品种
转基因玉米惹祸
基因在脑记忆区发育中扮关键角色
划时代的论文与划时代的问题
基因粮食的人体危害
中国科学家发现白癜风易感基因
基因研究再次证明长寿是遗传的
转基因食品是天使还是魔鬼
基因谱分析证实尼安德特人与现代人交配
科技随笔:基因并不决定一切
英国Nature基因组研究
中国科学家首次成功解析肥胖蛋白基因结构
湖北等地转基因水稻形成规模种植
人体“第二基因组”初现端倪
绿色和平调查报告称转基因作物代价惨重
Science基因地理组计划
基因预测:遇见未来的自己
基因歧视第一案探触社会公平
染色体:诺奖得主的不完全答案
公众DNA测试意义何在
转基因棉引发减产之忧
基因未来(Genentech)
GENETIC CLUES TO LUNG CANCER AMONG SMOKERS
dna,基因1 dna,基因2

本栏目主要介绍基因工程方面,包括人类基因组计划、转基因、基因技术、数了20年,科学家为何还在争论人到底有多少个基因等。特别关注有关人与文化方面的研究。

『科学频道首页』 『本栏页首』 『关闭窗口』