好的,各位朋友大家好,欢迎收听本期的《科学播报》。2003年4月14日,人类基因组计划的测序工作已经完成。但目前为止,人类究竟有多少基因这个问题,仍未有统一答案。即使是在人类基因组项目完成十多年后的今天,鉴定基因仍然是一个挑战。
2000年,当时人类基因组测序仍处于筹备阶段;遗传学家就猜测了人类究竟有多少个基因。将近二十年过去了,手握实际数据的科学家们依然无法就这一数字达成一致,并且他们认为这个知识缺口会阻碍人们发现疾病相关的基因突变。
5月29日,生物学期刊上刊登了一项人们为了解决这个问题所做出的新尝试。这个来自美国约翰·霍普金斯大学的研究团队使用了上百的人体组织样本的数据,发现了约五千个之前未曾发现的基因,其中近一千二百个基因带有制造蛋白质的指令。得出的蛋白质编码基因总数超过两万一千个,较遗传学家之前两万个左右的估算,有了较大提升。
但专业人员却认为数目上的差异在某种程度上可能是由研究团队所分析的数据量导致的。另外,权威基因数据库都依靠手动管理——有专人审核每一个基因相关的证据并做出计入与否的最终决定,而这个团队则完全由计算机程序来筛选数据。
科学家们还需要更多的证据来证明清单的准确性。专业人员扫描了该研究团队鉴定出的约100个蛋白质编码基因,他们认为,其中只有一个是货真价实的编码基因。同时专业人员还检查了十几个研究小组得到的新蛋白编码基因,发现没有哪一个能满足权威基因库的标准。其中一些与似乎属于逆转录病毒基因组的部分区域重叠,而另一些则属于其它重复片段,并且很少被翻译成蛋白质。
但该研究团队认为有些重复序列也可以被认为是基因。比如ERV3-1就被收录在基因库中,并且编码一种在结直肠癌中过表达的蛋白质。当然他们也承认他们的团队所发现的新基因还有待自己和其他研究组的进一步验证。
准确掌握人类基因的全部数量对于揭示基因与疾病之间的关联具有重要意义。没有被统计进基因库的基因即便是带有致病的突变,也常会被人们忽略。但也有人认为贸然添加新基因亦有其风险。被错误计入的基因可能会误导遗传学家,导致真正的问题被无视。