深圳子科生物報道:基因組學(xué)研究一直都存在著不同水平的偏向性(bias)。種族偏向性自不必說,美國“我們所有人(All of Us)”大規(guī)模研究計劃的目標(biāo)之一就是對過去代表性不足的群體進(jìn)行抽樣,比如非裔美國人。
同時,歷史偏向性也一直存在。某些基因與疾病有著很強(qiáng)的相關(guān)性,但好像就是不入科學(xué)家的法眼,始終躺在角落里無人問津。如今,研究人員開始正視這些偏向性。
歷史偏向性
由于歷史偏向性,一些已被證明對人類疾病有重要意義的基因被忽視。之前的研究稱,現(xiàn)階段的研究主要集中在2,000個編碼基因上,而人類基因組中大約有20,000個基因。近一篇發(fā)表在《PLOS Biology》上的文章剖析了為什么研究人員只關(guān)注10%的基因。
研究團(tuán)隊發(fā)現(xiàn),歷史偏向性在這方面發(fā)揮了巨大的作用,而政策、資助和職業(yè)道路也成為主要的推動力。
西北大學(xué)的Thomas Stoeger談道:“我們發(fā)現(xiàn),目前對人類基因的研究并不反映基因的重要性。許多基因與人類疾病有著很強(qiáng)的相關(guān)性,但仍然沒怎么研究。相反,因為社會力量和資助機(jī)制強(qiáng)化了人們對過去研究課題的關(guān)注。”
研究團(tuán)隊此次分析了大約15,000個基因,通過系統(tǒng)方法來剖析內(nèi)在的原因。結(jié)果不僅解釋了為什么某些基因沒有被研究,還解釋了基因的研究程度。
他們發(fā)現(xiàn),那些關(guān)注“冷門”基因的博士后和博士生日后成為獨立研究員的幾率要低50%。除此之外,許多政策實際上是推動人們?nèi)パ芯磕切?ldquo;熱門”基因,也就是人類基因組計劃之前許多研究關(guān)注的基因。
自從2003年人類基因組計劃完成以來,許多研究基因的新技術(shù)已經(jīng)被開發(fā)出來。然而,不到10%的基因成為90%研究論文中的主角,而大約30%的基因更是從來沒研究過。人類基因組計劃的一個主要目標(biāo)是擴(kuò)大對人類基因組的研究。目前看來,這方面似乎有些失敗。
“一切理應(yīng)隨著人類基因組計劃而改變,但一切仍然保持原樣,”西北大學(xué)的Luis Amaral說。“科學(xué)家一直走向同一個位置,對著同一批基因。我們應(yīng)該把所有注意力都放在這一小組基因上嗎?”
“研究*相同的人類基因的偏向性非常高,”Amaral繼續(xù)說。“整個體系阻礙人們?nèi)パ芯亢土私庑碌臇|西。我們需要共同努力,鼓勵人們研究那些對人類健康很重要的其他基因。”
如今,西北大學(xué)的研究團(tuán)隊將利用他們的研究成果建立一個公共數(shù)據(jù)庫,以確定那些研究不多但與人類疾病有重要關(guān)聯(lián)的基因。
種族偏向性
早前的研究表明,兩個的遺傳數(shù)據(jù)庫中所包含的歐洲血統(tǒng)的遺傳數(shù)據(jù)要遠(yuǎn)遠(yuǎn)多于非洲血統(tǒng)。當(dāng)研究人員將642個非洲血統(tǒng)的全基因組序列數(shù)據(jù)集與當(dāng)前的基因組數(shù)據(jù)庫進(jìn)行比較時,他們發(fā)現(xiàn)對歐洲的遺傳變異有著明顯的偏好。他們將研究結(jié)果發(fā)表在《Nature Communications》雜志上。
“準(zhǔn)確報告遺傳變異是否引起了特定疾病或表型性狀的能力,在部分程度上取決于將變異標(biāo)記為致病性的可信度,”研究人員解釋說。“對于非歐洲血統(tǒng)的人來說,這種決定往往更加困難,因為人們對歐洲人群缺乏或不常見的變異知之甚少。”
在這項研究中,馬里蘭大學(xué)醫(yī)學(xué)院的研究人員將帶有注釋的致病變異(在線數(shù)據(jù)庫中認(rèn)定為致病的變異)和不帶有注釋的變異(未認(rèn)定為致病的變異,NAV)區(qū)分開來。
“盡管我們無法確定哪些變異是真正致病的,但是我們認(rèn)為真實致病性和注釋致病性之間的差異是偏向性的主要來源,”作者評論道。“這種差異的可能原因是數(shù)據(jù)庫中缺少特定人群的致病性信息,包括我們在此報告的非洲人群的致病性數(shù)據(jù)。”
研究人員發(fā)現(xiàn),不帶有注釋的變異與非洲血統(tǒng)有著很高程度的正相關(guān)性。因此,這個群體的致病遺傳變異(針)可能就藏在NAV類別(稻草)中,這無異于稻草堆里撈針。雖然非洲人的遺傳變異程度較大,但不帶有注釋的變異數(shù)量更大。
因此,現(xiàn)在必須擴(kuò)展數(shù)據(jù)庫,使之包含更廣泛的祖先。這將極大地改變非裔美國患者的臨床遺傳分析和診斷。與歐洲血統(tǒng)的人相比,分析這些患者基因組的任務(wù)更加困難且昂貴。
顯然,大家也認(rèn)識到這個問題。美國NIH在今年5月啟動了“我們所有人”的研究計劃,其目標(biāo)之一就是對在研究中代表性不足的群體進(jìn)行抽樣。
盡管這些偏向性看起來像是難以解決的問題,但只要人們意識到問題的存在,并采取措施來克服它們,問題還是有希望解決的。
相關(guān)文獻(xiàn)
Stoeger T, Gerlach M, Morimoto RI, Nunes Amaral LA. Large-scale investigation of the reasons why potentially important genes are ignored. PLoS Biol. doi:10.1371/journal.pbio.2006643 (2018)
Kessler MD, Yerges-Armstrong L, Taub MA et al. Challenges and disparities in the application of personalized genomic medicine to populations with African ancestry. Nat. Commun. 7, 12521 (2016)