<rp id="drixl"></rp>
    1. <tbody id="drixl"></tbody>
      <th id="drixl"><track id="drixl"></track></th>
    2. Science封面紀念人類基因組工作草圖繪制完成20周年:數據共享與安全,價值應用與公平

      2001年人類基因組工作草圖繪制完成以來,基因數據快速應用普惠于民,基因產業得以發展,同時存在不少問題。2021年2月5日,人類基因組工作草圖發表20周年之際,Science期刊邀請數位學者回顧和展望,重點談到基因數據共享與安全、價值應用和公平的問題及思路,韓斐然博士受邀在基因慧平臺發布內容摘譯,僅供個人學術探討。

      原文 | Science ? 翻譯?| 韓斐然
      編輯 | Barney? 關鍵詞 | 數據共享 數據安全
      圖:Human Genome at 20(來源/Science

      【劃重點】

      • 關于公共數據共享的“百慕大原則”是人類基因組計劃所留下的寶貴遺產,推動了后續新冠數據共享等共識,但是具有身份辨識度的醫療信息不應該被共享。
      • 盡管任意兩個人之間的遺傳差異小于0.1%,但差異位點超過300萬個,且人類遺傳變異的分布不是隨機的。為了推動基因組學應用而避免導致全球健康狀況不平等,需要在研究中納入不同祖源和地理來源的個體。
      • 算法生物學正以更高的精度描繪并預測我們的身體。以海量數據作為基礎的生物學已形成了一個新的“醫療-工業聯合體”,提供更加個性化和更加精準的診療。但是它也將生物醫學更緊密地歸攏到科技巨頭身邊,這些科技巨頭期望將數據整合并從中獲取利益。這對隱私、數據所有權和算法準確性提出了重要挑戰。
      • 精準醫療已經日漸走入我們的生活,但它只有以一種既有價值、又可負擔的形式存在,它才能發揮出它的最大潛力。但如果只關注精準醫療是否負擔得起,而不考慮它的真正的價值,可能會導致與賦能醫療效率的工具本質大相徑庭。
      • 研究者應該停止把種族作為一個解釋健康、疾病、藥物反應等問題的生物學變量。讓來自不同群體的人都能夠獲得平等參與研究(包括臨床試驗)的機會并從中受益,同時讓科學家有更豐富的資源來增進對人類生物學的理解。
      • 超過3000萬人可以獲得他們詳細的基因組數據?;蚪M數據的大眾化可以幫助家庭重聚(以及疾病診療),但親屬之間的遺傳物質相關性意味著使用較小的數據庫就可以識別大部分人群,包括不在數據庫中的人群。DNA數據的高維度和連鎖不平衡意味著通過數據混合以及部分遮蓋的方式來保護個人數據的方法可能行不通。
      • 全球原住民數據聯盟(Global Indigenous Data Alliance)在關愛原則(集體利益、控制權、責任和道德)之外補充了公平原則(可查找、可訪問、可交互、可復用),讓數據具備更廣闊的的應用場景,可以保護數據的安全同時更好地為數據的使用提供機會。
      1. 及時的數據共享比以往任何時候都重要

      學者Kathryn Maxson Jones以及Robert Cook-Deegan談到,分享數據可以拯救無數生命。關于公共數據共享的“百慕大原則”是在HGP(Human Genome Project)組裝首個人類的參考基因組時所留下的寶貴遺產。從20世紀90年代之后,這些原則成為了開放科學的試金石。

      1996年2月,HGP的領導人們齊聚在百慕大來討論如何來加快人類參考基因組組裝的進程。盡管有一些顧慮,但委員會還是一致同意所有測序中心都需在24小時內在線上傳他們的數據,以及在出版物發表之前分享數據,但是大部分機構在出版之前會限制數據的傳播范圍,有的甚至會在文章發表之后仍然對數據保密。百慕大原則在那時還是非常獨特的,他們希望HGP資助的項目都可以在一天之內將數據開放給所有人。踐行這一原則并不容易,但當時的HGP解決了所面臨的挑戰,這也促使了如今數據共享的行業共識。

      John Sulston和Robert Waterston等在線蟲生物學中倡導的數據共享,成了踐行百慕大原則這一前衛想法的良好先例;同時,24小時內公開數據的想法也仍然是一種倡導而非強制要求,具備靈活性讓小型機構在不同監管環境下參與。同時,也發生過強制現象,例如HGP最大贊助方曾收到監管方嚴厲的信件,要求其遵循百慕大原則,否則將會被剔除國際測序聯盟。

      百慕大原則后來擴展到不同的社群,并且推動了很多類似倡議的誕生。例如在當前的新冠病毒肺炎的危機中,及時的數據共享就成了一個非常重要的共識。SARS-CoV-2病毒的基因組序列被迅速地組裝鑒定并且在2020年1月10日公布,揭開了后續疫苗研發和臨床試驗的序幕。COVID-19宿主遺傳學倡議以全球共享流感數據倡議為基礎,迅速而公開地將數據傳播出去。

      當然,數據的共享不是也不應該針對所有數據。例如,具有個人信息辨識度的醫療數據不應該像人類基因組一樣進行公開處理。許多社群采用了出版前分享的策略,并取得了較好的成功。就像研究阿爾茨海默癥的組織、蒙特利爾神經研究所和馬里奧·內格里研究所的“開放科學”實驗以及由結構基因組學聯合會等。

      圖:人類基因組計劃(來源/互聯網)
      2. 數據缺乏多樣性將阻礙基因組科學的發展

      Charles N. Rotimi, Shawneequa L. Callier和Amy R. Bentley在本部分討論到,盡管我們在非洲擁有共同的祖先起源,并且任意兩個人之間的遺傳差異也非常?。ǖ陀?.1%),但是這一個人的基因組可以攜帶超過300萬個差異位點,并且人類遺傳變異的分布并不是隨機的,在不同祖源和不同地理位置的群體之間,基因組(以及其他非遺傳因素)存在較大差異。

      但長久以來,基因組學的研究主要集中在歐洲血統的基因組上(編者注:這種情況在近10年有顯著改變)。多樣性和和具有代表性人群應同等重視已提升到基因組學領域的共識。?

      隨著這種共識的不斷發展,我們必須盡力理解和傳播這些信息:

      • 兩個來自撒哈拉以南的非洲國家的人在遺傳上的差異可能超過一個歐洲人和一個亞洲人之間的差異;
      • 有的特有的遺傳變異只能在非洲人群中發現,因為在約10萬年前離開非洲去世界其他地方的族群只攜帶了當時的一小部分變異;
      • 非洲的生態環境在人類基因組上留下了一些印記(如某些增加腎衰竭可能的變異),這些變異只在那些有來自非洲特定區域的祖先的人群中可以找到。

      同樣的,也有一部分具有醫學意義或歷史意義的突變在非洲人群中罕見或不存在。例如在亞洲、歐洲和美洲,由于與遠古人類的近親(例如尼安德特人)雜交而引入的一些基因組區域具備易感糖尿病或易感病毒的生物學功能。為了在全球推進基因組學在技術領域、臨床、公共衛生領域的應用而又不會進一步導致全球健康狀況不平等,我們需要在研究中納入不同祖源和地理來源的個體。?

      為了應對這些困難,在基因組學研究中對于人群多樣性的關注正在日益增加。許多項目,例如TOPMed、All of Us計劃、國際常見病聯盟(International Common Disease Alliance)、非洲人類遺傳與健康項目(H3Africa)、百萬退伍軍人計劃、GenomeAsia和COVID全球聯盟等,正推動研究參與者的多樣性,而在此過程中,研究者本身的多樣性也同樣值得關注?;蚪M學研究需要在研究分析和結論中更加重視不同的樣本,并且將資源集中在能力培養、消除障礙以建立多樣化的研究隊伍。

      圖:HOLLY GRAMAZIO/FLICKR(來源/Science

       

      3. 算法生物學嶄露頭角
      揭開基因組的謎底,需要快速而準確地在基因組的數據海洋中找到一段特定的序列(例如基因),這對研究者的專業知識有很高的要求,物理學家、數學家和計算機科學家們相繼將性規劃、散列和隱馬爾可夫模型等方法引入生物學。

      Hallam Stevens首先提到一個例子,在2000年,加州大學圣克魯斯分校的研究生Jim Kent用幾個星期近乎瘋狂地發明了第一個基因組組裝軟件——GigAssembler,能夠將全球不同實驗室產出的數以百萬計的DNA序列片段組裝在一起,形成人類基因組的草圖。幾乎同一時間,Celera Genomics收購了Paracel,后者是一家主要設計情報收集軟件的公司。Paracel擁有經過特殊設計的文本匹配的硬件和軟件,可以用于在基因組中迅速搜索基因。

      2005年以后,像摩爾定律一樣飛速發展的高通量測序技術生產出了越來越多的數據,需要更快的算法來建立索引并搜索。生物學借鑒了工業界的大數據方法,同時也推動了計算機科學的前沿發展。

      生物信息學和計算生物學圍繞算法的交叉也為生物醫學帶來了新的形式和新的市場。以海量數據作為基礎的生物學已經形成了一個新的“醫療-工業聯合體”,提供更加個性化和更加精確的診斷和治療。將個體基因型與數據庫進行比較的算法催生了一系列關于健康管理和疾病風險預測的方法,像23andMe這樣的直接面向消費者的基因組學公司可以利用算法來向公眾賦能一個更健康、更快樂、更長久的生活方式。

      這一現狀對隱私、數據所有權和算法準確性等提出了重要的挑戰,特別是如果我們期待基因組學避免成為監視的媒介,就需要盡快解決這些問題。很多科技公司通過使用機器學習的手段將日益增長的生物學數據和其他形式的個人數據相結合——我們去哪里,買什么,和誰交往,喜歡什么?而長期以來,我們對基因組學的期待一直受到隱私、歧視、社會分裂等因素的限制。算法生物學(Algorithmic biology)正在以更高的精度描繪并預測我們的身體,但是它也將生物醫學更緊密地歸攏到那些科技巨頭身邊,這些科技巨頭期望將數據整合并從中獲取利益。

      4.?精準醫療的價值與可及性
      Kathryn A. Phillips, Jeroen P. Jansen和Christopher F. Weyant在本部分談到,關于精準醫學的辯論通常集中在“我們是否負擔得起”這一話題上。但是如果只關注是否負擔得起,而不考慮它的真正的價值,可能會導致我們與賦能醫療效率的工具本質大相徑庭。
      負擔能力是我們是否能夠為這種醫療干預付得起錢,而價值可以通過每花費一塊錢取得的健康成果來進行衡量。理想情況下,精準醫療可以節省金錢同時也改善醫療結果;但是,絕大多數醫療措施都能夠以更高的成本帶來更好的結果,精準醫療也不例外。通過更好地區分它的價值和負擔能力,并且在兩者之間尋求平衡,我們可以更快地推進實現既有價值、又可負擔的精準醫療。?
      我們很難從科研文獻了解精準醫療的價值和負擔能力,這需要關于總成本、結果以及潛在成本的數據,但這些都很難獲取,因為成本總是在這之前產生,但是有益的結果卻需要較長的時間來體現。此外,由于后續的干預措施,精準醫療可能會帶來很多實質性的后續影響,不僅對于患者,也對于和他遺傳背景相似的其他家庭成員。新興的檢測可用于大規模人群的篩查,包括新生兒的基因組測序、腫瘤的液體活檢以及阿爾茨海默癥等疾病的預防性檢測。這些干預措施可以帶來巨大的好處,但是可能需要巨大的前期支出。另一方面,許多精準醫療干預措施會檢測與多種疾病相關的多個基因,從而帶來多方面的個人健康管理價值。?
      許多方法已經被用于綜合判斷精準醫療的價值和可負擔性,但是“成本-效果分析”往往不考慮對預算的影響,從而可能會出現不完整甚至相互矛盾的結論。那些同時考慮可負擔性和價值的評估開始更多地被決策者所接受。精準醫療已經日漸走入我們的生活,但它只有以一種既有價值,又可負擔的形式存在,它才能發揮出它的最大潛力。
      5. 終結種族和遺傳研究間“糾纏”
      (編者注:這部分為摘譯)Dorothy E. Roberts 談到,在人類基因組被首次發表之后,研究者證實了幾十年來的一個推測:種族是一種社會結構而非是一種源于基因組的自然劃分……現在,我們是時候去終結種族和遺傳學的“糾纏”,來朝著人類團結和多樣性的未來去努力。
      首先, 研究者應該停止把種族作為一個解釋健康、疾病、藥物反應等問題的生物學變量。將種族作為一個生物學變量掩蓋了結構性種族主義(structural racism)在不同族群中制造健康不平等的事實,而表觀遺傳學提供了一種研究方法,讓我們可以深入了解不平等的社會條件如何體現在我們的健康當中。但是研究人員必須謹慎,以防讓有害的表觀遺傳過程看起來持續而不可避免。
      其次,研究者應該停止使用白人/歐洲人的遺傳學標準,而是研究更廣泛的人類基因變異。生物醫學研究多樣化的目的不是尋找種族間固有的遺傳差異,而應當是讓來自不同群體的人都能夠獲得平等參與研究(包括臨床試驗)的機會并從中受益,同時讓科學家有更豐富的資源來增進對人類生物學的理解。通過這種方式,遺傳學可以更有助于進行個性化的診斷和治療,而不是依賴于基于種族來作出錯誤決定。
      6. 后新冠疫情時代的基因隱私
      Dina Zielinski 和Yaniv Erlich在這部分談到,2007年,只有Craig Venter和Jim Watson兩個人完成了他們的全基因組測序,而時至今日,超過3000萬人可以獲得他們詳細的基因組數據。這種基因組數據的大眾化可以幫助家庭重聚、反對種族主義以及促進遺傳知識的普及,但同時也讓更大規模的監視成為可能。
      親屬之間的遺傳物質相關性意味著使用較小的數據庫就可以識別大部分人群,包括不在數據庫中的人群。DNA數據的高維度和連鎖不平衡意味著通過數據混合以及部分遮蓋的方式來保護個人數據的方法可能行不通。隨著消費級基因組學以及允許自主上傳數據的第三方網站的出現,收集和訪問DNA數據正以一種越來越方便的形式出現。
      我們可以設想,新冠病毒的大流行將會加速“基因監控”的進程,人們可能會在邊境口岸被進行傳染病監測,政府可以借大流行的機會來建立到訪者的基因組數據庫。這樣的數據庫可以識別出到訪者母國人群的大部分人,而且隨著第三方數據庫規模的不斷擴大,幾乎每個人都可以被識別。
      在技術方面,限制這種識別措施的方法包括制造一些痕跡來將譜系追蹤引導到一個錯誤的結果,但是這些方法都缺少更加系統的和原則性的評估。除了技術對策之外,還需要一些政策上的指導意見,美國司法部制定的限制司法部門使用第三方數據庫的臨時規定是這方面的一大進步。公眾討論對于進一步的政策制定至關重要,這決定了我們是否能夠將基因革命的力量用于真正造福公眾。
      7.?土著的新興基因組倫理
      Nanibaa’ A. Garrison和Stephanie Russo Carroll分析,過去二十年中基因組學的研究取得了巨大的進展,但是卻仍缺乏代表性的土著民族。從土著民族收集的樣本可用于進行疾病研究、祖源研究等,但這些研究卻很少使參與者及其社群收益,甚至有的反而造成了傷害,例如刻板印象和文化信仰的損害。土著社群可能很少能夠從精準醫學、藥物基因組學等領域受益,并且健康服務上的差距很難得到正視。因此,很多土著民族在缺乏利益保障的情況下對參與基因組學研究躊躇不決。當地學者正在通過制定指南和標準的方式來解決人們的關切并為更加有益的研究創造基礎。
      文化一致的研究可以增進土著民族對研究的參與程度。原住民基因組學夏令營(SING)提升了社群成員對于本社群的研究興趣和能力,并且促使SING委員會指定了一個倫理研究參與框架。土著基因組研究倫理中心支持當地人主導的生物樣本庫和精準醫學研究,在加拿大、新西蘭等地也都有類似的組織在當地發揮作用。
      全球原住民數據聯盟(Global Indigenous Data Alliance)在關愛原則(集體利益、控制權、責任和道德)之外補充了公平原則(可查找、可訪問、可交互、可復用),讓數據具備更廣闊的的應用場景,可以保護數據的安全同時更好地為數據的使用提供機會。注重權利和利益,同時增強參與度和能力,可以更好地減少偏見,并且為所有人開展更相關的有益研究。
      8. 多元世界中的多基因評分的風險
      (本部分為摘譯)Pilar N. Ossorio談到,多基因風險評分(PRSs)是近年快速興起的技術,它可以將人基因組中多個多態性位點的微小影響匯聚成一個單一的評分。PRS可以在基因組關聯數據的基礎上對任何表型的數據進行計算,通常是根據等位基因的影響大小進行加權求和。在醫學和公共衛生領域,PRS可以用于治療方法選擇、進行額外的風險篩查或者行為管理。迄今為止,PRS已經在血壓、肥胖、糖尿病、抑郁癥、精神分裂和冠心病等多種復雜表型中取得功效。

       

      PRS也強調了基因組學中種族和祖源的重要相關性。最近一項分析表明,在之前的26項研究當中,以非洲和南亞血統為主的人群PRS預測能力顯著要差于歐洲血統的人群,證實了一些早期的研究并作出了擴展。一些其他的群體缺乏數據來進行準確評估,研究人員將這一結果歸因于非歐洲群體在數據集中的代表性不足。

       

      對于PRS的不同預測能力,研究者專門為非洲血統的人群開發了一些PRS算法,并且科學家們還在研究是否每個不同的族群都需要基于特定祖先的PRS。但這些研究結果很容易引導人們對種族的關注,而不是考慮社會不平等對于健康的影響,讓人們錯誤地認為種族之間的特征差異主要源于基因??茖W中的不公正可能是因為缺少某些群體,同時也可能是錯誤地包括了某些群體,包括不同國家和地區的群體樣本研究等。

      (備注:以上中文信息翻譯自英文材料,僅供個人學術探討,不代表任何機構的觀點,詳細詳細請以原文為主,見參考資料)

      本期作者
      (歡迎熱愛基因產業和善文字表達的同仁投稿
      含政策/技術/產品/產業等最新資訊和解讀)
      韓斐然

      浙江大學博士,聯川生物

      浙江大學博士,聯川生物單細胞VDJ免疫組測序及DNA重測序組負責人,統籌日常實驗與生信工作。擅長領域為腫瘤異質性與克隆演化,以及新抗原藥物靶點挖掘,并自主開發歐氏距離生信算法用于腫瘤異質性分析。

      參考資料:
      1.??Kathryn Maxson Jones et al., Complicated legacies: The human genome at 20, Science, 2021 Vol. 371, Issue 6529, pp. 564-569
      2. 百慕大原則簡介:https://www.genome.gov/25520385/online-education-kit-1997-bermuda-meeting-affirms-principle-of-data-release
      3. 人類基因組計劃:https://web.ornl.gov/sci/techresources/Human_Genome/project/index.shtml
      推薦閱讀
      新華社:最新報告顯示,我國基因行業正處在高速成長期

      《2021基因行業藍皮書》(預印版)正式公開發布

      2020基因行業盤點及2021展望(上)

      版權所有,未經允許不得轉載。基因慧—數字生命健康產業內容平臺 » Science封面紀念人類基因組工作草圖繪制完成20周年:數據共享與安全,價值應用與公平

      相關推薦

      搶沙發