欧美日韩激情电影,久久亚洲精品毛片,日日夜夜天天综合入口,亚洲激情六月丁香

您的位置: 首頁 >科技 >

幫助找到人類基因組中缺失和重復的新方法

2022-08-24 21:20:51 編輯:孔晴雁 來源:
導讀 一種新的機器學習方法可以準確地識別已被復制或刪除的人類基因組區域 - 稱為拷貝數變異 - 通常與自閉癥和其他神經發育障礙有關。這項由...

一種新的機器學習方法可以準確地識別已被復制或刪除的人類基因組區域 - 稱為拷貝數變異 - 通常與自閉癥和其他神經發育障礙有關。這項由賓夕法尼亞州立大學研究人員開發的新方法整合了幾種算法的數據,這些算法試圖從外顯子組測序數據中鑒定拷貝數變異 - 僅對人類基因組的蛋白質編碼區進行高通量DNA測序。一篇描述該方法的論文,可以幫助臨床醫生提供更準確的遺傳性疾病診斷,發表在Genome Research期刊上。

“外顯子組測序正迅速成為鑒定臨床環境中遺傳變異的黃金標準,因為它比其他方法更快,更便宜,”賓夕法尼亞州立大學生物化學和分子生物學副教授,該論文的第一作者Santhosh Girirajan說。“然而,目前用于從外顯子組測序數據中鑒定拷貝數變異的算法具有非常高的假陽性率 - 它們識別的許多變體實際上并不真實。使用我們稱為“CN-Learn”的新方法,我們報告的大約90%的拷貝數變種是真實的。“

一種隨機森林機器學習方法,用于從外顯子組測序數據中識別拷貝數變異。在經驗證的一組遺傳缺失和重復上訓練了數百個決策樹的森林,然后可以使用從這些樹建立的模型來準確地識別樣本外顯子組測序數據中的拷貝數變異。圖片來源:賓夕法尼亞州Girirajan實驗室

人類基因組通常包含每個基因的兩個拷貝,一個在染色體對的每個成員上。當一個細胞分成兩個時,基因組被復制,以便每個子細胞獲得完整的基因補充,但偶爾會在基因組復制過程中發生錯誤,當存在于精子或卵細胞中時,會導致個體獲得更多或少于兩個基因拷貝。

為了從外顯子組測序數據中鑒定拷貝數變異,研究人員研究了從每個基因產生的DNA序列的相對數量。如果個體中只存在一個基因拷貝,那么他們希望看到的測序讀數比有兩個拷貝時更少,而且三個拷貝的基因會導致更多的讀數。但它并不那么簡單,因為許多其他因素可以影響從每個基因產生多少測序讀數。因此,研究人員開發了幾種算法,試圖從外顯子組測序數據中正確識別拷貝數變異。然而,單獨地,這些算法不是特別可靠。

“通常,復制數變量算法的大量誤報已經通過使用多種算法來處理,并且只計算所有方法所確定的變體 - 如維恩圖,”Vijay Kumar Pounraja說,他是研究生。賓夕法尼亞州立大學和論文的第一作者。“這種方法有許多缺點和局限,因此我們決定開發一種新的機器學習方法。”

CN-Learn整合來自四種不同拷貝數變異算法的數據,并使用一小組經過生物學驗證的缺失和重復來學習這些基因組事件的特征。這種學習過程由稱為“隨機森林”的機器學習算法促進,該算法使用數百個決策樹來模擬刪除和重復的遺傳背景與它們被驗證的可能性之間的關系。然后,CN-Learn使用此模型預測其他樣本中的刪除和重復,而無需驗證。

“關于患者的診斷和最終治療的決定是基于這些信息做出的,因此將它們弄好是非常重要的,”Girirajan說。“正因為如此,我們已經將CN-Learn和所有必要的支持程序提供給一個簡單的軟件包下載。”


免責聲明:本文由用戶上傳,如有侵權請聯系刪除!

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經網.復制必究 聯系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創”外所有信息均轉載自互聯網 版權歸原作者所有。

主站蜘蛛池模板: 嘉兴市| 洛川县| 绥阳县| 台北县| 正定县| 承德市| 武义县| 军事| 内乡县| 平利县| 太保市| 宜川县| 郸城县| 揭阳市| 梨树县| 巨鹿县| 九龙坡区| 深水埗区| 阜新市| 大庆市| 壤塘县| 台中县| 上高县| 富平县| 铜川市| 二连浩特市| 汝城县| 石渠县| 堆龙德庆县| 常宁市| 神农架林区| 汨罗市| 新泰市| 宁化县| 游戏| 新邵县| 固阳县| 柳州市| 澜沧| 金溪县| 兴文县|