(通訊員 劉小磊)近日,趙書紅教授團隊在Nature子刊《Communications Biology》雜志上在線發表了題為“A gene prioritization method based on a swine multi-omics knowledgebase and a deep learning model”的研究成果。本研究發布了國際上首個豬整合組學知識庫ISwine,創建了一個基于卷積神經網絡模型和多組學信息的候選基因評分推薦系統,打通了從GWAS結果的顯著标記到候選基因推薦的“最後一公裡”。
單一組學的分析(如GWAS)往往止步于标記和表型間的“相關”,難以揭示“因果”,中心法則告訴我們遺傳信息從DNA轉錄到RNA,再翻譯生成各種蛋白質,行使特定的生物功能,一個完整的生物過程需要多個組學的參與。近年來,豬的多組學信息呈超指數型增長,如何解讀海量異質性的多組學數據,整合來自不同研究的多組學信息來解析遺傳變異與重要經濟性狀間的關系面臨着極大的挑戰。

為解決上述問題,團隊收集了公共數據庫中近乎所有的豬基因組數據、轉錄組數據以及性狀相關的文獻組數據。通過清洗、分析、以及結構化等過程,将這些數據以基因組變異數據庫、基因表達數據庫以及QTX數據庫的形式收錄到ISwine中。其中基因表達數據庫是豬中第一個基于轉錄組數據的表達譜數據庫,基因變異數據庫是豬中最大的變異信息數據庫, NCBI在2018年停止了對豬dbSNP數據庫的更新,ISwine将為豬遺傳育種研究人員提供豐富的基因組變異信息和完備的單倍型信息。另外,ISwine根據不同組學特點提供了用戶界面友好的浏覽、檢索、可視化、交互和下載模塊,用戶可以節約大量的分析時間和費用,方便快捷的利用這些海量的組學信息,例如直接輸入GWAS結果或候選基因列表,ISwine會基于卷積神經網絡模型和多組學信息針對目标性狀推薦“高分”候選基因。該策略可拓展應用到其他物種,為多組學信息在遺傳和育種中的應用提供了新思路。
永利和武漢理工大學計算機科學與技術學院聯合培養的博士後付玉華為論文第一作者。永利趙書紅教授、劉小磊副教授和武漢理工大學袁曉輝教授為文章共同通訊作者,上述研究工作得到了國家自然科學基金等項目的資助。
ISwine知識庫:http://iswine.iomics.pro
ISwine使用示例:http://iswine.iomics.pro/pig-iqgs/commonView?viewName=Tutorial
原文鍊接:https://www.nature.com/articles/s42003-020-01233-4