組學數(shù)據整合與功能模塊化分析構建棉花全基因組注釋體系
發(fā)布時間:2017-12-14 12:39
本文關鍵詞:組學數(shù)據整合與功能模塊化分析構建棉花全基因組注釋體系
更多相關文章: 棉花 多組學數(shù)據整合分析 二倍體和多倍體 模塊化比較分析體系 精細功能注釋平臺構建
【摘要】:棉花是世界上重要的經濟作物之一,涉及農業(yè)和紡織工業(yè)兩大重要的國民經濟支柱產業(yè)。自2012年起,隨著雷蒙德氏棉(D基因組)、亞洲棉(A基因組)和陸地棉(AD基因組)全基因組測序組裝工作的相繼完成,對棉花基因組結構和功能進行精細注釋也越發(fā)迫切。目前公共平臺已積累了大量的組學數(shù)據,通過對高通量轉錄組和表觀基因組數(shù)據的整合與分析,在全基因組水平上對棉花基因進行精細注釋,將有助于研究棉花生長發(fā)育和應對脅迫的調控機制。本研究以A基因組亞洲棉和異源四倍體AD組陸地棉為主要研究對象,整合現(xiàn)有轉錄組數(shù)據,分別構建了兩種棉花的全基因組共表達網絡,并根據不同的生長階段和脅迫處理條件,利用基因表達譜展示手段進行網絡動態(tài)解析,成功預測了調控重要農藝性狀(如纖維生長和水分脅迫應答)的功能模塊。為了提高預測的可信度,將全局共表達網絡作為研究基礎,加入直系同源分析、順式作用元件分析和基因集富集分析(GO、KEGG和基因家族)等手段對基因功能進行模塊化注釋,并利用集團滲透算法分別在亞洲棉和陸地棉中確定了 1,155和1,884個共表達功能模塊以及213和135個miRNA靶基因功能模塊,對參與諸如代謝、病原體和脅迫應答、激素響應和生長發(fā)育等生物學過程的功能基因進行模塊化挖掘。同時,結合單個棉花物種的模塊化注釋手段和比較基因組學分析,通過利用96,466對直系同源基因或16,142個同源基因群功能網絡,比較子網絡的組成、啟動子區(qū)調控元件、基因表達譜和同源基因對,從而提高預測基因功能的可信度和降低復雜模塊功能預測的難度。此外,使用實驗室已有的棉花H3K4me3 ChIP-seq表觀基因組數(shù)據和多種組織的RNA-seq轉錄組數(shù)據,對進化過程中基因組結構和基因功能的保守性和差異性進行分析和注釋,從而在亞洲棉和陸地棉中預測出6,773和12,773個新轉錄本,并經過基因組共線性、ESTs和qRT-PCR的驗證提高了轉錄本的可信度。運用H3K4me3修飾圖譜結合共表達網絡進行模塊化分析的方法,試圖解析了棉花生長發(fā)育中組蛋白修飾差異和基因表達差異間的聯(lián)系。最后,構建的二倍體和多倍體棉花共表達網絡分析平臺ccNET,形成了整合基因組、轉錄組和表觀基因組的多層面模塊化比較分析體系,從而提高了棉花功能基因注釋效率和注釋范圍(http://structuralbiology.cau.edu.cn/gossypium/)。另外,基于多組學整合和模塊化分析手段,成功構建了谷子功能基因組數(shù)據庫SIFGD(http://structuralbiology.cau.edu.cn/SIFGD/)來提高其基因功能注釋率。整合的擬南芥表觀基因組和轉錄組的公共數(shù)據實現(xiàn)了對miRNA基因初始轉錄起始位點的預測,并且通過構建PTSmiRNA(http://structuralbiology.cau.edu.cn/PTSmiRNA/)平臺實現(xiàn)了結果的可視化。本研究采用多組學整合和模塊化比較分析方法,充分發(fā)揮了多組學整合分析的互補性和高效性,實現(xiàn)了對棉花的基因組結構和功能基因的精細注釋,以期對棉花生長發(fā)育和脅迫應答的功能模塊研究提供新視角,并為剛剛測序的植物和多倍體植物或作物提供可行的模塊化功能挖掘手段和功能基因組精細注釋分析方案。
【學位授予單位】:中國農業(yè)大學
【學位級別】:博士
【學位授予年份】:2017
【分類號】:S562;Q943.2
【參考文獻】
中國期刊全文數(shù)據庫 前5條
1 周超;趙毓;周少立;周道繡;;水稻表觀基因組研究進展[J];生命科學;2016年10期
2 謝浩;趙明;胡志迪;王大巾;孟旭莉;丁先鋒;;DNA測序技術方法研究及其進展[J];生命的化學;2015年06期
3 周仲華;王峰;陳金湘;;從基因組學到蛋白質組學:棉花分子生物學研究進展[J];棉花學報;2012年04期
4 ;Computational Identification of Protein-Protein Interactions in Rice Based on the Predicted Rice Interactome Network[J];Genomics, Proteomics & Bioinformatics;2011年Z2期
5 滕曉坤;肖華勝;;基因芯片與高通量DNA測序技術前景分析[J];中國科學(C輯:生命科學);2008年10期
中國博士學位論文全文數(shù)據庫 前2條
1 易欣;綜合分析組學數(shù)據以構建植物基因結構注釋與功能解析平臺[D];中國農業(yè)大學;2016年
2 張力圩;棉花功能基因組學平臺構建和非編碼轉錄組學數(shù)據挖掘[D];中國農業(yè)大學;2016年
,本文編號:1287951
本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/nykjbs/1287951.html
最近更新
教材專著