基因-基因、基因-環(huán)境交互作用對(duì)復(fù)雜疾病的影響研究
發(fā)布時(shí)間:2025-06-24 03:31
全基因組關(guān)聯(lián)研究(Genome-Wide Association Study,GWAS)已識(shí)別出很多與人類復(fù)雜疾病相關(guān)的變異基因,但隨著二代測(cè)序技術(shù)的飛速發(fā)展,基因數(shù)據(jù)呈幾何倍數(shù)增長.由于基因數(shù)據(jù)具有樣本數(shù)量小,維度高,數(shù)據(jù)噪聲大等特點(diǎn),通過傳統(tǒng)統(tǒng)計(jì)學(xué)方法研究基因-基因、基因-環(huán)境交互作用比較耗時(shí)、費(fèi)力、效果也不盡人意,因此借助統(tǒng)計(jì)學(xué)方法結(jié)合數(shù)據(jù)挖掘技術(shù)準(zhǔn)確地分析基因-基因、基因-環(huán)境交互作用對(duì)復(fù)雜疾病研究有著重要意義.本文主要針對(duì)真實(shí)的GAW17數(shù)據(jù)集作以基因-基因、基因-環(huán)境交互作用的分析研究.利用Lasso算法來給GAW17數(shù)據(jù)集第一條染色體罕見變異基因的數(shù)據(jù)進(jìn)行降維,即變量篩選,由此得到了顯著的主效應(yīng)位點(diǎn)變量以及環(huán)境變量;然后利用由Lasso算法得到的主效應(yīng),在第二階段分別建立隨機(jī)森林模型、支持向量機(jī)模型,并分別對(duì)兩模型的參數(shù)進(jìn)行優(yōu)化,得到了比較顯著的基因-基因、基因-環(huán)境交互作用;我們進(jìn)一步對(duì)第二階段建立的隨機(jī)森林模型、支持向量機(jī)模型進(jìn)行了比較,得到了一系列評(píng)價(jià)指標(biāo),結(jié)果顯示,支持向量機(jī)模型的指標(biāo)結(jié)果均優(yōu)于隨機(jī)森林模型.通過與前人已有的研究進(jìn)行對(duì)比,我們發(fā)現(xiàn)本文所建立的兩個(gè)模型...
【文章頁數(shù)】:54 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢(shì)
1.3 本文的研究?jī)?nèi)容和方法
第2章 相關(guān)知識(shí)介紹
2.1 單核苷酸多態(tài)性
2.2 基因和基因的交互作用
2.3 基因和環(huán)境的交互作用
第3章 交互模型介紹
3.1 高維線性模型
3.2 隨機(jī)森林模型
3.2.1 決策樹算法介紹
3.2.2 隨機(jī)森林模型介紹
3.2.3 變量重要性評(píng)分
3.3 支持向量機(jī)模型
3.3.1 線性可分
3.3.2 線性不可分
第4章 數(shù)據(jù)預(yù)處理
4.1 GAW17數(shù)據(jù)介紹
4.2 GAW17數(shù)據(jù)整理
第5章 GAW17中復(fù)雜疾病數(shù)據(jù)的交互作用分析
5.1 模型建立及其數(shù)據(jù)分析結(jié)果
5.1.1 階段一: 基于Lasso算法的分析
5.1.2 階段二: 基于隨機(jī)森林算法的分析
5.1.3 階段二: 基于支持向量機(jī)算法的分析
5.2 方法比較
5.2.1 混淆矩陣
5.2.2 ROC曲線
5.2.3 方法小結(jié)
結(jié)論與展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
本文編號(hào):4052423
【文章頁數(shù)】:54 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢(shì)
1.3 本文的研究?jī)?nèi)容和方法
第2章 相關(guān)知識(shí)介紹
2.1 單核苷酸多態(tài)性
2.2 基因和基因的交互作用
2.3 基因和環(huán)境的交互作用
第3章 交互模型介紹
3.1 高維線性模型
3.2 隨機(jī)森林模型
3.2.1 決策樹算法介紹
3.2.2 隨機(jī)森林模型介紹
3.2.3 變量重要性評(píng)分
3.3 支持向量機(jī)模型
3.3.1 線性可分
3.3.2 線性不可分
第4章 數(shù)據(jù)預(yù)處理
4.1 GAW17數(shù)據(jù)介紹
4.2 GAW17數(shù)據(jù)整理
第5章 GAW17中復(fù)雜疾病數(shù)據(jù)的交互作用分析
5.1 模型建立及其數(shù)據(jù)分析結(jié)果
5.1.1 階段一: 基于Lasso算法的分析
5.1.2 階段二: 基于隨機(jī)森林算法的分析
5.1.3 階段二: 基于支持向量機(jī)算法的分析
5.2 方法比較
5.2.1 混淆矩陣
5.2.2 ROC曲線
5.2.3 方法小結(jié)
結(jié)論與展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
本文編號(hào):4052423
本文鏈接:http://www.wukwdryxk.cn/yixuelunwen/jichuyixue/4052423.html
最近更新
教材專著