非平衡化標記補全的多標記學習及其應用
發(fā)布時間:2020-06-12 19:03
【摘要】:多標記學習是處理真實世界具有豐富語義對象的主要學習框架之一。在人工智能、機器學習等方面應用廣泛。在多標記學習中,示例具有多種標記屬性,而這些標記間存在局部或者全局的相關性。顯然合理利用標記間的這種關系可以獲得額外的分類信息,這有利于提高多標記學習系統(tǒng)的性能。在真實世界中,樣本的標記數(shù)通常遠小于未標記數(shù),否則示例的多義性將失去意義。但不可否認的是未知標記中也可能包含了大量有價值信息。目前很多考慮標記相關性學習算法都是假定標記間相關性是對稱的,然而標記間關系并非一定對稱;谝陨峡紤],本文展開研究,主要工作如下:(1)目前眾多的研究者通常直接將標簽置信度矩陣作為先驗知識直接加入到分類模型中,并沒有考慮未標注先驗知識對標簽集質量的影響;诖颂岢鲆环N非平衡化標記補全的核極限學習機多標記學習算法:首先使用信息熵計算標記之間的相關關系得到標記置信度矩陣,然后利用非平衡參數(shù)方法對基礎的標記置信度矩陣進行改進,構建出一個非平衡的標記補全矩陣,最后為了學習獲得更加準確的標記置信度矩陣,將非平衡化的標記補全矩陣與核極限學習機進行聯(lián)合學習,依此來解決多標記分類問題。(2)針對近鄰空間的標記相關性問題,利用近鄰空間中元素的相關性提升近鄰標記空間的質量,提出一種近鄰標記空間的非平衡化標記補全算法:首先利用標記之間的信息熵來衡量標記之間關系的強弱,進而獲得基礎標記置信度矩陣;然后利用提出的非平衡標記置信度矩陣計算方法,獲得包含更多信息的非平衡標記置信度矩陣;接下來度量樣本在特征空間中的相似度,得到k個近鄰標記空間樣本,再利用非平衡標記置信度矩陣計算得到近鄰標記空間的標記補全矩陣,最后利用極限學習機作為線性分類器進行分類。(3)考慮樣本特征空間信息進行重構,增強特征空間的樣本聯(lián)系的同時引入標記相關性信息,提出一種結合均值漂移和非平衡化標記補全的多標記學習算法:首先利用均值漂移聚類方法將特征空間中特征間的信息進行重構;接著利用標記之間的信息熵來衡量標記之間關系的強弱,進而獲得基礎標記置信度矩陣;然后利用提出的非平衡標記置信度矩陣計算方法,獲得包含更多信息的非平衡化標記補全矩陣;最后利用重構的特征空間與非平衡化的標記補全矩陣構成新的訓練集,根據(jù)新的訓練集采用已有的線性分類器進行預測。
【圖文】:
下優(yōu)于其他算法。④ 對于 ML-KNN 算法,72%情況下,,在統(tǒng)計上與其他算法沒有顯著差異;在況下優(yōu)于其他算法。從上述分析可知,KELM-NeLC 算法性能最優(yōu),在 68%的情況下,在統(tǒng)計上優(yōu)于算法,其次是 LIFT 算法,在 36%的水平下,在統(tǒng)計上優(yōu)于其它算法,第三是 RE法,在 16%的水平下優(yōu)于其它算法。以上實驗進一步地說明了 KELM-NeLC 算法的有效性,標記間相關關系語義的合。
32(e)RL圖 4.2 不同評估指標下的基準多標記數(shù)據(jù)集測試的穩(wěn)定性指數(shù)4.5 本章小結在多標記分類學習中,近鄰標記空間中引入對標記相關性的研究可以提升分類器分類性能,為了充分利用這一關系本章引入了非平衡參數(shù),本章提出了一種近鄰標記空間的非平衡化標記補全算法 NeLC-NLS。將非平衡化標記置信度矩陣與近鄰標記空間結合,提升了近鄰標記空間的質量,并將其統(tǒng)一在一個學習框架下。實驗結果表明,NeLC-NLS 算法優(yōu)于一些常見的多標記學習算法。
【學位授予單位】:安慶師范大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:C81
本文編號:2709965
【圖文】:
下優(yōu)于其他算法。④ 對于 ML-KNN 算法,72%情況下,,在統(tǒng)計上與其他算法沒有顯著差異;在況下優(yōu)于其他算法。從上述分析可知,KELM-NeLC 算法性能最優(yōu),在 68%的情況下,在統(tǒng)計上優(yōu)于算法,其次是 LIFT 算法,在 36%的水平下,在統(tǒng)計上優(yōu)于其它算法,第三是 RE法,在 16%的水平下優(yōu)于其它算法。以上實驗進一步地說明了 KELM-NeLC 算法的有效性,標記間相關關系語義的合。
32(e)RL圖 4.2 不同評估指標下的基準多標記數(shù)據(jù)集測試的穩(wěn)定性指數(shù)4.5 本章小結在多標記分類學習中,近鄰標記空間中引入對標記相關性的研究可以提升分類器分類性能,為了充分利用這一關系本章引入了非平衡參數(shù),本章提出了一種近鄰標記空間的非平衡化標記補全算法 NeLC-NLS。將非平衡化標記置信度矩陣與近鄰標記空間結合,提升了近鄰標記空間的質量,并將其統(tǒng)一在一個學習框架下。實驗結果表明,NeLC-NLS 算法優(yōu)于一些常見的多標記學習算法。
【學位授予單位】:安慶師范大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:C81
【參考文獻】
相關期刊論文 前4條
1 何志芬;楊明;劉會東;;多標記分類和標記相關性的聯(lián)合學習[J];軟件學報;2014年09期
2 張振海;李士寧;李志剛;陳昊;;一類基于信息熵的多標簽特征選擇算法[J];計算機研究與發(fā)展;2013年06期
3 張敏靈;;一種新型多標記懶惰學習算法[J];計算機研究與發(fā)展;2012年11期
4 鄧萬宇;鄭慶華;陳琳;許學斌;;神經(jīng)網(wǎng)絡極速學習方法研究[J];計算機學報;2010年02期
相關碩士學位論文 前1條
1 殷洪峰;基于標簽相關性的多標簽分類算法及其在帕金森診療領域中的應用[D];南京大學;2017年
本文編號:2709965
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2709965.html
最近更新
教材專著