片上多核處理器體系結(jié)構(gòu)下的串行程序加速方法
發(fā)布時間:2025-06-26 03:49
多核處理器經(jīng)歷了十幾年的發(fā)展,目前已經(jīng)成為處理器市場的主流。但是,由于結(jié)構(gòu)性差異,傳統(tǒng)的串行程序并不能在多處理器體系結(jié)構(gòu)下獲得性能提升。本文主要探討如何在片上多核處理器體系結(jié)構(gòu)下加速串行程序執(zhí)行。為解決這一問題,本文主要從兩個獨立的方向進行嘗試。 片上多核處理器豐富的硬件資源為加速串行程序執(zhí)行性能提供了一種新的可能。更大的指令窗口和最后一級緩存能夠提升大多數(shù)串行程序的執(zhí)行性能。本文中,我們提出了一種簡單的虛擬窗口機制加速串行程序執(zhí)行。方法的基本思想是將指令窗口中的長延遲指令發(fā)送到其它核,同時將最后一級緩存的換出塊發(fā)送到其它核的空閑緩存空間中,進而形成一個較大的指令窗口和最后一級緩存。所有的傳輸操作對程序員是透明的。一個核可以靜默的分享同一芯片上其它核的空閑硬件資源。方法的硬件開銷很小且容易實現(xiàn)。初步實驗證明該方法是提升片上多核微處理器平臺下串行程序性能的有效選擇。 同時,本文提出了基于子組的適應性緩存替換策略用以提升緩存性能。該方法將最后一級緩存組分成多個子組,一定時間內(nèi)只有一個子組為活躍組其它子組為非活躍組。當緩存失效發(fā)生時換出塊僅從活躍子組中選取。同時,每個緩存組都將設(shè)置...
【文章頁數(shù)】:55 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
圖表目錄
第一章 緒論
1.1 論文研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀分析
1.3 主要研究目標和主要工作
1.4 本文組織結(jié)構(gòu)
第二章 用于多核處理器的虛擬窗口技術(shù)
2.1 相關(guān)工作
2.2 片上多核的虛擬窗口工作機制
2.2.1 核間通信機制
2.2.2 檢測依賴指令
2.2.3 發(fā)射窗口和寄存器文件
2.2.4 信息報的格式
2.2.5 從遠端核中排空指令
2.2.6 相關(guān)問題
2.3 量化分析
2.3.1 實驗設(shè)計與結(jié)果分析
2.3.2 通信延遲和開銷
2.4 本章小結(jié)
第三章 基于子組的適應性緩存替換策略
3.1 試驗方法
3.1.1 基本配置
3.1.2 測試基準程序
3.2 基于子組的緩存替換策略
3.2.1 方法動機
3.2.2 緩存結(jié)構(gòu)變化
3.2.3 SRP的插入策略
3.2.4 SRP的命中策略
3.2.5 SRP活躍子組的輪轉(zhuǎn)策略
3.2.6 硬件實現(xiàn)
3.2.7 抖動工作集的案例研究
3.2.8 LRU友好型工作集的案例研究
3.2.9 實驗結(jié)果
3.3 基于子組的適應性替換策略
3.3.1 動態(tài)取樣機制
3.3.2 硬件實現(xiàn)
3.3.3 計數(shù)器重置機制
3.3.4 硬件開銷
3.3.5 閾值動態(tài)選擇機制的改進
3.3.6 對于ASRP中LRU插入策略的改進
3.3.7 ASRP算法流程圖
3.3.8 實驗結(jié)果分析
3.4 基于子組的適應性替換策略的多核擴展
3.5 本章小結(jié)
第四章 總結(jié)與進一步工作
4.1 全文總結(jié)
4.2 進一步工作
參考文獻
致謝
攻讀學位期間發(fā)表的學術(shù)論文
本文編號:4053112
【文章頁數(shù)】:55 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
圖表目錄
第一章 緒論
1.1 論文研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀分析
1.3 主要研究目標和主要工作
1.4 本文組織結(jié)構(gòu)
第二章 用于多核處理器的虛擬窗口技術(shù)
2.1 相關(guān)工作
2.2 片上多核的虛擬窗口工作機制
2.2.1 核間通信機制
2.2.2 檢測依賴指令
2.2.3 發(fā)射窗口和寄存器文件
2.2.4 信息報的格式
2.2.5 從遠端核中排空指令
2.2.6 相關(guān)問題
2.3 量化分析
2.3.1 實驗設(shè)計與結(jié)果分析
2.3.2 通信延遲和開銷
2.4 本章小結(jié)
第三章 基于子組的適應性緩存替換策略
3.1 試驗方法
3.1.1 基本配置
3.1.2 測試基準程序
3.2 基于子組的緩存替換策略
3.2.1 方法動機
3.2.2 緩存結(jié)構(gòu)變化
3.2.3 SRP的插入策略
3.2.4 SRP的命中策略
3.2.5 SRP活躍子組的輪轉(zhuǎn)策略
3.2.6 硬件實現(xiàn)
3.2.7 抖動工作集的案例研究
3.2.8 LRU友好型工作集的案例研究
3.2.9 實驗結(jié)果
3.3 基于子組的適應性替換策略
3.3.1 動態(tài)取樣機制
3.3.2 硬件實現(xiàn)
3.3.3 計數(shù)器重置機制
3.3.4 硬件開銷
3.3.5 閾值動態(tài)選擇機制的改進
3.3.6 對于ASRP中LRU插入策略的改進
3.3.7 ASRP算法流程圖
3.3.8 實驗結(jié)果分析
3.4 基于子組的適應性替換策略的多核擴展
3.5 本章小結(jié)
第四章 總結(jié)與進一步工作
4.1 全文總結(jié)
4.2 進一步工作
參考文獻
致謝
攻讀學位期間發(fā)表的學術(shù)論文
本文編號:4053112
本文鏈接:http://www.wukwdryxk.cn/kejilunwen/jisuanjikexuelunwen/4053112.html
最近更新
教材專著