蜜桃无码视频,欧美日韩一=三道夲,国产精品午夜AV电影网免费看,aaa.www

歡迎來到 常識詞典網(wǎng) , 一個(gè)專業(yè)的常識知識學(xué)習(xí)網(wǎng)站!

[ Ctrl + D 鍵 ]收藏本站

您所在的位置:首頁 > 教育學(xué)習(xí) > 問答

問答

GPU 出現(xiàn)得遠(yuǎn)比 CPU 晚,其浮點(diǎn)運(yùn)算性能卻遠(yuǎn)遠(yuǎn)強(qiáng)于 CPU?

分類: 問答 常識詞典 編輯 : 常識 發(fā)布 : 11-17

閱讀 :558

為什么 GPU 出現(xiàn)得遠(yuǎn)比 CPU 晚,其浮點(diǎn)運(yùn)算性能卻遠(yuǎn)遠(yuǎn)強(qiáng)于 CPU?GTX295峰值極限浮點(diǎn)性能測試 - 實(shí)測823GFlops11 個(gè)答案

答案 1:

在摩爾定律尚成立的時(shí)代,出現(xiàn)晚的處理器正應(yīng)該對應(yīng)更高的FLOPS(原因是更高的運(yùn)算電路密度 更高的時(shí)鐘頻率和更多的處理器內(nèi)核)。02年GPU出現(xiàn)伊始,其浮點(diǎn)運(yùn)算性能和當(dāng)時(shí)的CPU差別并不大,之后的將近十年,CPU處理器的發(fā)展遇到了瓶頸(電路密度由于制造工藝而無法大幅優(yōu)化 時(shí)鐘頻率由于高功耗也無法進(jìn)一步提升 多核由于其他方面的消耗 并未使運(yùn)算效率線形提升),摩爾定律逐漸開始失效,然而計(jì)算機(jī)圖形學(xué)這個(gè)應(yīng)用領(lǐng)域卻非常適合單指令多數(shù)據(jù)/線程(SIMD/SIMT)的并行化。因此,GPU在圖形及通用并行計(jì)算方面都取得了飛速的發(fā)展。相對于傳統(tǒng)CPU中單處理器支持單個(gè)硬件線程的架構(gòu),基于眾核架構(gòu)的GPU采用一個(gè)處理器支持多個(gè)硬件線程的做法,這方面的介紹在Berkeley和Stanford的有關(guān)并行計(jì)算的課程上都有講到(.cs.berkeley.edu/~demmel/cs267_Spr11/ code.google/p/stanfo...)。NV自2007年開始推出CUDA至今,已經(jīng)發(fā)展出了一套完整的二級并行架構(gòu)。其中一簇執(zhí)行同樣指令的線程組成一個(gè)kernel,kernel又組合成一個(gè)block,在block級別有共享內(nèi)存和其他的供線程間通信合作的機(jī)制。形象地說,這里的線程就是一個(gè)虛擬的向量處理器,其中包括自己的寄存器,程序計(jì)數(shù)器(PC)等,而一個(gè)block就是一個(gè)虛擬的多核處理器,其中包含多個(gè)線程和共享內(nèi)存等。造成GPU和CPU根本差別的原因在于不同的目標(biāo)需求:GPU假設(shè)運(yùn)行其上的工作都是高度可并行的,而CPU需要同時(shí)很好的支持并行和順序操作。于是,CPU需要大的片上緩存和復(fù)雜的控制邏輯,GPU則利用多線程并行運(yùn)行節(jié)省了片上的大緩存,同時(shí)針對一簇線程執(zhí)行同一套控制邏輯。因此,在高度并行化且數(shù)據(jù)規(guī)模巨大的應(yīng)用下,GPU可以獲得很高的浮點(diǎn)運(yùn)算性能,然而如果問題無法良好映射到某個(gè)合適的并行模型或當(dāng)數(shù)據(jù)規(guī)模較小時(shí),SIMT就無法發(fā)揮并行的優(yōu)勢,CPU與GPU之間的數(shù)據(jù)交換也會大大降低運(yùn)算效率。不過,后一個(gè)問題在剛剛發(fā)布的CUDA4.0中已經(jīng)通過GPUDirect2.0得到了改進(jìn))。

答案 2:

樓上王洋子豪已經(jīng)講的很詳細(xì)了,這里我補(bǔ)充一點(diǎn),就是如果硬件用于計(jì)算規(guī)整的,并行度高的算法,那么很容易針對算法進(jìn)行優(yōu)化,而通用算法則因?yàn)槠漤樞驁?zhí)行,而執(zhí)行順序的高度不確定性,無法有效的進(jìn)行優(yōu)化。在現(xiàn)代處理器工藝上,處理器比內(nèi)存的速度高3個(gè)數(shù)量級是很正常的事情。由于程序和數(shù)據(jù)主要存在內(nèi)存,因此CPU很多時(shí)候是在等待內(nèi)存提供下一步需要的數(shù)據(jù)和代碼。另外,因?yàn)镃PU的工作主要是順序執(zhí)行,在某一步的結(jié)果沒有計(jì)算出來之前,下一步計(jì)算就很難繼續(xù),缺乏并行性是限制CPU性能的重要因素。因此GPU的浮點(diǎn)性能高于CPU,主要是得益于其所處理的算法和數(shù)據(jù)的特性。

答案 3:

晚出來的架構(gòu)方面也會更有優(yōu)勢啊,沒記錯(cuò)的話,GPU是并行計(jì)算,流水線短,并且GPU專門對圖形計(jì)算做了優(yōu)化

答案 4:

CPU除了負(fù)責(zé)浮點(diǎn)整形運(yùn)算外,還有很多其他指令集的負(fù)載,比如多媒體-,硬件-等,所以CPU是個(gè)多才多藝的東東,而GPU基本上就是只做浮點(diǎn)運(yùn)算的,因?yàn)樗蛔龈↑c(diǎn)運(yùn)算,設(shè)計(jì)結(jié)構(gòu)簡單,所以可以做的更快另外顯卡的GPU和單純?yōu)榱伺芨↑c(diǎn)高性能運(yùn)算的GPU還不是太一樣,顯卡的GPU還要考慮配合圖形輸出顯示等方面,而有些專用GPU設(shè)備就是一個(gè)PCI卡上面有一個(gè)強(qiáng)力浮點(diǎn)運(yùn)算GPU,沒有顯示輸出的,就是為了加快某些程序的浮點(diǎn)計(jì)算性能

答案 5:

我也想說一點(diǎn)題外引申的,就好比城市交通里,有公交線、有地鐵線、有人行道、有天橋,交通的方式越是多樣,管理越是復(fù)雜,東京是以地鐵線復(fù)雜出名,歐洲是軌道交通,美國是公路交通,它們都是GPU,而-是個(gè)CPU

答案 6:

一般而言GPU的浮點(diǎn)計(jì)算精度是不行的,另外GPU通常采用超長指令級和超寬的內(nèi)存總線實(shí)現(xiàn)在一個(gè)時(shí)鐘周期之內(nèi)完成多個(gè)并發(fā)計(jì)算,以此換取性能。

答案 7:

一個(gè)面團(tuán) 加了豆沙變成豆包 加了肉餡變成肉包 需求不同

答案 8:

應(yīng)用的側(cè)重點(diǎn)不同..

答案 9:

導(dǎo)致GPU在某些運(yùn)算上比CPU快的因素有很多,一種簡單的理解方式:CPU上大量的晶體管被用來做Cac-e,而GPU上絕大部分晶體管被用來做ALU。用來做運(yùn)算的晶體管多了,自然速度會快。但不是所有的并行運(yùn)算在GPU上都快。需要滿足一些限制條件才能充分發(fā)揮GPU的處理能力,比如內(nèi)存訪問的Pattern / Branc-的類型和數(shù)量。

答案 10:

技術(shù)上大家都介紹的差不多了,不過你問的很搞笑,出現(xiàn)的晚為啥不能比早的好或快??? 飛機(jī)汽車出現(xiàn)的晚,多快?。?

答案 11:

對不起,看到這個(gè)題目,實(shí)在忍不住,實(shí)在忍不住,要水一下:余華《許三觀-記》里的一句話,「-毛出得比眉毛晚,長得倒比眉毛長」我爽了,大家「沒有幫助」我吧。

下一篇:電視劇要播片頭曲、片尾曲? 下一篇 【方向鍵 ( → )下一篇】

上一篇:新浪微博的-詞庫是由自己整理編寫,還是由某些部門下發(fā)? 上一篇 【方向鍵 ( ← )上一篇】

极品大屁股 在线播放| 亚洲一本大道中文在线| 女百合精品久久| 久久99精品久久久久久hb| 被黑人做到高潮| 亚洲中文字幕乱码国产| 熟妇人妻无乱码中文字幕| 亚洲精品无码视频免费| 国产成人无码精品A级毛片抽搐| 久热九九| 亚洲欧美一区二区三区另类| 成人动作片免费一区| 国精产品一区一区三区mba视频| 亚洲中文久久久久无码| www亚洲成人精品无码| 国产欧美综合在线匹| 久久免费视频观看六| 色噜噜黑人| 2021亚洲福利在线| 久久综合久久中文字幕剧情类别| 99久久精典| 国产精品久久久久久久久久久不卡| 亚波多野结衣洲精品无码久久| 久久久夜色精品亚洲| 色综合视频一区二区三区44rt| 欧美中文日韩一区| 国产AV无码一区精品天堂| 亞洲歐美成人| 一进一出好爽| 成人做受视频试看120秒| 五月香伊人| 国产伦精品一区二区三区高清| 2020国产午夜福利久久| 国产视频一二三| 偷窥无码视频| 国产成人无码久久精品| 欧美精品成人一区二区视频一 | 精品国产三级A∨在线麻豆| 国产一级a爱做片免费看| 中文字幕日本一区二区| 吴忠市|