ขนาดวิดีโอ: 1280 X 720853 X 480640 X 360
แสดงแผงควบคุมโปรแกรมเล่น
เล่นอัตโนมัติ
เล่นใหม่
显存的带宽是GPU和显存之间的带宽,除非你能让GPU来执行这个Windows的所有运算,否则实际生效的带宽其实是显卡的PCI-E的带宽,一般也就16G/s
nvme固态走PCIe通道,一般x4速率。x4 3.0的宽带也就32gbps,也就4GB/s双向 读写速度,4.0则是翻倍。……可是显卡走x16速率,可是有16GB/s双向读写,只能说驱动程序调度问题。primo ramdisk 和primo cache 同样可以制作成 内存操作系统,但primo cache的驱动调度性能优越几倍。
@@zhoucn5271 你说的是gbps,数值等于8倍的GB/s。主流显卡的带宽都在PCI-E4.0 X 8以下,也就是低于16GB/s
@@liang5345 主流显卡跑x8?…几乎都是x16全速的接口吧
@@zhoucn5271 接口不等于带宽,你自己看看40系显卡的PCI-E带宽吧。从4070以上才是PCI-E 4.0 X 16。大部分用户用的都是60以下的显卡,带宽是X8。不要每次都换个概念来争好吧。
我的PCIE-5.0又如何
用虚拟软件相当于运行在显存的系统还是需要通过window系统进行传输数据,理论上不太可能超过原系统的速度。这个想法很好,可惜不像内存那样容易实现。
大概率是受限于GPU RAM Driver驱动,没看过源码,简单脑补一下原理:应该是GPU RAM Driver把自己当做类似于游戏的软件,通过图形化接口(如:DirectX、OpenGL)向显卡申请显存空间,然后再通过Windows文件磁盘系统驱动级相关API,映射出一个虚拟磁盘盘符;当向虚拟磁盘读写数据时,实际上是通过GPU RAM Driver作为中间桥梁来间接读写访问显存,整个数据流大致流向,数据读写请求 ←→ ① 驱动级Windows API ←→ GPU RAM Driver ←→ ② DirectX、OpenGL ←→ 显存所以,速度瓶颈①②都有可能:①的原因就不用说了,通过操作系统肯定要通过内存,受限于内存;②的问题,因为不太了解DirectX、OpenGL这类图形化接口原理,不敢下结论,虽然显存速度很快,但是显存带宽应该是面向GPU,图形化接口如果不是直通显存,那速度受限的底层环节就很多,具体要看DirectX、OpenGL接口实现了。
可能還不如 Resizable BAR 技術好
玩完軟體再來就是玩硬體,下一代顯卡一定能實現整台主機裝在顯卡裡的夢想(X
NVIDIA想法可能不太一樣,五月份他們發布要另外用ARM的技術來打造新的Grace CPU,而不是讓玩家把OS安裝在顯卡的裡用GPU來跑。而Intel很早就把GPU做在CPU裡面了,像ARC的A系列或Iris的X系列都是,只是效能當然比不上專用的顯卡就是了。
省流:屁用没有,还更慢了
Pcie 限制
1:43 的GayHub是个什么鬼?!左上角那只猫现在有性取向了?
3:16 GPU VRAM bandwidth是指VRAM跟GPU晶片間的頻寬,理論上VRAM跟CPU之間的頻寬應該只有PCIe Gen4 x16的32GB/s,影片中的這個比較是無意義的。追記:我知道影片這樣搞為了效果(除了那張圖,還有整個影片的動機跟過程描述),但是這個邏輯我看的頭痛就忍不住想叫兩聲。
他後面有講啦w
@@maop_rcss_tw 他有講代表他知道,然後還拿無意義的比較圖來立論,影片的敘述邏輯弄得我頭好痛。為了理清他的邏輯我還得看好幾遍,頭更痛了。
那你看劇都看最後一集不是很棒
我刚开始看时还以为难道现在有GPU执行的windows的可执行程序了?后来看还是用x86的cpu可执行程序,这样cpu到vram是通过pciex16总线,速度比普通内存慢的多,那些1tb/s的带宽是gpu读vram的速度,除非整个windows所有可执行程序用gpu的compiler编译,在gpu执行,否则vram的高带宽用不了。
下次把系统装到打孔带上吧…
下次可以将系统装到cpu的缓存里。
什么soc
这压根儿不是显存速度 而是pcie 的DMA速度😢
可能跟那個軟件的ramdisk驅動效率有關 尚需優化
当年RAMOS系统时,测速都有15GB/S了.
有没有可能是驱动的原因?就是那个把显存模拟成虚拟磁盘的驱动的问题?
期待看到把系統塞進cpu緩存裡速度一定能突破天際😂
塞CPU緩衝可能不太容易實現,目前廠商都只想塞更多的Core,不過現在已經很多資料庫或系統已可採用In-Memory技術來提升效能,只是RAM要裝得夠多,要達到百萬IOPS不是問題。
塞个Linux已经可以实现了
装系统?那当然得用一百张3.5英寸软盘组成的阵列啦!
超級3.5軟盤陣列!
有搞頭,雖然可想而知效果會很差,但拿來水一部影片流量還是不錯的
图形内存延迟太大,不能当作内存使用,CPU执行效率会很低,当硬盘用还可以😅
美光 Circuit PCIe 5.0 SSD 已達到記憶體的帶寬了
沒有的事情 差了五倍有 延遲也是一大問題
把系統或軟件裝在顯存上面就像戴了套的JJ一樣....快樂的感覺比沒戴慢了幾秒....XDDDDD
软件运行流程不可改了,所以显存盘没用
我觉得问题出在VRAMDISK那个软件上
我觉得应该找一个运行在gpu上的系统来测速 不然就是pcie通道的速度没什么意义😂
要快, 就將GPU與CPU合而為一
做下實驗可以的, 現實根本沒人會這樣做
你这不是在说废话嘛
@@小凉凉-k9e 是的,就像視頻題材一樣廢,我只是配合一下。
播主说话能不能尝试不要说到最后几个字声音变得特别小。
good sharing.
還要考慮虛擬機的效率太差,
很有趣的實驗,替其他人省了折騰的時間。
就是后面沙发上那只猫是真的吗。😂
只有我看了5分钟的喵🐱嘛?
那貓太搶戲…
省流:根本没装进去
貓是亮點
硬體壽命先少個十倍
CD?
要從分散I/O概念思考IOPS,OS才會快啦,把系統塞顯卡CPU,等你當AMD總裁再說啦
都是理论数据,实际应用根本没有价值
1:45笑死gayhub
裝到iPad 上看看
图一乐😂
1:43 GayHub😂😂
搞个a100 80g,hbm比gddr更快,而且容量也够大
gen4了解一下..
有猫就有币
有病。首先要看这个gpuramdrive用的什么方式实现。显然不能cpu直接读取显存的,要读写显存必然是另外的方法“影射”到内存的一段,实际也是读写内存,还多了“显存--> 内存、内存-->显存”的搬运步骤。
我擦?還能這樣啊?,晚點試試看完後.......好吧謝謝嘗試
1:46 Gayhub...
苹果M1M2不就是咯
以為在看X客灣(?)
結論別搞事…
还是炼丹去吧
長知識
做出这种拿虚拟机来benchmark的视频简直是有辱自己频道的水准
點進來前好希望是把GPU模擬成CPU之類的搞耍內容
用2个虚拟机来对比的,其实问题不在虚拟机上
没有人这么想
msconfig
来辣
想裝在習近平的電腦看看
头香
1
脱裤子放什么的行为
屁用没有,纯纯水视频😂
GayHub???
你真无聊😅
显存的带宽是GPU和显存之间的带宽,除非你能让GPU来执行这个Windows的所有运算,否则实际生效的带宽其实是显卡的PCI-E的带宽,一般也就16G/s
nvme固态走PCIe通道,一般x4速率。x4 3.0的宽带也就32gbps,也就4GB/s双向 读写速度,4.0则是翻倍。……可是显卡走x16速率,可是有16GB/s双向读写,只能说驱动程序调度问题。primo ramdisk 和primo cache 同样可以制作成 内存操作系统,但primo cache的驱动调度性能优越几倍。
@@zhoucn5271 你说的是gbps,数值等于8倍的GB/s。主流显卡的带宽都在PCI-E4.0 X 8以下,也就是低于16GB/s
@@liang5345 主流显卡跑x8?…几乎都是x16全速的接口吧
@@zhoucn5271 接口不等于带宽,你自己看看40系显卡的PCI-E带宽吧。从4070以上才是PCI-E 4.0 X 16。大部分用户用的都是60以下的显卡,带宽是X8。不要每次都换个概念来争好吧。
我的PCIE-5.0又如何
用虚拟软件相当于运行在显存的系统还是需要通过window系统进行传输数据,理论上不太可能超过原系统的速度。这个想法很好,可惜不像内存那样容易实现。
大概率是受限于GPU RAM Driver驱动,没看过源码,简单脑补一下原理:
应该是GPU RAM Driver把自己当做类似于游戏的软件,
通过图形化接口(如:DirectX、OpenGL)向显卡申请显存空间,然后再通过Windows文件磁盘系统驱动级相关API,映射出一个虚拟磁盘盘符;
当向虚拟磁盘读写数据时,实际上是通过GPU RAM Driver作为中间桥梁来间接读写访问显存,
整个数据流大致流向,数据读写请求 ←→ ① 驱动级Windows API ←→ GPU RAM Driver ←→ ② DirectX、OpenGL ←→ 显存
所以,速度瓶颈①②都有可能:
①的原因就不用说了,通过操作系统肯定要通过内存,受限于内存;
②的问题,因为不太了解DirectX、OpenGL这类图形化接口原理,不敢下结论,
虽然显存速度很快,但是显存带宽应该是面向GPU,图形化接口如果不是直通显存,那速度受限的底层环节就很多,具体要看DirectX、OpenGL接口实现了。
可能還不如 Resizable BAR 技術好
玩完軟體再來就是玩硬體,下一代顯卡一定能實現整台主機裝在顯卡裡的夢想(X
NVIDIA想法可能不太一樣,五月份他們發布要另外用ARM的技術來打造新的Grace CPU,而不是讓玩家把OS安裝在顯卡的裡用GPU來跑。而Intel很早就把GPU做在CPU裡面了,像ARC的A系列或Iris的X系列都是,只是效能當然比不上專用的顯卡就是了。
省流:屁用没有,还更慢了
Pcie 限制
1:43 的GayHub是个什么鬼?!左上角那只猫现在有性取向了?
3:16 GPU VRAM bandwidth是指VRAM跟GPU晶片間的頻寬,理論上VRAM跟CPU之間的頻寬應該只有PCIe Gen4 x16的32GB/s,影片中的這個比較是無意義的。
追記:我知道影片這樣搞為了效果(除了那張圖,還有整個影片的動機跟過程描述),但是這個邏輯我看的頭痛就忍不住想叫兩聲。
他後面有講啦w
@@maop_rcss_tw 他有講代表他知道,然後還拿無意義的比較圖來立論,影片的敘述邏輯弄得我頭好痛。為了理清他的邏輯我還得看好幾遍,頭更痛了。
那你看劇都看最後一集不是很棒
我刚开始看时还以为难道现在有GPU执行的windows的可执行程序了?后来看还是用x86的cpu可执行程序,这样cpu到vram是通过pciex16总线,速度比普通内存慢的多,那些1tb/s的带宽是gpu读vram的速度,除非整个windows所有可执行程序用gpu的compiler编译,在gpu执行,否则vram的高带宽用不了。
下次把系统装到打孔带上吧…
下次可以将系统装到cpu的缓存里。
什么soc
这压根儿不是显存速度 而是pcie 的DMA速度😢
可能跟那個軟件的ramdisk驅動效率有關 尚需優化
当年RAMOS系统时,测速都有15GB/S了.
有没有可能是驱动的原因?就是那个把显存模拟成虚拟磁盘的驱动的问题?
期待看到把系統塞進cpu緩存裡速度一定能突破天際😂
塞CPU緩衝可能不太容易實現,目前廠商都只想塞更多的Core,不過現在已經很多資料庫或系統已可採用In-Memory技術來提升效能,只是RAM要裝得夠多,要達到百萬IOPS不是問題。
塞个Linux已经可以实现了
装系统?那当然得用一百张3.5英寸软盘组成的阵列啦!
超級3.5軟盤陣列!
有搞頭,雖然可想而知效果會很差,但拿來水一部影片流量還是不錯的
图形内存延迟太大,不能当作内存使用,CPU执行效率会很低,当硬盘用还可以😅
美光 Circuit PCIe 5.0 SSD 已達到記憶體的帶寬了
沒有的事情 差了五倍有 延遲也是一大問題
把系統或軟件裝在顯存上面就像戴了套的JJ一樣....快樂的感覺比沒戴慢了幾秒....XDDDDD
软件运行流程不可改了,所以显存盘没用
我觉得问题出在VRAMDISK那个软件上
我觉得应该找一个运行在gpu上的系统来测速 不然就是pcie通道的速度没什么意义😂
要快, 就將GPU與CPU合而為一
做下實驗可以的, 現實根本沒人會這樣做
你这不是在说废话嘛
@@小凉凉-k9e 是的,就像視頻題材一樣廢,我只是配合一下。
播主说话能不能尝试不要说到最后几个字声音变得特别小。
good sharing.
還要考慮虛擬機的效率太差,
很有趣的實驗,替其他人省了折騰的時間。
就是后面沙发上那只猫是真的吗。😂
只有我看了5分钟的喵🐱嘛?
那貓太搶戲…
省流:根本没装进去
貓是亮點
硬體壽命先少個十倍
CD?
要從分散I/O概念思考IOPS,OS才會快啦,把系統塞顯卡CPU,等你當AMD總裁再說啦
都是理论数据,实际应用根本没有价值
1:45笑死gayhub
裝到iPad 上看看
图一乐😂
1:43 GayHub😂😂
搞个a100 80g,hbm比gddr更快,而且容量也够大
gen4了解一下..
有猫就有币
有病。首先要看这个gpuramdrive用的什么方式实现。显然不能cpu直接读取显存的,要读写显存必然是另外的方法“影射”到内存的一段,实际也是读写内存,还多了“显存--> 内存、内存-->显存”的搬运步骤。
我擦?還能這樣啊?,晚點試試
看完後.......好吧謝謝嘗試
1:46 Gayhub...
苹果M1M2不就是咯
以為在看X客灣(?)
結論別搞事…
还是炼丹去吧
長知識
做出这种拿虚拟机来benchmark的视频简直是有辱自己频道的水准
點進來前好希望是把GPU模擬成CPU之類的搞耍內容
用2个虚拟机来对比的,其实问题不在虚拟机上
没有人这么想
msconfig
来辣
想裝在習近平的電腦看看
头香
1
脱裤子放什么的行为
屁用没有,纯纯水视频😂
GayHub???
你真无聊😅