RTX 40系入門級顯卡,RTX 4060終于與大家見面。隨著這張顯卡的發布,RTX 40系產品,按照目前已知的進度,從常規型號到Ti系列,全線布局完成。
(資料圖片僅供參考)
60級別的產品一直是最受玩家歡迎的,從Steam硬件調查榜可以看到,位列前五名的分別是GTX 1650、GTX 1060、RTX 3060、RTX 2060,以及RTX 3060 Laptop。
而在游戲分辨率的調查中顯示,1080p分辨率仍以64.33%的絕對優勢牢牢占據第一的位置。這張RTX 4060顯卡的推出,可以把光追帶給更多1080p的主流玩家。
根據NVIDIA官方統計,RTX GPU剛推出時,只有37%的RTX20系列玩家啟用光線追蹤,26%的人啟用DLSS。而現在,83%的RTX40 系列游戲玩家會選擇啟用光線追蹤,79%的人啟用DLSS。
隨著RTX技術日趨成熟,現在已有超過400個RTX加速的游戲、應用,且絕大部分玩家都會選擇開啟RTX以獲得更好的體驗。
在RTX 40系中,顯卡位寬普遍減小,這也是用戶抱怨的問題之一。但本代架構中超大的L2緩存也幫助提高性能,降低延遲。在位寬小于上一代的情況下,顯卡最終等效帶寬實現反超,能耗比顯著提升。這也是為什么此次RTX 40系顯卡即使是RTX 4070這樣的中端產品,也能將游戲功耗控制在200W以內的主要原因。
本次MSRP版RTX 4060在6月28日晚21:00解禁,而各OC版顯卡則在6月29日晚21:00解禁,也請大家留意后續的評測。
1 NVIDIA GeForce RTX 4060架構淺析
本次發布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造,采用TSMC 4N NVIDIA定制工藝,旗艦核心AD102達到了的760億個晶體管,而在RTX 30系顯卡中為280億個。
與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可達到90-TFLOPS的著色器數據吞吐量。
本次發布的RTX 4060共有3072個CUDA核心,提供了15-TFLOPS算力;24個第三代Ada RT Core擁有35 RT-TFLOPS;96個第四代Tensor Core可提供242 Tensor-TFLOPS。
另外在本次的規格說明上,NVIDIA官方也特別表明了L2 Cache容量以及最終的等效帶寬,這是RTX 40在架構中變化比較大的地方,同時也是玩家對位寬減小有爭議的"罪魁禍首"。
我們以兩張圖來簡單說明L2緩存的作用。
如果把GPU內核比作網店店主,那么L1緩存就是在日常工作的屋子中堆放的可發貨產品,但由于所有工作都要在這間屋子進行,堆放產品的空間有限;所以大部分產品就需要到L2緩存中,它就好比在工作室隔壁的倉庫,雖然需要走出去,但仍然是很近的路程。
如果這個倉庫還是放不下,那么只能到更遠的顯存中去調取產品。當然如果有爆顯存的情況,那么這位"店主"可能還要打車去更遠的系統內存區調取數據。
這中間的路程和耗費時間就好比GPU額外的工作量,如果絕大部分數據只存放在L2緩存就可以拿到,那么將極大節省功耗。并且由于不再需要頻繁調取顯存中的數據,所以顯存位寬適當降低,對于運行效率也是沒有影響的。
在真正的GPU中,內核是所有計算發生的地方,而這就是L1數據緩存的作用所在。每個SM都有一個超低延遲的L1數據緩存,緊挨其處理內核,使L1成為GPU尋找信息的首選。
然而,由于L1緩存需要離內核非常近,不可能非常大。
如果在L1緩存中找不到內核計算所需的數據,GPU將在L2數據緩存中尋找。這個顯存系統位于GPU芯片上,并通過一個非常高速的橫梁系統連接到所有的GPC(圖形處理集群),每個GPC包括多個SM。如果在L2緩存中找到了信息,那么GPU就挑出這些數據并將其放入內核。
如果在L2緩存中找不到信息(被稱為緩存缺失),那么GPU將通過顯存接口在VRAM中尋找。這在整個GPU存儲子系統中產生了很多額外的工作量,并降低了性能和功耗效率。
完整的AD102核心
完整的AD106核心
RTX 4060使用的AD107核心
本次RTX 4060罕見地使用了AD107芯片,與RTX 4060 Ti并不相同。采用了3組GPC,平分16組TPC,并且NVENC單元變為2個。
這張RTX 4060的L2緩存為24MB,而上一代RTX 3060為3MB;與RTX 4060 Ti和RTX 3060 Ti相同,都達到了8倍的差距。增加L2緩存的大小可以提高性能,降低延遲,并提高續航時長,數據訪問在GPU上即可完成(否則GPU就要頻繁從顯存讀取數據,過分依賴顯存帶寬)。所以,這也是為什么在RTX 40系顯卡中,位寬帶寬普遍偏小的原因。
2 測試平臺簡介
由于此次RTX 4060沒有FE版顯卡,所以外觀方面我們直接略過,來看性能測試的成績。
首先介紹一下測試平臺,為了保障RTX 4060的性能發揮,我們的平臺也進行了全面更新。
GPU-Z在2.54版本的更新中,已經能夠識別RTX 4060 Ti和RTX 4060的信息。
RTX 4060采用AD107核心,擁有3072個CUDA,Boost頻率為2460MHz,RTX 3060則為1777MHz,提升非常大。
采用8GB GDDR6顯存,位寬為128bit,顯存帶寬272 GB/s(最終等效帶寬453 GB/s),光柵單元和紋理單元為48和96。
3 理論性能測試
本次測試RTX 4060主要對比RTX 3060 12G,不過鑒于AMD剛剛發布了RX 7600,且價格為2149元,相差不多。所以測試中部分對比項加入了RX 7600,大家也能看看這兩款本代入門級顯卡的表現如何。
下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:
在FS測試中,一直是AMD的強項。RTX 4060相比RTX 3060,其中FS提升29%;FSE提升25%;FUS提升13%,綜合提升22%。對比剛剛發布的RTX 4060 Ti,綜合成績相差21%左右。
而在與RX 7600的對比中,RTX 4060與之相差14%左右。
而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,RTX 4060相較RTX 3060的提升分別為:TS提升21%;TSE提升21%,綜合約為21%。對比RTX 4060 Ti,綜合成績相差21%左右。
而在DX12的測試中,雖然RX 7600雖然依舊有些優勢,但幾乎已經持平。
PortRoyal是3DMARK中專門針對光追性能的測試項,RTX 4060相較RTX 3060的提升約為18%。對比RTX 4060 Ti,相差25%左右。
而在光追測試中,RTX 4060相比RX 7600提升為12%左右。
綜合來看,RTX 4060的傳統理論性能相較RTX 3060的提升約為20%。
下面我們再來看看3DMARK中新增的一些具體應用場景的測試。
Speed Way測試是3DMARK最新更新的用于測試DirectX12 Ultimate 性能的顯卡基準測試。要運行此測試,顯卡必須支持 DirectX 12 Ultimate 并包含 6GB 及以上顯存。
這項測試結合了實時光線追蹤和傳統渲染技術來測量顯卡性能。場景含有光線追蹤反射、實時全局光照、網格著色器、體積照明、粒子和后處理效果。所以SW的測試基本可以看做次世代3A游戲基準。
RTX 4060對比RTX 3060,從1080p分辨率到4K提升依次為:14%/17%/17%。
對比A卡方面,由于DX12本身就是AMD弱項,而其中又加入了大量光影效果,無異于雪上加霜,所以分數下降的比較厲害。
另外我們使用3DMARK剛剛更新的DLSS 3進行了相關性能測試。不過由于RTX 3060無法開啟,這里使用DLSS2進行對比測試。
在2K分辨率下DLSS開關相比RTX 3060的提升為34%/17%;4K分辨率由于關閉情況下顯卡幾乎無法正常運行,僅看開啟狀態,提升約為61%。
4 常規游戲 性能測試
在游戲測試中,如有提幀技術,AMD顯卡開啟FSR質量,NVIDIA則對應開啟DLSS質量。
由于本次RTX 40系加入了DLSS 3新技術,所以后面會進行單獨測試,這里依然選擇主流的幾款3A大作進行游戲性能對比。
在《極限競速:地平線5》中,測試成績非常有意思,看起來雜亂無章,毫無邏輯,不過我們細分析來看。
其中RTX 4060相比RTX 3060在1080p分辨率下提升明顯,達到33%;而在2K和4K分辨率下被RTX 3060反超,RTX 3060擁有12G顯存,而恰逢《極限競速:地平線5》這種對GPU優化極佳的游戲,基本只要顯存夠,就能上分。
另外1080p分辨率中,RTX 4060與RTX 4060 Ti的分數相差不大,這是因為該分辨率下主要瓶頸在于CPU。
在《刺客信條:英靈殿》中,RTX 4060相比RTX 3060的提升分別為:1080p提升23%;2K提升17%;4K提升11%,綜合提升17%。
在傳統光柵化游戲中,RX 7600整體分數與RTX 4060差不多,不過刺客信條系列怎么說也是阿育傳統游戲,按理說分數應當反超RTX 4060才對。
在《無主之地3》中,RTX 4060相比RTX 3060的提升分別為:1080p提升22%;2K提升20%;4K分辨率相差2幀。
另外A卡在《無主之地3》的測試中,表現一直比較穩定,在1080p分辨率下,與RTX 4060 Ti的差距只有不到10%。
本次的純光追游戲測試中就不帶A卡了,其實在SW測試中,與光追游戲場景相似。
《光明記憶:無限》的光追測試軟件是獨立于游戲的測試工具,比游戲中用到的光線追蹤技術更多,測試條件為"RTX最高/DLSS質量"。
性能方面,RTX 4060相比RTX 3060的提升分別為:1080p提升31%;2K提升20%;4K提升6%,綜合提升19%。
在另外一款國產游戲《邊境》的跑分軟件中,情況基本與《光明記憶:無限》相同,測試條件均在"RTX最高/DLSS質量"下進行。
在《邊境》中,RTX 4060相比RTX 3060的提升分別為:1080p提升39%;2K提升24%;4K提升29%,綜合提升31%。
最后的測試中我們在《賽博朋克2077》體會一下不同的光影模式。
超級畫質
光追超級
光追過載
從上至下依次為超級畫質/光追超級/光追過載。可以看到光追過載相比光追超級更貼近于真實效果。它模擬了真實的光線路徑,其實相比之前的光線追蹤模擬了更多光線在不同表面的反射,完整的計算出了場景的真實光照,避免了上一代光追中出現"死黑"的情況。
這也是NVIDIA致力于打造的下一代光追場景,但是截止目前它對硬件計算的需求太過龐大,即便是旗艦顯卡,也無法在4K分辨率下流暢運行。
5 DLSS 3性能測試
截止目前,已有超過300款游戲和應用支持DLSS,其中已有38款游戲和應用支持最新的DLSS 3。
包括《逆水寒》、《微軟模擬飛行》、《毀滅全人類2:重新探測》、《瘟疫傳說:安魂曲》、《光明記憶:無限》、《暗影火炬城》、《F1 22》、《生死輪回》、《漫威蜘蛛俠:重制版》、《超級人類》、《極限競速:地平線5》、《賽博朋克2077》、《紅霞島》、《暗黑破壞神IV》、《侏羅紀世界:進化2》等等。
本次DLSS 3的測試圖表比較繁瑣,并且增加了1% Low FPS和延遲的測試,1% Low FPS則是將一段時間內的幀數從大到小排列,取最小的1%出來,再對這1%的數求平均值。
在坐標軸左側的為延遲(越低越好),坐標軸右側的均為幀數(越高越好),并且由于牽扯到正負坐標,所以兩側的值有可能會不同。
在《侏羅紀世界:進化2》中,DLSS 3的表現非常亮眼,由于此類模擬經營游戲的特點就是同屏單位多,更加占用CPU資源,而DLSS 3能夠進行幀生成,來突破CPU瓶頸限制。
不過幀生成并不是毫無弊端,這也是為什么此次測試加入了延遲。并且在開啟DLSS 3后,NVIDIA Reflex是捆綁開啟的。
在《巫師3》光線追蹤的測試中,由于沒有benchmark,我們選擇畫面元素較多的固定場景截取幀數,故1% Low幀數較高。
RTX 4060即便在DLSS 2開啟的情況下也只有49幀,但開啟DLSS 3后,能夠達到80幀的流暢水準,并且延遲相較關閉DLSS有大幅提升。
《極限競速:地平線5》是最新加入DLSS 3的游戲,在開啟DLSS 2后有10幀左右的提升。
《暗影火炬城》在開啟光追后對于性能要求明顯提高。其中DLSS 3相比DLSS關的幀數提升了63%,DLSS 2的提升則達到了44%。
6 AV1編碼測試
本次AV1編碼測試選擇了剪映專業版,它可以輸出H.264/HEVC/AV1三種編碼格式的視頻。
剪映專業版目前自帶AV1編碼輸出,在實際測試中,我們導出一段1分鐘左右的視頻。可以看到兩個文件容量相差103MB。
由于AV1編碼特性,生成文件的比特率更低,但視頻清晰度則完全相同。所以如果生成同比特率,同容量的文件,AV1將會更清晰。
我們通過NVIDIA ICAT來進行兩段視頻的畫面對比,圖中左側為H.264編碼,右側為AV1編碼。在100%的細節對比中,幾乎看不出任何區別。
7 D5渲染測試
D5是一款國內實時光線追蹤渲染器,支持多種建模軟件直讀,包括SketchUp、3Ds MAX、Rhino、Revit、Archicad、Blender、C4D等。目前也已經支持DLSS 3,下面我們分別看看幀數和功耗的情況。
選擇軟件自帶的默認場景【簡約客廳】
在實時幀數表現上,由于D5采用實時GPU渲染,所以壓力全在顯卡。可以看到在DLSS關和DLSS 2的情況下兩款顯卡差別不大,但是采用DLSS 3幀生成后,RTX 4060一舉達到70幀。對于不要求高幀率的渲染軟件來說,能夠流暢轉動視角就夠了。
功耗方面,RTX 4060的TDP為115W;RTX 3060的TDP為170W。關閉DLSS的情況下,兩張顯卡幾乎都處于滿載狀態。DLSS 2開啟后能夠緩解一部分壓力,DLSS 3則能夠讓RTX 4060僅用60W流暢運行軟件。
8 RTX VSR(RTX Video Super Resolution)測試
目前RTX VSR(RTX Video Super Resolution)已經在部分瀏覽器中進行測試,首先玩家需要更新到NVIDIA最新驅動,在NVIDIA控制面板中的【調整視頻圖像設置】可以看到最新的RTX 視頻增強超分辨率。
RTX VSR是 AI 圖像處理的突破,它超越了傳統的邊緣檢測和特征銳化技術,極大地提升直播視頻內容的質量。
開啟RTX VSR不僅需要最新版驅動,還需要使用RTX 40或30系列GPU,并且幾乎適用于Google Chrome和Microsoft Edge瀏覽器中的所有視頻內容(瀏覽器也需要更新到最新版本)。
開啟后,目前已知的打開YouTube或者B站,都可以享受到RTX VSR效果的加成。
如果不確定,在全屏播放視頻時,可以打開任務管理器,看到GPU負載增加,即為開啟成功。
(點擊放大查看原圖)
我們打開YouTube隨意觀看視頻,在打開RTX VSR后,可以清晰明顯的看到水下珊瑚的質量明顯提高,邊緣更為清晰,并且極大減少了失真現象。
9 溫度及功耗測試
功耗測試中,我們選擇FurMark軟件進行拷機測試,并采用GPU-Z檢測溫度,功耗僅計算顯卡自身。
可以看到RTX 4060這張顯卡但通過1小時左右的拷機測試,溫度一直控制在60℃左右,熱點溫度在70℃左右。不過這張卡并非FE公版,所以這里注意功耗即可。
游戲動態功耗測試
本次我們在拷機測試中最大板載功耗為115W左右。但在實際游戲測試中要低很多。
由于不同游戲負載不同,GPU的實際功耗是動態變化的,類似于FPS隨時間的變化,RTX 40系列很難觸及功耗墻。
RTX 4060 3A游戲平均功耗
RTX 3060 3A游戲平均功耗
在實際的游戲功耗測試中,我們選擇《刺客信條:英靈殿》自帶benchmark,畫面設置最高、2K分辨率,來拉滿兩張顯卡的性能極限,檢測我們實際應用場景的功耗。
可以看到兩款顯卡雖然均為60級別,但剛剛發布的RTX 4060平均功耗只有94W,而RTX 3060則是158W,低了64W,這的確是一個驚人的成績。
游戲平均不到百瓦的功耗,對于長時間使用電腦,或者像我這種不愛關機的用戶來說,確實能夠有效降低電費,尤其是在南方,這種電費奇高的地區。
或者在一些相對極端的使用環境中,如網咖,電腦基本都是24小時滿載運轉。RTX 40系的超低功耗,對于網咖老板確實是極大地利好消息。
10 不到100W的性能小鋼炮
目前NVIDIA已經推出兩張60級別顯卡,RTX 4060 Ti定位1080p分辨率下百幀光追游戲,而RTX 4060則是能夠流暢運行。在有DLSS 3加持下的情況,也能夠達到差不多的成績。
不過通篇測試下來,我還有一些個人見解:
RTX 4060主要的用途并不是和誰飚光追成績,更大的意義在于純粹的迭代60級別顯卡。
本次RTX 4060相比RTX 3060綜合提升在20%左右,而RTX 4060 Ti相比RTX 3060 Ti的綜合提升在12%左右。光柵單元與RTX 4060 Ti相同,都是48個,其實算是誠意滿滿,不過想必大家一定還會吐槽顯存縮減。
享受過12GB大顯存的好處,此次RTX 4060又回到了標準的8GB,顯然讓人難以接受。
在1080p分辨率下無所謂顯存大小,但在2K分辨率差距逐步顯露,甚至讓RTX 3060扳回一城。不過對于游戲玩家來說能購買RTX 4060,大概率也不指望在2K分辨率下玩游戲。
但顯存縮減對于很多入門的內容創作者,有較大影響。畢竟像D5這種很快集成DLSS 3的應用并不多,大量軟件在實時預覽時仍是靠顯存支撐。
功耗方面,這張RTX 4060再次帶給人很大驚喜,實際使用功耗不到100W,這基本是夢回GTX 1060的級別了。想想我自用的30系顯卡,滿載打游戲,整機功耗瞬間400W以上。在南方的話,長時間可是一筆不小的開支。
最后,想必大家也會關心RTX 4060與RX 7600如何選擇的問題。
價格方面,RX 7600首發售價2149元;RTX 4060首發售價2399元,差了250……
這兩張顯卡如何選擇,還要看玩家傾向于什么類型的游戲。如果日常喜歡嘗試光追,或一些次世代大作,以DX12游戲為主,那么選擇RTX 4060無需猶豫。
如果日常以網游,或傳統光柵化游戲為主,那么RX 7600顯然更有性價比。
本次RTX 4060首發價格2399元,相比上一代RTX 3060 12G還便宜100元,綜合提升達到20%,對于5000元預算裝機的用戶,它稱得上一張很好的60級別迭代產品。
盡管目前很多第三方RTX 3060 12G顯卡價格已經跌破2000元,但別忘了那場幾乎顛覆行業的"礦潮",所帶來的后續影響。
而且RTX 4060確實能給1080p主流玩家,帶來更好的光追游戲體驗,一張【全新】的RTX 4060,它不香嗎?
頭條 23-06-29
頭條 23-06-29
頭條 23-06-29
頭條 23-06-29
頭條 23-06-29
頭條 23-06-29
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28
頭條 23-06-28