当ブログはWeb広告を導入しています（景表法による表示）

2022.09.21 グラフィックボード / GPU やかもち（管理人）

RTX 4090 / 4080 16GB / 4080 12GB：RTX 40シリーズの性能と仕様を解説

GeForce RTX 40シリーズ（Ada Lovelace世代）が登場。RTX 30シリーズ（Ampere世代）からきっかり2年ぶりの後継モデルです。

今回正式リリースされた「RTX 4090」「RTX 4080 16GB」「RTX 4080 12GB」のスペック、性能、そして価格やコスパについて。本記事でわかりやすく解説します。

RTX 50シリーズの性能と仕様を解説

やかもち

2025年1月に、2年半ぶりの後継モデル「RTX 50」シリーズが登場しました。最新のGeForce解説記事はこちら。

（公開：2022/9/21 | 更新：2025/1/15）

この記事の目次

全部で3つある「RTX 40」シリーズ

これから約15000文字を使ってRTX 40シリーズを解説しますが･･･「長いよ!! 読んでられない。」という人向けに、「結論まとめ」から始めます。

RTX 40シリーズの発売日と価格は？

RTX 4090	2022年10月12日	1599ドル（国内は約30万円～）
RTX 4080 16GB	2022年11月	1199ドル（国内は約22万円～）
RTX 4080 12GB	2022年11月	899ドル（国内は約16万円～）

製造コストが非常に高額とされるTSMC 4N（5 nm）プロセスを採用した「RTX 40」シリーズは、すべてのグレードで軒並み値上げです。

最上位のRTX 4090は100ドルの値上げ（国内：約30万円～）と少ないですが、RTX 4080は16GB版なら500ドルの値上げ（国内：約22万円～）、12GB版ですら200ドルの値上げ（国内：約16万円～）と高いです。

2022年時点で、NVIDIAは在庫がたまりに溜まっているRTX 30シリーズも併売するらしく、置き換えモデルというより実質的な上位グレードとして販売される形式になります。

RTX 40シリーズのスペック（仕様）は？

RTX 30とは違い、RTX 40では（最上位を除いて）シェーダー数があまり増えておらず、ブーストクロックの大幅な引き上げやL2キャッシュの増量によるIPC改善で性能アップを狙います。

GeForce RTX 4090のスペック解説
GeForce RTX 4080 16GBのスペック解説
GeForce RTX 4080 12GBのスペック解説

RTX 4090は16384コアで、ブーストクロックが2.5 GHzです。RTX 4080 16GBは9728コア、ブーストクロックが2.5 GHzです。RTX 4080 12GBはなんとシェーダー数が減って7680コア、ブーストクロックは2.6 GHzと大幅上昇です。

RTX 4080の16GB版と12GB版でシェーダー数が違うのは少々ややこしい仕様で注意が必要。消費者としては、16GB版をRTX 4080 Tiとしてリリースしてほしかったですが、後出し用の型番をとっておくのがNVIDIAらしいやり方です。

RTX 40シリーズの性能は？

シェーダー数とクロック周波数から予想できる理論性能（FP32）は以下のとおりです。

RTX 4090が、RTX 3090の約2.32倍
RTX 4080 16GBが、RTX 3080 10GBの約1.64倍
RTX 4080 12GBが、RTX 3080 10GBの約1.35倍

RTX 4090だけが飛び抜けて性能の上昇幅が大きく、RTX 4080番台は伸び幅が控えめです。

価格差を計算するとコストパフォーマンスは完全に悪化しており、これから一部で投げ売りされるであろうRTX 30シリーズを底値で買うのが正しい戦略になる場合も十分に考えられます。

なお、上記の性能はあくまでも理論性能（FP32）に基づいた理論値であり、実際のゲーミング性能はさらに下がる可能性もあります。

一方で、L2キャッシュの増量によるIPC改善や、第4世代Tensorコアを用いた最新のアップスケーリング技術「DLSS 3.0」でどこまで性能を底上げできるかで評価が激変する可能性も濃厚です。

RTX 40シリーズの技術的な進化は？

カタログスペック面の進化はパッとしないものの、技術的な進化はいろいろあります。

進化するレイトレ性能「第3世代RTコア」
より高性能なアップスケーリング「DLSS 3.0」
最大1.4 TFLOPSのFP8演算性能（初実装）
最大72 MBに増えた「L2キャッシュ容量」
AV1ハードウェアエンコードに対応
プロセスは8 nm → 5 nmに縮小

興味があるところは、↑それぞれの解説を読んでみてください。

RTX 40シリーズのスペックまとめ

スペック	RTX 4090	RTX 3090	RTX 4080 16GB	RTX 4080 12GB	RTX 3080 10GB
製造	TSMC 5 nm	Samsung 8 nm	TSMC 5 nm	TSMC 5 nm	Samsung 8 nm
コア数	16384	10496	9728	7680	8704
ブーストクロック	2520	1695	2510	2610	1710
理論性能(FP32)	82.58 TFLOPS	35.58 TFLOPS	48.83 TFLOPS	40.09 TFLOPS	29.77 TFLOPS
VRAM	GDDR6X 24GB	GDDR6X 24GB	GDDR6X 16GB	GDDR6X 12GB	GDDR6X 10GB
バス幅	384-bit	384-bit	256-bit	192-bit	320-bit
TDP	450 W	350 W	320 W	285 W	320 W
レイトレ	第3世代	第2世代	第3世代	第3世代	第2世代
Tensor	第4世代	第3世代	第4世代	第4世代	第3世代
AV1 HW	デコード：対応エンコード：対応	デコード：対応	デコード：対応エンコード：対応	デコード：対応エンコード：対応	デコード：対応
MSRP	$ 1599	$ 1499	$ 1199	$ 899	$ 699
FE公式価格	298000 円	229800 円	219800 円	164800 円	109800 円

【詳細なスペック表はこちら】RTX 40シリーズ

GPU	RTX 4090	RTX 3090	RTX 4080 16GB	RTX 4080 12GB	RTX 3080
世代	Ada Lovelace	Ampere	Ada Lovelace	Ada Lovelace	Ampere
プロセス	5 nm製造 : TSMC	8 nm製造 : Samsung	5 nm製造 : TSMC	5 nm製造 : TSMC	8 nm製造 : Samsung
トランジスタ数	763.0 億	283.0 億	?	?	283.0 億
ダイサイズ	608 mm2	628 mm2	380 mm2	300 mm2	628 mm2
シェーダー数CPUのコア数に相当	16384	10496	9728	7680	8704
TMU数Texture Mapping Unitのこと	512	328	304	240	272
ROP数Render Output Unitのこと	192	112	96	76	96
演算ユニット数	128	82	76	60	68
Tensorコア数機械学習向けの特化コア	512	328	304	240	272
RTコア数レイトレ用の特化コア	128	82	76	60	68
L1キャッシュ演算ユニットあたり	128 KB	128 KB	128 KB	128 KB	128 KB
L2キャッシュコア全体で共有	72.0 MB	6.0 MB	64.0 MB	64.0 MB	5.0 MB
L3キャッシュコア全体で共有	–	–	–	–	–
クロック周波数	2235 MHz	1395 MHz	2205 MHz	2305 MHz	1440 MHz
ブーストクロック	2520 MHz	1695 MHz	2505 MHz	2605 MHz	1710 MHz
VRAM	GDDR6X 24 GB	GDDR6X 24 GB	GDDR6X 16 GB	GDDR6X 12 GB	GDDR6X 10 GB
VRAMバス	384 bit	384 bit	256 bit	192 bit	320 bit
VRAM帯域幅	1018 GB/s	936.2 GB/s	742.4 GB/s	556.8 GB/s	760.3 GB/s
理論性能（FP32）	82.58 TFLOPS	35.58 TFLOPS	48.74 TFLOPS	40.09 TFLOPS	29.77 TFLOPS
SLI対応	–	対応	–	–	–
PCIe	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16
TDP	450 W	350 W	320 W	285 W	320 W
補助電源	16-pin	12-pin	16-pin	16-pin	12-pin
MSRP	$ 1599	$ 1499	$ 1199	$ 899	$ 699
参考価格	–	179800 円	–	–	99800 円
発売価格	298000 円	229800 円	219800 円	164800 円	95700 円
発売	2022/10/12	2020/9/24	2022/11	2022/11	2020/9/17

※RTX 4080 16GB / 12GBは一部、未確定な情報があるため暫定的なスペックとなります。

2022年9月時点、NVIDIAから正式アナウンスされているRTX 40シリーズは以上の3つです。

TSMC 5 nmプロセスのおかげで、ダイ面積を抑えつつトランジスタ搭載数を大幅に増加させていますが、MSRPは据え置きどころか大幅な値上げとなったのがとても残念です。

やはり飛び込みで使わせてもらったTSMC 5 nmプロセスが相当に高くついたと推測できます。加えて2年前から見て約30%も進んだ円安も、国内販売価格に大きな打撃です。

現状はラグジュアリーモデルに過ぎず、一般ユーザーは引き続き併売されるRTX 30シリーズを購入する流れになります。グラフィックボード1枚に5万円超えですら高いと感じる人が圧倒的に多いなか、10万どころか15万円オーバーはついていけないでしょう。

やかもち

FE版はともかく、オリファンモデルはASK税も加わってくるため、実際の値段はどこまで上がってしまうのか･･･不安です。

RTX 4090（RTX 3090の約2.3倍）

【最上位モデル】性能は2倍、価格もほぼ2倍

GPU	RTX 4090	RTX 3090
プロセス	5 nm製造 : TSMC	8 nm製造 : Samsung
シェーダー数CPUのコア数に相当	16384	10496
RTコア数レイトレ用の特化コア	128	82
ブーストクロック	2520 MHz	1695 MHz
VRAM	GDDR6X 24 GB	GDDR6X 24 GB
理論性能（FP32）	82.58 TFLOPS	35.58 TFLOPS
SLI対応	–	対応
PCIe	PCIe 4.0 x16	PCIe 4.0 x16
TDP	450 W	350 W
補助電源	8 x 3 pin	12-pin
MSRP	$ 1599	$ 1499
参考価格	–	179800 円
発売価格	298000 円	212278 円
発売	2022/10/12	2020/9/24

GeForce RTX 4090【詳細スペック表】

GPU	RTX 4090	RTX 3090
世代	Ada Lovelace	Ampere
プロセス	5 nm製造 : TSMC	8 nm製造 : Samsung
トランジスタ数	763.0 億	283.0 億
ダイサイズ	608 mm2	628 mm2
シェーダー数CPUのコア数に相当	16384	10496
TMU数Texture Mapping Unitのこと	512	328
ROP数Render Output Unitのこと	192	112
演算ユニット数	128	82
Tensorコア数機械学習向けの特化コア	512	328
RTコア数レイトレ用の特化コア	128	82
L1キャッシュ演算ユニットあたり	128 KB	128 KB
L2キャッシュコア全体で共有	72.0 MB	6.0 MB
L3キャッシュコア全体で共有	–	–
クロック周波数	2235 MHz	1395 MHz
ブーストクロック	2520 MHz	1695 MHz
VRAM	GDDR6X 24 GB	GDDR6X 24 GB
VRAMバス	384 bit	384 bit
VRAM帯域幅	1018 GB/s	936.2 GB/s
理論性能（FP32）	82.58 TFLOPS	35.58 TFLOPS
SLI対応	–	対応
PCIe	PCIe 4.0 x16	PCIe 4.0 x16
TDP	450 W	350 W
補助電源	8 x 3 pin	12-pin
MSRP	$ 1599	$ 1499
参考価格	–	179800 円
発売価格	298000 円	212278 円
発売	2022/10/12	2020/9/24

「RTX 4090」がRTX 40シリーズの現行最上位モデルです。ただしフルスペックモデルではない※ため、おそらく後出しでRTX 4090 Tiが出てくる可能性が高いです。

基本スペックは凄まじい内容です。シェーダー数が約1.6倍の16384コア、ブーストクロックは約1.5倍の2.5 GHzに達します。コア数とクロックから計算できる理論性能（FP32）は80 TFLOPS超えで、RTX 3090の約2.3倍です。

実際のゲーミング性能はFP32ほどの伸びを見せないですが、RTX 4090ではL2キャッシュが6 MB → 72 MBへ大幅に増量されており、キャッシュヒット率の改善でスペック通りの性能を出しやすい環境に。

加えて、FP8演算に対応する第4世代Tensor Coreの実装により、強力なアップスケーリング機能「DLSS 3.0」に対応。DLSS 3.0の有無で、レイトレを有効化した状態で最大4倍の4Kゲーミング性能を可能とのこと。

全体的に性能アップが目覚ましいものの、TDPは350 W → 450 Wへ増えており、ファクトリーオーバークロックが施されるオリジナルモデルでは600 Wも視野に入っています。

DLSS 3.0にフル対応するゲームならともかく、DLSSを使えないゲームではワットパフォーマンスとコスパの両方がかえって悪化するリスクも抱えています。

NVIDIAの希望小売価格は1599ドルと、先代のRTX 3090から100ドルの値上げです。性能を考えるとコスパも文句なしですが、日本国内ではFE版の予価が298000円と発表されており、非常に高いです。

RTX 3090が約15～17万円で購入できる状況だと、コストパフォーマンスはほぼトントンでしょう。

なお、RTX 3090相当の性能が欲しい場合は次に紹介する「RTX 4080 16GB」や「RTX 4080 12GB」が魅力的です。

※ダイショット（チップの画像）を見ると、演算ユニットを144個（18432コア）まで搭載できる余裕があります。

RTX 4090ベンチマーク：配信者やAI絵師にも最適な弩級ゲーミングGPU

やかもち

国内価格だとコスパがやや微妙ですが、他で代替できない「唯一無二の性能」が最大の魅力です。･･･とにかく凄まじい性能してます。

RTX 4080 16GB（RTX 3080の約1.6倍）

RTX 3090以上の性能をRTX 3090並の価格で

GPU	RTX 4080 16GB	RTX 4080 12GB	RTX 3080 12GB
プロセス	5 nm製造 : TSMC	5 nm製造 : TSMC	8 nm製造 : Samsung
シェーダー数CPUのコア数に相当	9728	7680	8960
RTコア数レイトレ用の特化コア	76	60	70
ブーストクロック	2505 MHz	2605 MHz	1710 MHz
VRAM	GDDR6X 16 GB	GDDR6X 12 GB	GDDR6X 12 GB
理論性能（FP32）	48.74 TFLOPS	40.09 TFLOPS	30.64 TFLOPS
SLI対応	–	–	–
PCIe	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16
TDP	320 W	285 W	350 W
補助電源	8 x 3 pin	8 x 2 pin	12-pin
MSRP	$ 1199	$ 899	$ 799
参考価格	–	–	103800 円
発売価格	219800 円	164800 円	109800 円
発売	2022/11	2022/11	2022/6/11

GeForce RTX 4080 16GB【詳細スペック表】

GPU	RTX 4080 16GB	RTX 4080 12GB	RTX 3080 12GB
世代	Ada Lovelace	Ada Lovelace	Ampere
プロセス	5 nm製造 : TSMC	5 nm製造 : TSMC	8 nm製造 : Samsung
トランジスタ数	?	?	283.0 億
ダイサイズ	380 mm2	300 mm2	628 mm2
シェーダー数CPUのコア数に相当	9728	7680	8960
TMU数Texture Mapping Unitのこと	304	240	280
ROP数Render Output Unitのこと	96	76	96
演算ユニット数	76	60	70
Tensorコア数機械学習向けの特化コア	304	240	280
RTコア数レイトレ用の特化コア	76	60	70
L1キャッシュ演算ユニットあたり	128 KB	128 KB	128 KB
L2キャッシュコア全体で共有	64.0 MB	64.0 MB	5.0 MB
L3キャッシュコア全体で共有	–	–	–
クロック周波数	2205 MHz	2305 MHz	1260 MHz
ブーストクロック	2505 MHz	2605 MHz	1710 MHz
VRAM	GDDR6X 16 GB	GDDR6X 12 GB	GDDR6X 12 GB
VRAMバス	256 bit	192 bit	384 bit
VRAM帯域幅	742.4 GB/s	556.8 GB/s	912.4 GB/s
理論性能（FP32）	48.74 TFLOPS	40.09 TFLOPS	30.64 TFLOPS
SLI対応	–	–	–
PCIe	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16
TDP	320 W	285 W	350 W
補助電源	8 x 3 pin	8 x 2 pin	12-pin
MSRP	$ 1199	$ 899	$ 799
参考価格	–	–	103800 円
発売価格	219800 円	164800 円	109800 円
発売	2022/11	2022/11	2022/6/11

「RTX 4080 16GB」は、RTX 3080 12GBの後継にあたるモデルです。価格はなんと400ドル上がって1199ドル、国内価格は約22万円と現行のRTX 3090よりもお高いです。

とはいえ値段なりの性能はきちんと提供できる用意があります。シェーダー数は1割増の9728コアで、ブーストクロックは1.7 GHzから一気に2.5 GHzまで伸びています。

シェーダー数とクロックから計算できる理論性能（FP32）は約49 TFLOPSで、RTX 3080 12GB比較で約1.6倍もの性能アップです。

L2キャッシュも5 MB → 64 MBへ大幅に増え、キャッシュヒット率の改善による性能の効率化が図られています。2 GHz超えの高いクロックは低解像度でも効きやすい傾向があるため、1.6倍はともかくRTX 3090超えはほぼ確実でしょう。

FP8演算に対応した第4世代Tensor Coreが可能にする「DLSS 3.0」も含めると、NVIDIAいわく対応タイトルで最大2倍以上の性能向上も可能とのこと。

問題はどの程度RTX 3090を超えられているかどうかです。性能の伸び幅次第では、セール特価のRTX 3090を買ったほうがコスパが良い場合も普通にありえます。

やかもち

80番台に22万円とは･･･あまりにも高い。円安がなくても16.5万円ですから、やはり高いです。

RTX 4080 12GB（RTX 3080の約1.4倍）

RTX 3090とほぼ同じ価格でRTX 3090 Tiを上回る

GPU	RTX 4080 12GB	RTX 3080
プロセス	5 nm製造 : TSMC	8 nm製造 : Samsung
シェーダー数CPUのコア数に相当	7680	8704
RTコア数レイトレ用の特化コア	60	68
ブーストクロック	2605 MHz	1710 MHz
VRAM	GDDR6X 12 GB	GDDR6X 10 GB
理論性能（FP32）	40.09 TFLOPS	29.77 TFLOPS
SLI対応	–	–
PCIe	PCIe 4.0 x16	PCIe 4.0 x16
TDP	285 W	320 W
補助電源	8 x 2 pin	12-pin
MSRP	$ 899	$ 699
参考価格	–	91800 円
発売価格	164800 円	95700 円
発売	2022/11	2020/9/17

GeForce RTX 4080 12GB【詳細スペック表】

GPU	RTX 4080 12GB	RTX 3080
世代	Ada Lovelace	Ampere
プロセス	5 nm製造 : TSMC	8 nm製造 : Samsung
トランジスタ数	?	283.0 億
ダイサイズ	300 mm2	628 mm2
シェーダー数CPUのコア数に相当	7680	8704
TMU数Texture Mapping Unitのこと	240	272
ROP数Render Output Unitのこと	76	96
演算ユニット数	60	68
Tensorコア数機械学習向けの特化コア	240	272
RTコア数レイトレ用の特化コア	60	68
L1キャッシュ演算ユニットあたり	128 KB	128 KB
L2キャッシュコア全体で共有	64.0 MB	5.0 MB
L3キャッシュコア全体で共有	–	–
クロック周波数	2305 MHz	1440 MHz
ブーストクロック	2605 MHz	1710 MHz
VRAM	GDDR6X 12 GB	GDDR6X 10 GB
VRAMバス	192 bit	320 bit
VRAM帯域幅	556.8 GB/s	760.3 GB/s
理論性能（FP32）	40.09 TFLOPS	29.77 TFLOPS
SLI対応	–	–
PCIe	PCIe 4.0 x16	PCIe 4.0 x16
TDP	285 W	320 W
補助電源	8 x 2 pin	12-pin
MSRP	$ 899	$ 699
参考価格	–	91800 円
発売価格	164800 円	95700 円
発売	2022/11	2020/9/17

「RTX 4080 12GB」は、RTX 3080の後継モデルです。ノーマルの80番台として、過去もっとも高価な899ドル（200ドル値上げ）となり、国内価格はなんと約16.5万円となります。

RTX 3080の発売価格が約9.6万円で、現在は9万円ちょっとで購入できると考えると「高い」としか言えないです。

NVIDIAによればDLSS 3.0適用時の性能で、RTX 3080 Tiに対して約1.5～2.6倍の性能アップを実現しているとのこと。本当であればかつての最上位モデルRTX 3090 Tiすら超えている性能です。

RTX 3090とほぼ同じ価格で、さらに上のRTX 3090 Tiを超える性能なら、一応コストパフォーマンスは改善されているように見えます。少なくともDLSS 3.0対応タイトルではRTX 3090超えは容易だと、NVIDIAは強気です。

L2キャッシュの大幅増量（5 MB → 64 MB）と、2.6 GHzもの高いブーストクロックで、シェーダーあたりの性能も改善が見込めます。DLSSを使わない場合の性能も、RTX 3090と同等レベルは可能でしょう。

しかし、16.5万円の割に性能が良いとはいっても、グラフィックボード単品に16.5万円は（正直なところ）常軌を逸した価格です。

RTX 3090以上の性能を必要としているコアなゲーマーやクリエイターにとって魅力のあるグラボであって、フルHDで144 fpsが出れば十分な大多数のゲーマーにとっては単なるラグジュアリーモデルに過ぎません。

やかもち

円安がなかった場合の価格は12.3万円です。でも80番台（無印）に12.3万円は高いような･･･。

RTX 40シリーズの進化ポイント

第3世代RTコアで高効率化するレイトレ性能

Ada Lovelace世代（第3世代）RTコアは、Ampere世代（第2世代）のRTコアと比較して

光線と三角形の交差スループット：2倍
Bounding Volume Hierarchy (BVH) のビルド時間：最大10倍も高速化
BVHストレージスペース（VRAM専有量）：最大5%にカット

と、さらに効率よくレイトレを処理できるように改善されました。

レイトレ単体の性能向上幅は不明ですが、NVIDIAのアピールするRTX 3090 Ti比較で最大4倍のパフォーマンスはDLSS 3.0だけでなく、高効率化したレイトレ処理性能も貢献している可能性が高いです。

第4世代Tensor Coreによる「DLSS 3.0」

データセンター向けに出荷されているHopper世代（H100 GPU）ですでに導入されている、FP8演算に対応した第4世代Tensor Coreを、Ada Lovelace世代にも導入しました。

専門的な話は抜きにして、パフォーマンスを見てみましょう。NVIDIAによると、DLSS 3.0による4Kゲーミング性能はRTX 3090 Tiと比較してベストケースでなんと4倍以上です。

RTX 4090とRTX 3090 Tiの理論性能はせいぜい2.3～2.4倍の性能差に過ぎず、4Kゲーミングで4倍超えの性能幅を出すのは難しいです。第4世代Tensor Coreを導入した「DLSS 3.0」を使ってこそ実現した大幅な性能向上です。

なお、NVIDIAの解説を読む限りでは、DLSS 3.0はFP8演算に対応する第4世代Tensor Core以降で対応できる機能※です。第4世代Tensor Coreを持たない旧世代（AmpereやTuring）はDLSS 2.xにとどまります。

※もちろん、NVIDIAのハッタリである可能性は否定できませんが･･･。

やかもち

DLSS 3.0とOFA（Optical Flow Accelerator）により、1枚のソースフレームから2枚以上のフレーム生成が可能になったらしく、最大4倍近い性能アップも納得です。

最大1.4 TFLOPSのFP8演算性能（初実装）

RTX 40シリーズは従来のRTX 30シリーズになかった、8ビット浮動小数点（FP8）Tensor Engineを搭載し、FP8演算に対応します。スループットは最大5倍、RTX 4090では約1.32 TFLOPSの演算性能を可能に。

H100 PCIe：約3026 TFLOPS
RTX 4090：約1321 TFLOPS
RTX 4080 16GB：約780 TFLOPS（概算）
RTX 4080 12GB：約640 TFLOPS（概算）
RTX 3090：非対応

AI技術開発やディープラーニングで役立ちます。

ライバルのRadeonシリーズには無い、新たな付加価値を盛り込み、ゲーマーにとっては高すぎる価格を正当化しようとするNVIDIAの努力が伺えます。

L2キャッシュの大容量化で性能効率アップ

GPU	RTX 4090	RTX 3090	RTX 4080 16GB	RTX 4080 12GB	RTX 3080
世代	Ada Lovelace	Ampere	Ada Lovelace	Ada Lovelace	Ampere
プロセス	5 nm製造 : TSMC	8 nm製造 : Samsung	5 nm製造 : TSMC	5 nm製造 : TSMC	8 nm製造 : Samsung
シェーダー数CPUのコア数に相当	16384	10496	9728	7680	8704
L1キャッシュ演算ユニットあたり	128 KB	128 KB	128 KB	128 KB	128 KB
L2キャッシュコア全体で共有	72.0 MB	6.0 MB	64.0 MB	64.0 MB	5.0 MB
クロック周波数	2235 MHz	1395 MHz	2205 MHz	2305 MHz	1440 MHz
ブーストクロック	2520 MHz	1695 MHz	2505 MHz	2605 MHz	1710 MHz

RTX 40シリーズは性能を効率よく高めるため、L2キャッシュの大容量化に踏み切りました。

RTX 4090ではRTX 3090より12倍も多い72 MBのL2キャッシュを、RTX 4080では約12.8倍も多い64 MBのL2キャッシュを搭載します。キャッシュヒット率が50%以上も改善し、実質的なVRAM帯域幅が2倍以上になる計算です。

VRAM帯域幅の実質的な改善は、4K～8Kゲーミングにおいて特に重要とされています。実例の一つがRadeon RX 6000シリーズのスペックの割に振るわない4Kゲーミング性能が挙げられます。

低解像度（フルHD）においては2 GHz超えの高いクロックとIPCの高さが貢献してRTX 3000シリーズを上回る傾向があったRX 6000ですが、4KゲーミングとなるとあっさりRTX 3000に敗北を喫しています。

最大の理由がVRAM帯域幅の有無です。RTX 3090は約1 TB/s近いVRAM帯域幅を持ち、RX 6900 XTは512 GB/sしかありません。足りない帯域幅を補うために、大容量L3キャッシュによるInfinity Cacheがありますが、4Kゲーミングではこれでも不足でした。

今回のRTX 40シリーズは、従来と同じくGDDR6Xメモリによる約1 TB/s近いVRAM帯域幅を維持したまま、L3ではなく更にコアに近いL2キャッシュの大容量化を実装しています。

DLSS 3.0を併用した100 fps（200 fpsも視野？）超えの、ハイフレームレート4Kゲーミングに必須の設計です。

一方で、RTX 3090相当の性能を目指しているRTX 4080 16GB / 12GBはVRAMのバス幅が旧世代より絞られています。キャッシュヒット率が50%に改善する計算だと、RTX 4080 16GBは実質1.5 TB/s前後、RTX 4080 12GBが実質1.1 TB/s前後です。

RTX 3090超えかつRTX 4090未満の性能なら、実質1.1～1.5 TB/sあれば十分だと思われますが、実際に動かしてみないとなんとも言えない部分も多く参考程度にとらえてください。

デュアルNVEncで「AV1」エンコードに対応

世代	Ada Lovelace	Ampere
NVEncエンコーダー	第8世代（デュアル）	第7世代
NVEncデコーダー	第5世代	第5世代
AV1エンコード	対応	–
AV1デコード	対応	対応