RTX 4090 / 4080 16GB / 4080 12GB:RTX 40シリーズの性能と仕様を解説

GeForce RTX 40シリーズ(Ada Lovelace世代)が登場。RTX 30シリーズ(Ampere世代)からきっかり2年ぶりの後継モデルです。

今回正式リリースされた「RTX 4090」「RTX 4080 16GB」「RTX 4080 12GB」のスペック、性能、そして価格やコスパについて。本記事でわかりやすく解説します。

(公開:2022/9/21 | 更新:2022/9/21

Sponsored Link

全部で3つある「RTX 40」シリーズ

これから約15000文字を使ってRTX 40シリーズを解説しますが・・・「長いよ!! 読んでられない。」という人向けに、「結論まとめ」から始めます。

  • RTX 40シリーズの発売日と価格は?
RTX 40902022年10月12日1599ドル
(国内は約30万円~
RTX 4080 16GB2022年11月1199ドル
(国内は約22万円~
RTX 4080 12GB2022年11月899ドル
(国内は約16万円~

製造コストが非常に高額とされるTSMC 4N(5 nm)プロセスを採用した「RTX 40」シリーズは、すべてのグレードで軒並み値上げです。

最上位のRTX 4090は100ドルの値上げ(国内:約30万円~)と少ないですが、RTX 4080は16GB版なら500ドルの値上げ(国内:約22万円~)、12GB版ですら200ドルの値上げ(国内:約16万円~)と高いです。

2022年時点で、NVIDIAは在庫がたまりに溜まっているRTX 30シリーズも併売するらしく、置き換えモデルというより実質的な上位グレードとして販売される形式になります。

  • RTX 40シリーズのスペック(仕様)は?

RTX 30とは違い、RTX 40では(最上位を除いて)シェーダー数があまり増えておらず、ブーストクロックの大幅な引き上げやL2キャッシュの増量によるIPC改善で性能アップを狙います。

RTX 4090は16384コアで、ブーストクロックが2.5 GHzです。RTX 4080 16GBは9728コア、ブーストクロックが2.5 GHzです。RTX 4080 12GBはなんとシェーダー数が減って7680コア、ブーストクロックは2.6 GHzと大幅上昇です。

RTX 4080の16GB版と12GB版でシェーダー数が違うのは少々ややこしい仕様で注意が必要。消費者としては、16GB版をRTX 4080 Tiとしてリリースしてほしかったですが、後出し用の型番をとっておくのがNVIDIAらしいやり方です。

  • RTX 40シリーズの性能は?

シェーダー数とクロック周波数から予想できる理論性能(FP32)は以下のとおりです。

  • RTX 4090が、RTX 3090の約2.32倍
  • RTX 4080 16GBが、RTX 3080 10GBの約1.64倍
  • RTX 4080 12GBが、RTX 3080 10GBの約1.35倍

RTX 4090だけが飛び抜けて性能の上昇幅が大きく、RTX 4080番台は伸び幅が控えめです。

価格差を計算するとコストパフォーマンスは完全に悪化しており、これから一部で投げ売りされるであろうRTX 30シリーズを底値で買うのが正しい戦略になる場合も十分に考えられます。

なお、上記の性能はあくまでも理論性能(FP32)に基づいた理論値であり、実際のゲーミング性能はさらに下がる可能性もあります。

一方で、L2キャッシュの増量によるIPC改善や、第4世代Tensorコアを用いた最新のアップスケーリング技術「DLSS 3.0」でどこまで性能を底上げできるかで評価が激変する可能性も濃厚です。

  • RTX 40シリーズの技術的な進化は?

カタログスペック面の進化はパッとしないものの、技術的な進化はいろいろあります。

興味があるところは、↑それぞれの解説を読んでみてください。

RTX 40シリーズのスペックまとめ

スペックRTX 4090RTX 3090RTX 4080 16GBRTX 4080 12GBRTX 3080 10GB
製造TSMC 5 nmSamsung 8 nmTSMC 5 nmTSMC 5 nmSamsung 8 nm
コア数1638410496972876808704
ブーストクロック25201695251026101710
理論性能(FP32)82.58 TFLOPS35.58 TFLOPS48.83 TFLOPS40.09 TFLOPS29.77 TFLOPS
VRAMGDDR6X 24GBGDDR6X 24GBGDDR6X 16GBGDDR6X 12GBGDDR6X 10GB
バス幅384-bit384-bit256-bit192-bit320-bit
TDP450 W350 W320 W285 W320 W
レイトレ第3世代第2世代第3世代第3世代第2世代
Tensor第4世代第3世代第4世代第4世代第3世代
AV1 HWデコード:対応
エンコード:対応
デコード:対応デコード:対応
エンコード:対応
デコード:対応
エンコード:対応
デコード:対応
MSRP$ 1599$ 1499$ 1199$ 899$ 699
FE公式価格298000 円229800 円219800 円164800 円109800 円
GPURTX 4090RTX 3090RTX 4080 16GBRTX 4080 12GBRTX 3080
世代Ada LovelaceAmpereAda LovelaceAda LovelaceAmpere
プロセス5 nm製造 : TSMC8 nm製造 : Samsung5 nm製造 : TSMC5 nm製造 : TSMC8 nm製造 : Samsung
トランジスタ数763.0 億283.0 億??283.0 億
ダイサイズ608 mm2628 mm2380 mm2300 mm2628 mm2
シェーダー数CPUのコア数に相当1638410496972876808704
TMU数Texture Mapping Unitのこと512328304240272
ROP数Render Output Unitのこと192112967696
演算ユニット数12882766068
Tensorコア数機械学習向けの特化コア512328304240272
RTコア数レイトレ用の特化コア12882766068
L1キャッシュ演算ユニットあたり128 KB128 KB128 KB128 KB128 KB
L2キャッシュコア全体で共有96.0 MB6.0 MB64.0 MB64.0 MB5.0 MB
L3キャッシュコア全体で共有
クロック周波数2235 MHz1395 MHz2205 MHz2305 MHz1440 MHz
ブーストクロック2520 MHz1695 MHz2505 MHz2605 MHz1710 MHz
VRAMGDDR6X 24 GBGDDR6X 24 GBGDDR6X 16 GBGDDR6X 12 GBGDDR6X 10 GB
VRAMバス384 bit384 bit256 bit192 bit320 bit
VRAM帯域幅1018 GB/s936.2 GB/s742.4 GB/s556.8 GB/s760.3 GB/s
理論性能(FP32)82.58 TFLOPS35.58 TFLOPS48.74 TFLOPS40.09 TFLOPS29.77 TFLOPS
SLI対応対応
PCIePCIe 4.0 x16PCIe 4.0 x16PCIe 4.0 x16PCIe 4.0 x16PCIe 4.0 x16
TDP450 W350 W320 W285 W320 W
補助電源16-pin12-pin16-pin16-pin12-pin
MSRP$ 1599$ 1499$ 1199$ 899$ 699
参考価格179800 円99800 円
発売価格298000 円229800 円219800 円164800 円95700 円
発売2022/10/122020/9/242022/112022/112020/9/17

※RTX 4080 16GB / 12GBは一部、未確定な情報があるため暫定的なスペックとなります。

2022年9月時点、NVIDIAから正式アナウンスされているRTX 40シリーズは以上の3つです。

TSMC 5 nmプロセスのおかげで、ダイ面積を抑えつつトランジスタ搭載数を大幅に増加させていますが、MSRPは据え置きどころか大幅な値上げとなったのがとても残念です。

やはり飛び込みで使わせてもらったTSMC 5 nmプロセスが相当に高くついたと推測できます。加えて2年前から見て約30%も進んだ円安も、国内販売価格に大きな打撃です。

現状はラグジュアリーモデルに過ぎず、一般ユーザーは引き続き併売されるRTX 30シリーズを購入する流れになります。グラフィックボード1枚に5万円超えですら高いと感じる人が圧倒的に多いなか、10万どころか15万円オーバーはついていけないでしょう。

やかもち
FE版はともかく、オリファンモデルはASK税も加わってくるため、実際の値段はどこまで上がってしまうのか・・・不安です。

RTX 4090(RTX 3090の約2.3倍)

【最上位モデル】性能は2倍、価格もほぼ2倍

GeForce RTX 4090の仕様とスペック
GPURTX 4090RTX 3090
プロセス5 nm製造 : TSMC8 nm製造 : Samsung
シェーダー数CPUのコア数に相当1638410496
RTコア数レイトレ用の特化コア12882
ブーストクロック2520 MHz1695 MHz
VRAMGDDR6X 24 GBGDDR6X 24 GB
理論性能(FP32)82.58 TFLOPS35.58 TFLOPS
SLI対応対応
PCIePCIe 4.0 x16PCIe 4.0 x16
TDP450 W350 W
補助電源8 x 3 pin12-pin
MSRP$ 1599$ 1499
参考価格179800 円
発売価格298000 円212278 円
発売2022/10/122020/9/24
GPURTX 4090RTX 3090
世代Ada LovelaceAmpere
プロセス5 nm製造 : TSMC8 nm製造 : Samsung
トランジスタ数763.0 億283.0 億
ダイサイズ608 mm2628 mm2
シェーダー数CPUのコア数に相当1638410496
TMU数Texture Mapping Unitのこと512328
ROP数Render Output Unitのこと192112
演算ユニット数12882
Tensorコア数機械学習向けの特化コア512328
RTコア数レイトレ用の特化コア12882
L1キャッシュ演算ユニットあたり128 KB128 KB
L2キャッシュコア全体で共有96.0 MB6.0 MB
L3キャッシュコア全体で共有
クロック周波数2235 MHz1395 MHz
ブーストクロック2520 MHz1695 MHz
VRAMGDDR6X 24 GBGDDR6X 24 GB
VRAMバス384 bit384 bit
VRAM帯域幅1018 GB/s936.2 GB/s
理論性能(FP32)82.58 TFLOPS35.58 TFLOPS
SLI対応対応
PCIePCIe 4.0 x16PCIe 4.0 x16
TDP450 W350 W
補助電源8 x 3 pin12-pin
MSRP$ 1599$ 1499
参考価格179800 円
発売価格298000 円212278 円
発売2022/10/122020/9/24

「RTX 4090」がRTX 40シリーズの現行最上位モデルです。ただしフルスペックモデルではない※ため、おそらく後出しでRTX 4090 Tiが出てくる可能性が高いです。

基本スペックは凄まじい内容です。シェーダー数が約1.6倍の16384コア、ブーストクロックは約1.5倍の2.5 GHzに達します。コア数とクロックから計算できる理論性能(FP32)は80 TFLOPS超えで、RTX 3090の約2.3倍です。

実際のゲーミング性能はFP32ほどの伸びを見せないですが、RTX 4090ではL2キャッシュが6 MB → 96 MBへ大幅に増量されており、キャッシュヒット率の改善でスペック通りの性能を出しやすい環境に。

加えて、FP8演算に対応する第4世代Tensor Coreの実装により、強力なアップスケーリング機能「DLSS 3.0」に対応。DLSS 3.0の有無で、レイトレを有効化した状態で最大4倍の4Kゲーミング性能を可能とのこと。

全体的に性能アップが目覚ましいものの、TDPは350 W → 450 Wへ増えており、ファクトリーオーバークロックが施されるオリジナルモデルでは600 Wも視野に入っています。

DLSS 3.0にフル対応するゲームならともかく、DLSSを使えないゲームではワットパフォーマンスとコスパの両方がかえって悪化するリスクも抱えています。

NVIDIAの希望小売価格は1599ドルと、先代のRTX 3090から100ドルの値上げです。性能を考えるとコスパも文句なしですが、日本国内ではFE版の予価が298000円と発表されており、非常に高いです。

RTX 3090が約15~17万円で購入できる状況だと、コストパフォーマンスはほぼトントンでしょう。

なお、RTX 3090相当の性能が欲しい場合は次に紹介する「RTX 4080 16GB」や「RTX 4080 12GB」が魅力的です。

※ダイショット(チップの画像)を見ると、演算ユニットを144個(18432コア)まで搭載できる余裕があります。

やかもち
仮にRTX 3090登場から円安が進んでいなかった場合、想定価格は23万円でした。

RTX 4080 16GB(RTX 3080の約1.6倍)

RTX 3090以上の性能をRTX 3090並の価格で

GeForce RTX 4080 16GBの仕様とスペック
GPURTX 4080 16GBRTX 4080 12GBRTX 3080 12GB
プロセス5 nm製造 : TSMC5 nm製造 : TSMC8 nm製造 : Samsung
シェーダー数CPUのコア数に相当972876808960
RTコア数レイトレ用の特化コア766070
ブーストクロック2505 MHz2605 MHz1710 MHz
VRAMGDDR6X 16 GBGDDR6X 12 GBGDDR6X 12 GB
理論性能(FP32)48.74 TFLOPS40.09 TFLOPS30.64 TFLOPS
SLI対応
PCIePCIe 4.0 x16PCIe 4.0 x16PCIe 4.0 x16
TDP320 W285 W350 W
補助電源8 x 3 pin8 x 2 pin12-pin
MSRP$ 1199$ 899$ 799
参考価格103800 円
発売価格219800 円164800 円109800 円
発売2022/112022/112022/6/11
GPURTX 4080 16GBRTX 4080 12GBRTX 3080 12GB
世代Ada LovelaceAda LovelaceAmpere
プロセス5 nm製造 : TSMC5 nm製造 : TSMC8 nm製造 : Samsung
トランジスタ数??283.0 億
ダイサイズ380 mm2300 mm2628 mm2
シェーダー数CPUのコア数に相当972876808960
TMU数Texture Mapping Unitのこと304240280
ROP数Render Output Unitのこと967696
演算ユニット数766070
Tensorコア数機械学習向けの特化コア304240280
RTコア数レイトレ用の特化コア766070
L1キャッシュ演算ユニットあたり128 KB128 KB128 KB
L2キャッシュコア全体で共有64.0 MB64.0 MB5.0 MB
L3キャッシュコア全体で共有
クロック周波数2205 MHz2305 MHz1260 MHz
ブーストクロック2505 MHz2605 MHz1710 MHz
VRAMGDDR6X 16 GBGDDR6X 12 GBGDDR6X 12 GB
VRAMバス256 bit192 bit384 bit
VRAM帯域幅742.4 GB/s556.8 GB/s912.4 GB/s
理論性能(FP32)48.74 TFLOPS40.09 TFLOPS30.64 TFLOPS
SLI対応
PCIePCIe 4.0 x16PCIe 4.0 x16PCIe 4.0 x16
TDP320 W285 W350 W
補助電源8 x 3 pin8 x 2 pin12-pin
MSRP$ 1199$ 899$ 799
参考価格103800 円
発売価格219800 円164800 円109800 円
発売2022/112022/112022/6/11

「RTX 4080 16GB」は、RTX 3080 12GBの後継にあたるモデルです。価格はなんと400ドル上がって1199ドル、国内価格は約22万円と現行のRTX 3090よりもお高いです。

とはいえ値段なりの性能はきちんと提供できる用意があります。シェーダー数は1割増の9728コアで、ブーストクロックは1.7 GHzから一気に2.5 GHzまで伸びています。

シェーダー数とクロックから計算できる理論性能(FP32)は約49 TFLOPSで、RTX 3080 12GB比較で約1.6倍もの性能アップです。

L2キャッシュも5 MB → 64 MBへ大幅に増え、キャッシュヒット率の改善による性能の効率化が図られています。2 GHz超えの高いクロックは低解像度でも効きやすい傾向があるため、1.6倍はともかくRTX 3090超えはほぼ確実でしょう。

FP8演算に対応した第4世代Tensor Coreが可能にする「DLSS 3.0」も含めると、NVIDIAいわく対応タイトルで最大2倍以上の性能向上も可能とのこと。

問題はどの程度RTX 3090を超えられているかどうかです。性能の伸び幅次第では、セール特価のRTX 3090を買ったほうがコスパが良い場合も普通にありえます。

やかもち
80番台に22万円とは・・・あまりにも高い。円安がなくても16.5万円ですから、やはり高いです。

RTX 4080 12GB(RTX 3080の約1.4倍)

RTX 3090とほぼ同じ価格でRTX 3090 Tiを上回る

GeForce RTX 4080 12GBの仕様とスペック
GPURTX 4080 12GBRTX 3080
プロセス5 nm製造 : TSMC8 nm製造 : Samsung
シェーダー数CPUのコア数に相当76808704
RTコア数レイトレ用の特化コア6068
ブーストクロック2605 MHz1710 MHz
VRAMGDDR6X 12 GBGDDR6X 10 GB
理論性能(FP32)40.09 TFLOPS29.77 TFLOPS
SLI対応
PCIePCIe 4.0 x16PCIe 4.0 x16
TDP285 W320 W
補助電源8 x 2 pin12-pin
MSRP$ 899$ 699
参考価格91800 円
発売価格164800 円95700 円
発売2022/112020/9/17
GPURTX 4080 12GBRTX 3080
世代Ada LovelaceAmpere
プロセス5 nm製造 : TSMC8 nm製造 : Samsung
トランジスタ数?283.0 億
ダイサイズ300 mm2628 mm2
シェーダー数CPUのコア数に相当76808704
TMU数Texture Mapping Unitのこと240272
ROP数Render Output Unitのこと7696
演算ユニット数6068
Tensorコア数機械学習向けの特化コア240272
RTコア数レイトレ用の特化コア6068
L1キャッシュ演算ユニットあたり128 KB128 KB
L2キャッシュコア全体で共有64.0 MB5.0 MB
L3キャッシュコア全体で共有
クロック周波数2305 MHz1440 MHz
ブーストクロック2605 MHz1710 MHz
VRAMGDDR6X 12 GBGDDR6X 10 GB
VRAMバス192 bit320 bit
VRAM帯域幅556.8 GB/s760.3 GB/s
理論性能(FP32)40.09 TFLOPS29.77 TFLOPS
SLI対応
PCIePCIe 4.0 x16PCIe 4.0 x16
TDP285 W320 W
補助電源8 x 2 pin12-pin
MSRP$ 899$ 699
参考価格91800 円
発売価格164800 円95700 円
発売2022/112020/9/17

「RTX 4080 12GB」は、RTX 3080の後継モデルです。ノーマルの80番台として、過去もっとも高価な899ドル(200ドル値上げ)となり、国内価格はなんと約16.5万円となります。

RTX 3080の発売価格が約9.6万円で、現在は9万円ちょっとで購入できると考えると「高い」としか言えないです。

NVIDIAによればDLSS 3.0適用時の性能で、RTX 3080 Tiに対して約1.5~2.6倍の性能アップを実現しているとのこと。本当であればかつての最上位モデルRTX 3090 Tiすら超えている性能です。

RTX 3090とほぼ同じ価格で、さらに上のRTX 3090 Tiを超える性能なら、一応コストパフォーマンスは改善されているように見えます。少なくともDLSS 3.0対応タイトルではRTX 3090超えは容易だと、NVIDIAは強気です。

L2キャッシュの大幅増量(5 MB → 64 MB)と、2.6 GHzもの高いブーストクロックで、シェーダーあたりの性能も改善が見込めます。DLSSを使わない場合の性能も、RTX 3090と同等レベルは可能でしょう。

しかし、16.5万円の割に性能が良いとはいっても、グラフィックボード単品に16.5万円は(正直なところ)常軌を逸した価格です。

RTX 3090以上の性能を必要としているコアなゲーマーやクリエイターにとって魅力のあるグラボであって、フルHDで144 fpsが出れば十分な大多数のゲーマーにとっては単なるラグジュアリーモデルに過ぎません。

やかもち
円安がなかった場合の価格は12.3万円です。でも80番台(無印)に12.3万円は高いような・・・。
Sponsored Link

RTX 40シリーズの進化ポイント

第3世代RTコアで高効率化するレイトレ性能

Ada Lovelace世代(第3世代)RTコアは、Ampere世代(第2世代)のRTコアと比較して

  • 光線と三角形の交差スループット:2倍
  • Bounding Volume Hierarchy (BVH) のビルド時間:最大10倍も高速化
  • BVHストレージ スペース(VRAM専有量):最大5%にカット

と、さらに効率よくレイトレを処理できるように改善されました。

レイトレ単体の性能向上幅は不明ですが、NVIDIAのアピールするRTX 3090 Ti比較で最大4倍のパフォーマンスはDLSS 3.0だけでなく、高効率化したレイトレ処理性能も貢献している可能性が高いです。

第4世代Tensor Coreによる「DLSS 3.0」

データセンター向けに出荷されているHopper世代(H100 GPU)ですでに導入されている、FP8演算に対応した第4世代Tensor Coreを、Ada Lovelace世代にも導入しました。

DLSS 3.0によるパフォーマンス

専門的な話は抜きにして、パフォーマンスを見てみましょう。NVIDIAによると、DLSS 3.0による4Kゲーミング性能はRTX 3090 Tiと比較してベストケースでなんと4倍以上です。

RTX 4090とRTX 3090 Tiの理論性能はせいぜい2.3~2.4倍の性能差に過ぎず、4Kゲーミングで4倍超えの性能幅を出すのは難しいです。第4世代Tensor Coreを導入した「DLSS 3.0」を使ってこそ実現した大幅な性能向上です。

なお、NVIDIAの解説を読む限りでは、DLSS 3.0はFP8演算に対応する第4世代Tensor Core以降で対応できる機能※です。第4世代Tensor Coreを持たない旧世代(AmpereやTuring)はDLSS 2.xにとどまります。

※もちろん、NVIDIAのハッタリである可能性は否定できませんが・・・。

やかもち
DLSS 3.0とOFA(Optical Flow Accelerator)により、1枚のソースフレームから2枚以上のフレーム生成が可能になったらしく、最大4倍近い性能アップも納得です。

最大1.4 TFLOPSのFP8演算性能(初実装)

FP8に対応する第4世代tensor Core

RTX 40シリーズは従来のRTX 30シリーズになかった、8ビット浮動小数点(FP8)Tensor Engineを搭載し、FP8演算に対応します。スループットは最大5倍、RTX 4090では約1.32 TFLOPSの演算性能を可能に。

  • H100 PCIe:約3026 TFLOPS
  • RTX 4090:約1321 TFLOPS
  • RTX 4080 16GB:約780 TFLOPS(概算)
  • RTX 4080 12GB:約640 TFLOPS(概算)
  • RTX 3090:非対応

AI技術開発やディープラーニングで役立ちます。

ライバルのRadeonシリーズには無い、新たな付加価値を盛り込み、ゲーマーにとっては高すぎる価格を正当化しようとするNVIDIAの努力が伺えます。

L2キャッシュの大容量化で性能効率アップ

GPURTX 4090RTX 3090RTX 4080 16GBRTX 4080 12GBRTX 3080
世代Ada LovelaceAmpereAda LovelaceAda LovelaceAmpere
プロセス5 nm製造 : TSMC8 nm製造 : Samsung5 nm製造 : TSMC5 nm製造 : TSMC8 nm製造 : Samsung
シェーダー数CPUのコア数に相当1638410496972876808704
L1キャッシュ演算ユニットあたり128 KB128 KB128 KB128 KB128 KB
L2キャッシュコア全体で共有96.0 MB6.0 MB64.0 MB64.0 MB5.0 MB
クロック周波数2235 MHz1395 MHz2205 MHz2305 MHz1440 MHz
ブーストクロック2520 MHz1695 MHz2505 MHz2605 MHz1710 MHz

RTX 40シリーズは性能を効率よく高めるため、L2キャッシュの大容量化に踏み切りました。

RTX 4090ではRTX 3090より約16倍も多い96 MBのL2キャッシュを、RTX 4080では約12.8倍も多い64 MBのL2キャッシュを搭載します。キャッシュヒット率が50%以上も改善し、実質的なVRAM帯域幅が2倍以上になる計算です。

VRAM帯域幅の実質的な改善は、4K~8Kゲーミングにおいて特に重要とされています。実例の一つがRadeon RX 6000シリーズのスペックの割に振るわない4Kゲーミング性能が挙げられます。

低解像度(フルHD)においては2 GHz超えの高いクロックとIPCの高さが貢献してRTX 3000シリーズを上回る傾向があったRX 6000ですが、4KゲーミングとなるとあっさりRTX 3000に敗北を喫しています。

最大の理由がVRAM帯域幅の有無です。RTX 3090は約1 TB/s近いVRAM帯域幅を持ち、RX 6900 XTは512 GB/sしかありません。足りない帯域幅を補うために、大容量L3キャッシュによるInfinity Cacheがありますが、4Kゲーミングではこれでも不足でした。

今回のRTX 40シリーズは、従来と同じくGDDR6Xメモリによる約1 TB/s近いVRAM帯域幅を維持したまま、L3ではなく更にコアに近いL2キャッシュの大容量化を実装しています。

DLSS 3.0を併用した100 fps(200 fpsも視野?)超えの、ハイフレームレート4Kゲーミングに必須の設計です。

一方で、RTX 3090相当の性能を目指しているRTX 4080 16GB / 12GBはVRAMのバス幅が旧世代より絞られています。キャッシュヒット率が50%に改善する計算だと、RTX 4080 16GBは実質1.5 TB/s前後、RTX 4080 12GBが実質1.1 TB/s前後です。

RTX 3090超えかつRTX 4090未満の性能なら、実質1.1~1.5 TB/sあれば十分だと思われますが、実際に動かしてみないとなんとも言えない部分も多く参考程度にとらえてください。

デュアルNVEncで「AV1」エンコードに対応

世代Ada LovelaceAmpere
NVEncエンコーダー第8世代(デュアル)第7世代
NVEncデコーダー第5世代第5世代
AV1エンコード対応
AV1デコード対応対応

Ada Lovelace世代から、ゲーム実況配信へのフル対応に向けて第8世代NVEncエンコーダーを2つ搭載します。

Intel DG2 Graphicsが一足先に対応している「AV1エンコード」をサポート。H.264やH.265と同じビットレートで比較して、より高い映像品質(VMAFスコア)を可能にする最新の圧縮形式に対応します。

逆に言うと、同じ映像品質を維持するならビットレートを下げられ、ストレージ容量の節約が可能です。少ない転送容量で高画質が可能になるため、ネット回線が弱い環境でも配信しやすくなります。

NVencがAV1エンコードに対応

NVIDIAによると、NVEncによるAV1エンコードは従来のH.264エンコードと比較して、フルHDで40%、WQHD~4Kで50%も効率よく画質を稼げるとのこと。

同じビットレートで配信すると約40~50%高いビットレートの画質に相当し、同じ画質を維持するとビットレートを29~34%も削減できる計算です。

AV1エンコードは定番の配信ソフトOBS Studioが対応している他、Davinci ResolveやAdobe Premiere Proも2022年10月からAV1エンコードに対応する予定です。

NVIDIA公式のキャプチャソフトShadowPlayはRTX 40シリーズを使って、最大8K @60 fps(HDR)でゲームプレイを録画できます。

NVEncはすでに最高のハードウェアエンコーダーですが、第8世代NVEncのデュアル実装で文字通り最強のハードウェアエンコードに。ゲーム実況配信や、動画クリエイターは必然的にRTX 40に行き着くでしょう。

製造プロセスは「TSMC 4N」を採用

TSMC 4N(5 nmプロセスノード)

RTX 40シリーズの製造に使われるプロセスは台湾TSMC社の「TSMC 4N(5 nm)」プロセスです。Samsung 8 nmからTSMC 5 nmにシュリンクし、同じ面積のまま大量のトランジスタを搭載できます。

GPUトランジスタ密度
RTX 4090
TSMC 5 nm
12549万 / 1mm2
RTX 3090
Samsung 8 nm
4459万 / 1mm2
RTX 2080 Ti
TSMC 12 nm
2308万 / 1mm2
密度2.81 倍

RTX 2080 Tiは754 mm2で180億トランジスタ、RTX 3090は628 mm2で280億トランジスタ、そしてRTX 4090は608 mm2で763億トランジスタも搭載しています。

チップ面積(1mm2)あたりのトランジスタ密度は1億2549万/1mm2となり、RTX 3090(Samsung 8 nm)比較で2.81倍です。

TSMC 4N(5 nm)プロセスによってトランジスタ密度が2.8倍も増えれば、シェーダー数を1.6倍どころか2倍以上に増やせそうですが、シェーダー数の増加に実際のゲーミング性能が比例しない現象はRTX 3000シリーズで顕著でした。

ではNVIDIAはせっかく高密度化したシリコンをどこに費やしたのか。言うまでもなく最大96 MBもの超巨大L2キャッシュです。シェーダーの総量を増やすのではなく、シェーダーあたりの性能改善に舵を切ってます。

やかもち
RTX 3090の場合、L2キャッシュの面積比は約7%でした。RTX 4090は16倍の96 MBへ大幅増量となり、L2キャッシュがチップ面積に占める割合が非常に大きいと推測できます。

RTX 40シリーズまとめ

  • DLSS 3.0込みで最大4倍のゲーミング性能
  • 2.0 GHzを超えるブーストクロック
  • 最大96 MBもの巨大L2キャッシュ
  • 配信に便利なAV1エンコードに対応
  • 補助電源コネクタは従来どおり
  • 全体的に値上げで価格が高い
  • コストパフォーマンスが変わらない可能性
  • 消費電力はさらに増えています
  • 更に分厚く巨大化が進むカード設計
  • NVLink SLIに対応しない

現時点の情報だけでは、RTX 40シリーズはRTX 30シリーズほどの興奮を感じないグラフィックボードです。正直、肩透かしを食った気分です。

各社からオリジナルファンモデルが発表されていますが、どれもデザインに進化を感じられず、ただただ巨大化しただけ。カタログスペック上のTDPは確かに大人しいように見えて、実際に出てくるボード設計の巨大さを見るに「過少申告では?」と思います。

「同じ価格でより良い性能」を求める、大多数のゲーマーにとって今回のRTX 40シリーズは刺さらないです。ぼくもその一人です。Pascal世代の衝撃的なデビューと比較すると、Ada Lovelace世代は完全に霞んでいます。

RTX 4090 / 4080は、プロの動画クリエイターやゲーム実況配信者向けのグラフィックボードといえそうです。

以上「RTX 4090 / 4080 16GB / 4080 12GB:RTX 40シリーズの性能と仕様を解説」でした。

【セールで安い】RTX 30シリーズ搭載のゲーミングPC

Sponsored Link

56 件のコメント

  • グラボ(グラフィックボード)

    グラボ(グラフィックボックス)
    となりそう

    PS5と箱が大きくなったのは必然だったか

  • 前世代のRTX 3090はRTX 3080と比べ大した性能差が無いのにやたら高かったけど
    今回はRTX 4080が凄く値上がりしたのと+$100程度の値上げですんでいるので
    ブランドの差別化がちゃんと出来ているのは良いと思う

    RTX 3000番台の在庫が1年分以上あるという話もある上に世界的なインフレや円安
    GPUの需要の急激な低下などがあるのでTSMC 4nmが高価で無くともどの道安くはならかっただろう

    GPUは今後、消費電力と値段がインフレしていくとの予想だし今世代はまだ入り口にすぎないと思う

  • 「高すぎて買えません」の一言に尽きますね。
    各モデルを10万円安くするべきです。
    GTX980が6万だったのだからRTX4080も6万でいいでしょう。

  • NVIDIAは、もう世間と逆行していても止まる事ができないのかな
    性能的にはアドバンテージはあったとしても、将来的にはより大きな所に吸収される運命なのかも?
    たとえば3060TI位の性能のGPUをインテル辺りが安く供給し始めたら、少なくとも一般ゲーマーにはNVIDIAは関係ないメーカーになりますね

  • RX7000の価格設定次第でグラボでもAMDが天下取れる可能性出てきたんでないかな
    リサ姉さんの頑張りに期待

    • RTX以上に売れてなさそうで実はもっと深刻でしょう。
      製造や流通網といったコストの大幅増で北米ベースのMSRPもあまり当てにならず、かつ為替状況も2年前と比べて大きく悪化しているので厳しいのは確実。

  • 一般庶民には縁は無いかもしれないけれどそのうちフラッグシップモデルは外付けにでもなるんですかね?

    それともなにかこう革新的なケースデザインでも出てくるんでしょうかってくらい消費電力が凄い,暖房機じゃんって冗談みたいに言ってるけどほんと暖房機じゃん

  • > グラフィックボード1枚に5万円超えですら高いと感じる人が圧倒的に多いなか、10万どころか15万円オーバーはついていけないでしょう。

    記事中にあるこの一文が核心だよね。こんな大消費電力・ハイスペックになったところで、使いこなせる用途と設備が揃っている人なんてほとんどいないんだから。こんなの、4Kモニターで144FPS目指そうってくらいでしか、役に立たんでしょ。FHD環境なら買うだけ無駄。

    ぶっちゃけた話、多くのユーザーにとっての適正スペック・価格は、GTX1660~RTX3060Tiで収まるはずなので、ユーザーが求めるのはこのクラスの性能を「安価」に「低消費電力」で「軽量化」してくれってことじゃないかと感じている。

    そんな中、敢えて性能を使い切る用途を探るなら、動画のAIアップコンバートあたりかな。逆に、この用途では性能不足になるかもしれないけど。知ってる人いたら教えて下さい。

    • ありがとうございます。TSMC 4Nは5nmのカスタムノードですね。
      割りと英語圏のメディアでも4N = 4nmと混同しているところが多く勘違いしてしまいました。

    • TSMC 4N プロセス ノードは5nm プロセスの改訂版であって、全く別のノードである 4nm/N4 と混同しやすいですね。

  • さすがにこの値段は見送りかな……
    モニターはUWQHDだしグラボなしPC買ってグラボだけ継続して使うか

  • ゲーミングモニターのサイズでは4Kの恩恵はあまりないので、主流のフルHDでは現行の3080ですらオーバースペックですからね
    4080以上は、もはやレーシングカーを個人が所有して日常の足に使うようなものですね

    • これはそうなのよね
      仕事で4Kモニタが必要な職種とかじゃない限り4K60fpsなんか狙ったところでパソコンをテレビに繋いでるの、って話になる

      • ??
        一度4K60張り付きでゲームしたら、それ以下は汚くて見てられないけどなあ
        あ、私はFPSはやらないんでそちらはわかりませんけどね

  • RTコアの進化も含めて、Blenderなんかのクリエイティブソフトではかなり高速化が期待できるんですかね。
    Cudaの純粋な演算性能が欲しい場合は3090と比べたメリットになるんでしょうか。

  • 1000番台はまでは普通にゲーム用って感じだったけど、2000番台でレイトレとか言って新しい技術盛り込み、3000番で改善加え、4000番台では機械学習向けの機能も追加。

    機械学習向けの機能はAシリーズだけで良いから、無駄な機能削って安くしてくれってのがありますね。

    どっかの人は1080tiのSLIで3080とかとFPSで差がないって動画出してたけど、実際問題2k4kとかでゲームやレイトレを楽しんだりしないなら1000番台で問題無いんですよね。
    自分は1080tiで十分楽しめました。
    4000番の正式情報前に19万の3090ti買ったけど後悔は無いです。
    機械学習考えてるならAシリーズ買うべきですし、ゲームも4090の新技術が普及版になってからでいいかなとおもいます。

    自分が3090ti買った理由はAIお絵描きしつつ黒い砂漠楽しみたくて、11GBのメモリじゃギリギリだったからなんで説得力無いですがw

  • いちハイエンドPC好きゲーマーとしては正直ガッカリしたのと同時にいつかのGTX480を思い出しました。
    新型Radeon次第ではnvidiaの天下も終わりが見えそうですね。

  • 3080の$699は興奮して即買いしたけど、今回は白けるどころか引くわ…
    本来70的位置付けのはずの12GBモデルを80と言い張る辺り自覚はあるみたいだけど

    • 16.5万円以上するものを4070として出そうとして思いとどまって止めた感。
      価格は為替の関係もストレートに反映された影響もあるが。

      6750XT 549ドルは1ドル=129円時で11万円くらいで止まったから700番で出せたが。

  • DLSS3.0とレイトレのあるゲームでのベンチしかないから騙されるんだけど、
    これら使ってない一般的なゲームだとちょっぴりパワーアップした程度のスペックアップなんだよね。

  • 4080の16GB→3090以上  4080の12GB→3090Ti以上
    で12GBのほうが性能高い事になってるけど…NVIくん?

  • > L3ではなく更に深いL2キャッシュの大容量化を実装しています

    「深い」だとL2よりL3の方がキャッシュ階層が深そうなイメージなので、
    「コアに近い」の方がしっくりきます

  • 「RTX3000番台のときもみんな似たようなこと言ってたしへーき」マン来ない当たり一般向けグラボ及び高画質ゲームの限界点に到達した感じがする

  • 未だにGTX1080TiだったりRTX2080を現役で使ってる身としては十分性能向上なので買いでは有りますが現状既に3080以上を持ってる場合後述の問題も有るしスルーしたほうが良い感じですかね?
    コア数を増やすんじゃなくて純粋に性能を上げてIPCを改善してくる辺りそろそろGPUの性能向上が現状の価格のまま上げていくことが出来なくなってきたんでしょうかね。
    また、HPWRコネクタ周りが何やらきな臭い状態なのでどうなるか発売まで注視する必要はあるのかなと思います。

    • 発火条件が660W(最大値)で10〜30時間経過したぐらいで発火って事なので、危険度的には高くは無いけど無視できないレベルですね

      ttps://www.nichepcgamer.com/archives/12vhpwr-connector-melting-problem.html

    • ワッパはまぁ性能に見合った向上ですが、単純に前世代の現状の値段と比較してコスパが悪いので、販売したての定価じゃなく1月の正月セールや来年のGWセールあたりで5万そこら値段下がってれば十分ありじゃないかとは思います、値段的に代理店がボリボリだから海外Amazonで個人輸入したほうが良さそう…

  • Nvidiaの値上げよりも円安が痛いですね。
    アベノミクス前まで遡れば6割程度の値段で買えたわけですし。
    さらに発熱が増えて故障率が上がるというのは残念です。

  • この円安の中40シリーズ買うのは無理だ。
    円安落ち着いて値段も落ち着くの願って50、60シリーズまで待機。

  • > 日本国内ではFE版の予価が298000円と発表されており、非常に高い
    FE版ではなくAIBモデルの最安ですね(いつもの通りだとZOTAかPalitかな)
    30XXの時と同様です。

  • 最初見落としていたけど構成要件:DLSS「パフォーマンスモード」の記載あるんか
    これはクオリティ比見てからじゃないと危ないかもしれない
    12万多く払って1.3倍しか効果ない可能性あり得るやばいモデルなのでは?
    それでも買う人は居そうだけどハイエンドに対してパフォーマンス比を引き合いに出すのは怖いわ

  • なんつーか…小型の車を軽視して凋落したゼネラルモータースを見ている気分と言うか…
    いかにもアメリカ的な筋肉志向と言うか…

    • 「小型車」に当たる部分の需要がちょうどiGPUによってカバーされている現状
      小型で省電力の手頃なGPUを出そうとしても株主が許さないんじゃないかという
      N社もA社も一度デカい儲けの味を知ってしまっただけに高価格モデルを出せという圧力が高そう

  • UWQHDの34インチで3060Ti使ってるけど、安く買い替えor予備を確保なら
    3080の中古か3070TiのB級品みたいなの探すほうが良いかなぁ

  • NVIDIA CEOはアーキテクチャとしては「GPUをどんな用途に使うかというよりは、その用途に対してNVIDIAが用意したどのモジュールを使うか」という考えからフルスタックコンピューティングを目指している。
    わかりやすく言えば、様々な機能性を持たせたGPUはゲームにも使えるだけで、
    ゲーマー向けではないということだ。
    私自身はなんのためのGeForce、Quadroというブランディングだったのかと呆れたし失望した。

    • 4070だったとしても今の為替では15万円以上で落ち着くでしょうけど・・・

      価格で他を当てにしても無意味ですが、AMDの方も状況的に同じですね。
      実際に549ドルのRX6750XTが5月の為替1ドル 129円時で10万円越えで販売。
      仮に今の為替でMSRPベースが下がっていなかったら6750XT 12.5万円でした。

  • この記事、補助電源がでたらめなんですけど大丈夫ですか?
    RTX4090
    3x PCIe 8-pin cables (adapter in box) OR 450 W or greater PCIe Gen 5 cable

    RTX3080(Ti)
    2x PCIe 8-pin もしくは 12 ピン x1

    補助電源コネクタは従来どおりと書いてありますが、変換ケーブルを使えば従来通りですが、実際は違います。

  • マイクラ統合版をたまにRTXオンにしてスクショを撮って回るのが好きなので4000シリーズはとても期待していて楽しみな反面
    やはり値段が強過ぎる…
    もはやカメラを買って旅に出た方がいいレベルなので頭が痛いです
    フルレイトレーシングができるゲームにとってRTXグラボは新しく、そしてグレードが高いほど残像感がなくなり確実に良くなっていくものなので
    「この頃の定価が1番高かった」で済まされる話になってほしいです

  • rtx4070が899ドルになると買えない人が出て来るからrtx4080として売っただけなのに散々に言われるNvidia可哀想

  • そもそも本来の値段なら13万くらいで16万ってご祝儀価格だし16万でもrtx3090tiと同等の性能なら普通にコスパいいでしょ

  • 卿はコスパ良好な80シリーズがコスパ無視の90Tiレートになってしまったと仰っておるのだ

  • コメントを残す

    メールアドレスが公開されることはありません。