NVIDIAが既存ラインナップのテコ入れ、いわゆる「Super商法」を今年から始めました。
新たに追加された3つのSuperシリーズで、今もっとも人気が高い「RTX 4070 Ti Super」を実際に買って詳しくレビューします。先代のRTX 4070 Tiと比較してどれくらい性能が上がり、コスパが改善されているのか?・・・性能を比較ベンチマークしましょう。
(公開:2024/4/30 | 更新:2024/4/30)
「RTX 4070 Ti SUPER」の仕様とスペック
GPU | RTX 4070 Ti SUPER | RTX 4070 Ti | RTX 3080 |
---|---|---|---|
プロセス | 5 nm製造 : TSMC | 5 nm製造 : TSMC | 8 nm製造 : Samsung |
シェーダー数CPUのコア数に相当 | 8448 | 7680 | 8704 |
RTコア数レイトレ用の特化コア | 66 | 60 | 68 |
ブーストクロック | 2610 MHz | 2610 MHz | 1710 MHz |
VRAM | GDDR6X 16 GB | GDDR6X 12 GB | GDDR6X 10 GB |
理論性能(FP32) | 44.10 TFLOPS | 40.09 TFLOPS | 29.77 TFLOPS |
PCIe | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 |
TDP | 285 W | 285 W | 320 W |
補助電源 | 16-pin | 16-pin | 12-pin |
MSRP | $ 799 | $ 799 | $ 699 |
参考価格 | 128480 円 | 113800 円 | 102380 円 |
発売価格 | 123780 円 | 149000 円 | 95700 円 |
発売 | 2024/1/24 | 2023/1/5 | 2020/9/17 |
GPU | RTX 4070 Ti SUPER | RTX 4070 Ti | RTX 3080 |
---|---|---|---|
世代 | Ada Lovelace | Ada Lovelace | Ampere |
プロセス | 5 nm製造 : TSMC | 5 nm製造 : TSMC | 8 nm製造 : Samsung |
トランジスタ数 | 459.0 億 | 358.0 億 | 283.0 億 |
ダイサイズ | 379 mm2 | 295 mm2 | 628 mm2 |
シェーダー数CPUのコア数に相当 | 8448 | 7680 | 8704 |
TMU数Texture Mapping Unitのこと | 264 | 240 | 272 |
ROP数Render Output Unitのこと | 96 | 80 | 96 |
演算ユニット数 | 66 | 60 | 68 |
Tensorコア数機械学習向けの特化コア | 264 | 240 | 272 |
RTコア数レイトレ用の特化コア | 66 | 60 | 68 |
L1キャッシュ演算ユニットあたり | 128 KB | 128 KB | 128 KB |
L2キャッシュコア全体で共有 | 48.0 MB | 48.0 MB | 5.0 MB |
L3キャッシュコア全体で共有 | – | – | – |
クロック周波数 | 2340 MHz | 2310 MHz | 1440 MHz |
ブーストクロック | 2610 MHz | 2610 MHz | 1710 MHz |
VRAM | GDDR6X 16 GB | GDDR6X 12 GB | GDDR6X 10 GB |
VRAMバス | 256 bit | 192 bit | 320 bit |
VRAM帯域幅 | 672.3 GB/s | 504.2 GB/s | 760.3 GB/s |
理論性能(FP32) | 44.10 TFLOPS | 40.09 TFLOPS | 29.77 TFLOPS |
SLI対応 | – | – | – |
PCIe | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 |
TDP | 285 W | 285 W | 320 W |
補助電源 | 16-pin | 16-pin | 12-pin |
MSRP | $ 799 | $ 799 | $ 699 |
参考価格 | 128480 円 | 113800 円 | 102380 円 |
発売価格 | 123780 円 | 149000 円 | 95700 円 |
発売 | 2024/1/24 | 2023/1/5 | 2020/9/17 |
「RTX 4070 Ti SUPER」は、上位モデルのRTX 4080(AD103)で使われるチップを流用して作っています。
RTX 4080のスペックを満たせなかった出来損ないチップたちを、「RTX 4070 Ti SUPER」と名付けて製品化。CPUやグラフィックボードなど半導体製品でよくあるやり方です。
上位チップを流用したおかげで、従来モデル「RTX 4070 Ti(AD104)」よりパワフルな仕様に仕上がりました。
- シェーダー数が10%増加(7680 → 8448シェーダー)
- VRAM容量が4 GB増加(12 → 16 GB)
- VRAMバス幅も向上(192 → 256 bit)
- 消費電力は据え置き(285 Wのまま)
- 価格設定も据え置き(799ドルのまま)
シェーダー数(CPUのコア数に相当)が1割増え、VRAM容量が16 GBに増量。負荷が重たいシーンで性能にかかわるVRAMバス幅も256 bitに強化されています。
これだけパワーアップしながら、消費電力と価格設定どちらも据え置きです。特にデメリットが見当たらない順当な性能アップを遂げており、今までのRTX 4070 Tiは何だったのかと革ジャンを問い詰めたい気持ちです。
RTX 4070 Ti SUPERの性能をベンチマーク比較
テスト環境 「ちもろぐ専用ベンチ機(2024)」 | ||
---|---|---|
CPU | Core i9 13900K24コア32スレッド | |
CPUクーラー | NZXT Kraken X63280 mm簡易水冷クーラー | |
マザーボード | ASUS TUF GAMINGZ690-PLUS WIFI | |
メモリ | DDR5-4800 16GB x2使用メモリ「Crucial Native DDR5」 | |
グラフィックボード | Manli RTX 4070 Ti Super Gallardo | |
SSD | NVMe 4TB使用SSD「Hanye HE80」 | |
電源ユニット | 850 W(80+ Platnium)使用モデル「Corsair HX850i」 | |
OS | Windows 11 Pro検証時のバージョンは「22H2」 | |
ドライバ | NVIDIA 551.86 | |
ディスプレイ | 3840 x 2160@144 Hz使用モデル「INNOCN 32M2V」 |
「RTX 4070 Ti SUPER」を比較するために用意した専用PCスペックです。
CPUにゲーミング性能でトップクラスの「Core i9 13900K」を使います。メモリは普通のDDR5-4800(ネイティブ)で容量32 GBで、テスト時のドライバは「551.86」です。
ベンチマーク用の莫大な数のゲームソフトやAIモデルを置いておくストレージは、容量4 TBのNVMe SSD(Hanye HE80)を使います。
ベンチマーク用のRTX 4070 Ti SUPERは、Manli社のGALLARDOを使います。たまたまセールで安かったから買っただけです。
定格クロック準拠のスタンダードなオリジナルファンモデルです。PCIe 8 pin → 12VHPWR端子に変換するコネクタや、VGAサポートステイ(支え棒)が付属します。
85 mm径トリプルファンを搭載する外排気設計を採用。厚みは実測なんと67 mmで、ほぼ3.5スロットを占有する分厚いデザインです。
肉厚なヒートシンクを搭載して、冷却性能を稼ぐ狙いです。
厚み2 mmくらいの金属製バックプレートが装着済み。隙間にサーマルパッドは挟まっていません。あくまでも裏面基板の保護が目的で、VRAMの放熱を促す狙いは無さそうです。
- HDMI 2.1
- Display Port 1.4a
- Display Port 1.4a
- Display Port 1.4a
全部で4つの映像出力端子を備えます。HDMI 2.1とDisplay Port 1.4aどちらも、4Kで160 Hzまで動作確認が取れています。
Display Port 1.4a(DSC有効時)で、おそらく4Kで240 Hzまで可能です。
グラフィックボードの傾きがわかる「水準器(水平器)」を内蔵する、とても個性的なデザインが特徴です。
ネタ枠に思えて、設計自体は非常にまともです。主にOEMと中国市場で膨大な実績があるManliらしく、きちんと静かに冷える設計を抑えています。
参考までに、購入時の価格は129800円でした。
ポイント還元なしで129800円でした。正直に言うと、記事を書いた(2024/4)時点では買うメリットがほとんど無いです。保証期間も「1年」のみ。
Yahooショッピングに出店している「Joshin Web」や「ツクモ」で、ポイント還元を狙って買ったほうがやはり有利です。
薄型で高性能なMSI GAMING X SLIMが実質12.2万円で買えますし、こだわりなければ玄人志向(黒モデルが3年保証)やPNY製の廉価モデルを実質10.9万円から買えます。ぜひ、ポイント還元込みの実質値引きを狙ってください。
ベンチマーク内容の大部分を更新したので、過去のレビュー記事と(直接的に)比較できません。よって、比較ベンチマークデータから数多くのグラフィックボードが姿を消します。
更新後もほぼ差異が生じなかった項目については、過去のデータをそのまま比較グラフに掲載します。
あと、今回の記事から掲載するグラフを高解像度化(Stable Diffusion:R-ESRGAN 4x+)した影響で、縦線がところどころ薄いです。頭の中で勝手に補完して見てくれると幸いです。
Apex Legends
(※クリックで比較グラフ拡大)
Apex Legendsを最高設定で比較したグラフです。
RTX 4070 Ti SUPERとRTX 4070 Ti(無印)の性能がほぼ同じです。実プレイで体感できる性能差はほとんど無いでしょう。
Escape from Tarkov(タルコフ)
(※クリックで比較グラフ拡大)
Escape from Tarkov(タルコフ)で、フレームレートが出づらいと有名な「Streets of Tarkov」で比較したグラフです。
設定はタルコフYoutuber「らっしーRushy_ve」さんを参考に、SSRをオフにしたり、Reflex Low Latencyをboost onにするなど、やや高画質な競技設定(→ 設定画面はこちら)を使用しました。
タルコフはVRAM使用量がとても多く、さらにVRAMの帯域幅も影響が大きいゲームタイトルです。フルHDとWQHDはゲーム側の仕様で頭打ち※ですが、負荷の重たい4Kゲーミングで有意な性能差が見られます。
もちろん、ほとんどのFPSゲーマーはタルコフをフルHDでプレイするため、グラフィックボードへの投資をそこそこに抑えてCPUにお金を掛けた方がいい結果を得られます。
※タルコフは他のプレイヤーやBOTがいるとCPUボトルネックが顕著に発生してしまい、フレームレートが伸びづらくなる傾向が強いです。シチュエーションによっては平均100 fpsすら難しい場合もあり。
Fortnite(フォートナイト)
(※クリックで比較グラフ拡大)
フォートナイトを最高設定(NANITE:無効)で比較したグラフです。
マップ「TILTED TOWERS」にて、複数のBOTと撃ち合いしたり建築物をミサイルで破壊しながら測定します。
結果はおおむねApex Legendsと似ていて、フルHDとWQHDだとRTX 4070 Ti(無印)とほぼ同じ性能です。フォートナイトなら、SUPERモデルを買う意味はないでしょう。
Call of Duty:Modern Warfare 3
(※クリックで比較グラフ拡大)
コールオブデューティ:モダン・ウォーフェア3を、極限プリセット設定(解像度100%)で比較したグラフです。
本タイトルはRadeon RX 7000シリーズが猛威をふるいます。格下のRX 7800 XTですら、RTX 4070 Ti SUPERを軽々と超えてしまいました。
RTX 4070 Ti(無印)との性能差はほとんど認められません。4Kゲーミングでわずかな差があるものの、実プレイで体感できないです。
Overwatch 2(オーバーウォッチ)
(※クリックで比較グラフ拡大)
オーバーウォッチ2をエピック設定(解像度100%)で比較したグラフです。
意外とVRAMの帯域幅が効きやすいのか、RTX 4070 Ti SUPERがRTX 4070 Ti(無印)を明確に超えます。値段に見合った性能差がちゃんと出ています。
R6S(レインボーシックスシージ)
(※クリックで比較グラフ拡大)
レインボーシックスシージを最高設定(レンダリング解像度:100%)で、付属のベンチマークモードを使って比較したグラフです。
オーバーウォッチ2と同じ傾向があり、VRAMの帯域幅がけっこう効く印象です。たとえばRTX 4070がRTX 3080に叩きのめされています。
RTX 4070 Ti SUPERは、RTX 4070 Ti(無印)よりおおむね高性能です。値段が2倍以上もするRTX 3090をやや上回る性能です。
Baldur’s Gate 3(バルダーズゲート)
(※クリックで比較グラフ拡大)
バルダーズゲート3をウルトラ設定で、グラフィックボードに負荷がかかりやすい「リズン街道」にてベンチマーク。
フルHDはゲーム側の仕様で頭打ちの傾向が見られますが、WQHD~4KゲーミングでRTX 4070 Ti SUPERがやや高性能です。
Cyberpunk 2077
(※クリックで比較グラフ拡大)
重量級ベンチマークの代表例「サイバーパンク2077」をウルトラ設定(レイトレなし)で比較したグラフです。
微妙な性能差にとどまります。RTX 3090より高性能ですが、RTX 4070 Ti(無印)との性能差が地味です。
ドラゴンズドグマ2
(※クリックで比較グラフ拡大)
カプコンが開発した大ヒットタイトル「ドラゴンズドグマ2」を、最高設定(レイトレ:オフ)でベンチマーク。
マップはフィールド「アレス山麓」を採用。NPCが多い都市部(ヴェルンワース)だと極端なCPUボトルネックが発生してまったく比較にならなかったので、フィールドを採用します。
実際のゲームプレイでも都市部にいる時間は少なく、たいていバグバタルなどフィールドエリアにいる時間が長かったです。
ベンチマークの結果、解像度が上がるほどVRAM帯域幅が効いてくる傾向です。4KゲーミングならRTX 4070 Ti SUPERの方が快適です。
エルデンリング
(※クリックで比較グラフ拡大)
エルデンリングを最高設定(レイトレ:オフ)で、ロケ地「ケイリッド地方」で比較したグラフです。
フルHDはゲーム側の仕様で頭打ち気味※ですが、WQHD~4Kゲーミングで性能差がなんとなく見えてきます。4Kゲーミングなら、RTX 4070 Ti SUPERが明確にRTX 4070 Ti(無印)を超えます。
※場所によってフレームレートの変動が激しいゲームです。ケイリッド地方で最大180 fps前後、魔術学院レアルカリアだと200 fps前後(ただしスタッター頻発)まで伸びる一方、リムグレイブ(初期エリア)や王都ローデイルはせいぜい120 fpsにとどまります。
モンハンワールド:アイスボーン
(※クリックで比較グラフ拡大)
全世界で2000万本超え、今もなお売れ続けている国産オープンワールドRPG「モンハンワールド:アイスボーン」を最高設定 + HiRes Texture Pack適用でベンチマーク。
ロケ地はあえて「古代樹の森」を採用。アイスボーンの「渡りの凍て地」まで進めたものの、結局「古代樹の森」が一番負荷が重たかったです。
RTX 4070 Ti SUPERは、すべての解像度でRTX 4070 Ti(無印)より高性能です。値段が2倍以上のRTX 3090も超えています。
ARK:Survival Ascended(ASA)
(※クリックで比較グラフ拡大)
恐竜サバイバルゲームの最新作「ASA」を、最高設定ではなく「高設定」でベンチマーク。最高設定だとあまりにも重すぎて比較に使えなかったので、あえて一段低い「高設定」を使います。
それでもフレームレートが非常に伸びづらく、RTX 4070 Ti SUPERですら平均60 fpsに達しないです。RTX 4070 Tiとの性能差もごくわずかです。
基本的に「フレーム生成(Frame Generation)」ありきのゲームだと思われます。後ほど、アップスケーリング編で追加検証します。
PalWorld(パルワールド)
(※クリックで比較グラフ拡大)
国産サバイバルゲームの傑作「パルワールド」を最高設定でベンチマーク。
グラフィックボードに負荷がかかりやすい「花兎山山頂」にて、サラブレイズ(馬)で疾走しながら測定します。なお、初回ロード時のみスタッターが頻発するので、いったんコースを走ってから測定しました。
ベンチマークの結果、フルHDはゲーム側の仕様で頭打ちに。WQHDでやや性能差が出て、4Kゲーミングでようやく性能差が見えてきます。・・・微々たる性能差でまったく体感できないです。
Cities:Skylines II(シティスカ2)
(※クリックで比較グラフ拡大)
都市運営シミュレーション「Cities:Skylines II」を、最高設定(スケーリング:無効)でベンチマーク。
強化されたVRAMが効くかと思いきや、4Kゲーミングになると性能差がなくなります。VRAMのバス幅が強いRTX 3080 / RTX 3090とさほど大差ないです。
Forza Horizon 5
(※クリックで比較グラフ拡大)
Forza Horizon 5を最高設定(MSAA x8 / レイトレなし)で比較したグラフです。
付属のベンチマークを使っているため、性能差がきれいに反映されます。Forza Horizon 5はRTX 4000シリーズやRadeon(RDNA)シリーズが得意な傾向です。
RTX 4070 Ti SUPERはすべての解像度でRTX 4070 Ti(無印)より少し高性能です。
FF14:黄金のレガシー
(※クリックで比較グラフ拡大)
Final Fantasy 14:黄金のレガシーを公式ベンチマークで比較。最初から設定されている最高設定(FSRモード)を使います。
フルHDでやや頭打ちになり、WQHD~4Kゲーミングで性能差がハッキリと出ます。RTX 4070 Ti SUPERはRTX 4070 Tiより高性能で、RTX 3090も完全に打ち負かします。
原神(Genshin Impact)
(※クリックで比較グラフ拡大)
原神を最高設定(精度:1.5 / シーン細部:最高 / 異方性:x16)で比較したグラフです。
フルHDはCPUボトルネックで頭打ちの傾向、WQHDで微妙な性能差が出ますがゲーム側の変動だと思われ、4K解像度でようやく性能差が出てきます。
マインクラフト:BE版
(※クリックで比較グラフ拡大)
マインクラフトBE版にVanilla RTXシェーダーを適用して、レイトレーシング描画距離を24チャンクに設定してベンチマーク。マップは筆者がクリエイティブモードで作成した水中マップを使います。
水中だからVanilla RTXシェーダーが劇的に効いて凄まじい映像美を発揮するかわりに、グラフィックボードにマイクラと思えない強烈な負荷を与えられます。
RTX 4070 Ti SUPERは、RTX 4070 Tiより1割ほど高性能です。なお、レイトレーシング処理が遅いRX 7000シリーズは苦戦気味です。
VRChat
(※クリックで比較グラフ拡大)
VRゲームの代表例でありながら、ベンチマークをほとんど見かけないVRChatを比較したグラフです。
グラフィック設定をUltra設定(異方性 x8)に、フレームレート上限を解除して、「Yayoi Forest House(作:猫屋敷やよい さん)」のプライベートモードで測定しました。
VRChatは単純なグラフィック性能だけでなく、VRAMのバス幅も重要です。たとえばRTX 3080を見てください、4K解像度においてRTX 4070や4070 Tiよりも高性能です。
RTX 4070 Ti SUPERはバス幅が192 → 256 bitへ改善された影響で、RTX 4070 Tiに対して約14%も性能が伸びます。しかし、バス幅384 bitを備えるRTX 3090にはあっけなく負けます。
19ゲームの平均フレームレート
(※クリックで比較グラフ拡大)
テストしたゲームの平均フレームレートをまとめました(※注意:平均はしょせん平均なので参考にしすぎないように)。
今回テストした内容だと、RTX 4070 Ti SUPERはRTX 4070 Tiに対してフルHDで約5%、WQHDで約6%、4K解像度で約9%高い性能でした。
(※クリックで比較グラフ拡大)
RTX 4070 Ti SUPERを基準点として、相対パフォーマンスも計算してみた。
相対値で見ると面白い結果が分かります。RTX 3000シリーズは4Kになるほど性能が下がりづらく、RTX 4000やRX 7000シリーズは4Kになるほど性能差が下がります。
RTX 4070 Ti SUPERは価格差の割に、性能差が小さいです。
アップスケーリング機能を比較ベンチマーク
最近のグラフィックボードはアップスケーリング技術を活用した、フレームレート底上げ機能に対応しています。
- NVIDIA GeForce:DLSS(Deep Learning Super Sampling)
- AMD Radeon:FSR(FidelityFX Super Resolution)
- Intel ARC:XeSS(Xe Super Sampling)
たとえば、GeForce RTXシリーズなら「NVIDIA DLSS」、AMD Radeonシリーズなら「AMD FSR」を対応するゲームで使えます。
DLSSまたはFSRに対応しているゲーム3本を使って、アップスケーリング有効時の性能を比較ベンチマークします。
(※クリックで比較グラフ拡大)
重たすぎてまともに動作しない「ARK:ASA(4K解像度)」でしたが、DLSS 3(フレーム生成)を使うと一気に現実的なフレームレートに。
(※クリックで比較グラフ拡大)
サイバーパンク2077(レイトレ:ウルトラ品質)もそのまま動かすと非常に重たいですが、DLSS 2(FSR 2)の適用でかなりマシになります。
DLSS 3(フレーム生成)で平均60 fpsをかんたんに超え、快適な4Kゲーミングが可能に。ちなみに、FSR 3(フレーム生成)はゲーム側が対応してないです。
AMDは知名度の高いゲームタイトルにお金を積んで、FSR 3(フレーム生成)を実装させるべきです。
(※クリックで比較グラフ拡大)
4K解像度が意外と重たいタルコフも、DLSS 2(FSR 2)を適用すれば、4Kで平均100 fps超えの快適な動作に仕上がります。
ただし、同じバランスモードでもDLSS 2の方が画質がいいです。FSR 2で同様の画質を得るにはクオリティーモード以上が必要になりますが、品質を上げるとフレームレートも下がってしまいます。
主観的に見て同じ画質であれば、(今のところ)DLSS 2.xが高フレームレートです。
- フルHDでいったんレンダリング
- 機械学習を使って4Kにアップスケーリング
- 実質4Kのフレームが完成します
4K解像度のレンダリングは非常に重たい作業ですが、DLSSを使えばフルHDやWQHD相当のレンダリングで済ませられるので、フレームレートを稼ぎやすくなります。
ちなみに、どの程度の解像度でレンダリングするかどうかはゲーム側の設定で調整できます。
- 高画質な設定(クオリティー):WQHD相当
- 標準的な設定(バランス):フルHD相当
- 性能重視(パフォーマンス):HD相当
ゲームによって差があるものの、おおむね上記のようなイメージで合ってます。
なお、あくまでもフルHDやWQHD相当の解像度でレンダリングするだけなので、「CPUボトルネック(→ 解説)」に対して無力です。CPUボトルネックが出やすいゲームだと、DLSS:バランスを使ってもフレームレートがまったく伸びない場合も多いです。
DLSS 3(FSR 3)は、1枚目と3枚目の中間フレームをAI機能でイメージして補完する機能です。単純にフレームレートが2倍になり、入力遅延も2倍に跳ね上がります。
存在しないフレームをグラフィックボード側で生成して挿入する性質上、「CPUボトルネック」に対しても一定の有効性があります。理論値で50%までCPUボトルネックの影響をカットできます。
ただし、フレームを挿入する分だけ入力遅延が増加します。入力遅延の増加は競技性が問われるFPS / TPSゲームで不利です。もっぱらMMORPGやソロプレイゲーム向けです。
定番ベンチマークの比較グラフ
役に立つか分かりませんが、一応3DMarkとVRMarkのスコアを掲載します。
SNS(Twitter X)でフォロワーに「このくらいの位置づけらしいよ?」と、ダイジェスト的に軽く紹介する分には便利かもしれません。
(※クリックで比較グラフ拡大)
軽い負荷がかかる「3DMark Fire Strike」の比較です。
やや重たい負荷がかかる「3DMark Time Spy」の比較です。
かなり重たい負荷がかかる「3DMark Speed Way」の比較です。レイトレーシング非対応のグラフィックボードだと動作しません。
かなり重たい負荷がかかる「3DMark Port Royale」の比較です。レイトレーシング非対応のグラフィックボードだと動作しません。
(※クリックで比較グラフ拡大)
レンダリング解像度:2264×1348で動作する、負荷の軽い「VRMark Orange Room」の平均フレームレートです。400 fps前後で頭打ちです。
DirectX12向けの「VRMark Cyan Room」の平均フレームレートです。500 fps前後で頭打ちです。
非常に重たい負荷がかかる「VRMark Blue Room」の平均フレームレートです。なんと5120×2880(5K解像度)でレンダリングされてます。
VRChatにかなり近似した結果を出せますが、Blue RoomはVRAMのバス幅をそれほど考慮しないため鵜呑みにしないように。
RTX 4070 Ti SUPERのクリエイティブ性能を比較
GPU | RTX 4070 Ti SUPER | RTX 4070 Ti | RTX 3080 |
---|---|---|---|
シェーダー数CPUのコア数に相当 | 8448 | 7680 | 8704 |
ブーストクロック | 2610 MHz | 2610 MHz | 1710 MHz |
VRAM | GDDR6X 16 GB | GDDR6X 12 GB | GDDR6X 10 GB |
理論性能(FP32) | 44.10 TFLOPS | 40.09 TFLOPS | 29.77 TFLOPS |
グラフィックボードのクリエイティブ性能は基本的に、シェーダー数とクロック数から計算できる理論性能(FP32)に比例して高くなる傾向があります。
RTX 4070 Ti SUPERが約44テラフロップス、RTX 4070 Tiが約40テラフロップスで1割くらいの性能アップに期待できます。実際にいくつか試して確認しましょう。
GPUレンダリング(Blender)
(※クリックで比較グラフ拡大)
GPUレンダリングの定番ベンチマーク「Blender 4.1.0」では、理論性能どおりスコアが約10%伸びました。
AIイラスト(Stable Diffusion XL)
(Kamisato Ayaka SDXL Becnhmark)
AIイラストの定番ソフト「Stable Diffusion XL(AUTOMATIC1111版)」を使って、AIイラストの生成時間を比較します。
- モデル:Pony Diffusion V6 XL
- LoRA:全部で4つ(Detail Tweaker XLなど)
- 解像度:896 x 1152
- サンプラー:DPM++ 2M Karras
- ステップ:25
- Hires.Fix:1.25倍
- Hires.Fixステップ:12
個人的によく使っている手順です。SDXLの推奨サイズでいったん書き出したあと、Hires.Fixで少しだけアップスケールして好みの絵柄に仕上げます。
(※クリックで比較グラフ拡大)
グラフィックボードの処理性能をゴリゴリと贅沢に使ってくれます。
VRAM容量が12 → 16 GBに増えた分、生成速度も改善します。RTX 4070 Tiで1分もかかった処理が、RTX 4070 Ti SUPERなら半分の30秒です。
ピーク時に約20 GBもVRAMを消費するため、VRAMが20 GB以下のグラフィックボードは「–medvram-sdxl」オプションを付けてテストしました。AMD Radeonは「ZLUDA版」を使っています。
定番のDirectML版は処理が遅すぎて話にならないです。RadeonでAIイラストなら、必ずZLUDA版(Linux環境はROCm版)を使うべきです。
- 【参考】Stable Diffusion ZLUDA版 インストーラーはこちら(g-pc.info)
生成パターン別の処理時間は以下のまとめ記事を確認してください。
言語生成AI(ローカルChatGPT)
Windows 12からCPUにAI処理性能(40 TOPS以上)が求められるなど、一般的なローカル環境でもAI処理性能が要求される時代が到来します。
代表例が「言語生成AI」です。ローカル環境で動作するLLM(大規模言語モデル)を使って、1秒あたりの平均トークン生成数を比較します。
(※クリックで比較グラフ拡大)
RTX 4070 Ti SUPERは、RTX 4070 Tiより約1.2倍のスピードで返答します。RTX 3080と性能が並ぶあたり、単純な性能だけでなくVRAMのバス幅も効いているような雰囲気です。
RAW写真のAIノイズ除去(DxO PureRAW 4)
写真現像ソフト「DxO PureRAW 4」を使って、暗い環境で撮影したノイズだらけのRAW写真からノイズを取り除きます。
「DeepPRIME XD2」によるAI処理で、3枚の写真からノイズを消すのにかかった時間をテストします。
(※クリックで比較グラフ拡大)
RTX 4070 Ti SUPERは10.52秒(1枚あたり約3.5秒)でした。RTX 4070 Tiより、わずか6%しか変わらないです。
(※ノイズ除去する前のRAW写真)
(※DeepPRIME XD2でノイズ除去)
4K動画編集(PremiereとDavinci)
Puget Systemsのベンチマークプリセットを使って、動画編集の定番ソフト「Adobe Premiere Pro」と「Davinci Resolve Studio」のGPU性能をテストします。
テストに使用される動画素材は基本的に4K解像度以上で、割りと負荷の重たいワークロードです。
(※クリックで比較グラフ拡大)
Premiere ProベンチマークのGPUスコアは「112.6点」で、RTX 4070 Tiから約7%の性能アップです。
Davinci Resolve StudioのGPUエフェクト性能は「166点」で、RTX 4070 Tiから約16%の性能アップ。解像度の大きい動作素材を食わせるテストなので、VRAM容量が多いと有利です。
動画エンコード(NVEncなど)
世代 | RTX 4070 Ti SUPER (Ada Lovelace世代) | RTX 3070 (Ampere世代) |
---|---|---|
NVEncエンコーダー | 第8世代(2基) | 第7世代 |
NVEncデコーダー | 第5世代 | 第5世代 |
AV1エンコード | 対応 | – |
AV1デコード | 対応 | 対応 |
RTX 4070 Ti SUPERに内蔵されている、第8世代NVEncデュアルエンコーダーを検証します。
rigayaさん作のAviutl拡張プラグイン「NVEnc 7.50」を使って、動画エンコードの処理速度(平均fps)と品質スコア(VMAF Score)を調べます。
テスト内容は1分30秒ほどのゲームプレイ録画(動きの激しい原神プレイ動画)を、VBR形式(Bフレーム挿入あり)でエンコードするだけです。
さすがの処理速度。RTX 4070 Ti SUPERは、AV1エンコードを平均470 fps、HEVCエンコードを平均300 fpsで処理します。
エンコード品質(VMAFスコア)も高いです。
WQHD(2560×1440 / 16000 kbps)と4K(3840×2160 / 32000 kbps)のエンコード比較です。
- NVEncデュアルエンコードは「AV1」「HEVC」で効果あり
- RadeonよりAV1エンコードの処理性能が速くて品質も良好
- RadeonよりHEVCエンコードとH.264エンコードが遅い
(品質はRTX 4070 Ti SUPERが良好)
比較グラフから読み取れるざっくりとした傾向です。
基本的にNVEncが速くて高品質、ですがRX 7000シリーズの最新世代VCEエンコーダーもいい勝負に見えます。特にHEVCエンコードのタイパ(時間効率)は特筆すべきRadeonの強みでしょう。
AV1形式をそのまま編集できるソフトがまだ少なく、どちらかといえばHEVCの方が出番が多い現状もRadeonに味方するかと。
なお、ハードウェアエンコードは基本的に内蔵されているエンコーダーで性能が決まります。同じエンコーダーを積んでいる以上、RTX 4070 Ti SUPERとRTX 4070 Ti(無印)に目立った性能差は見られません。
ゲーム開発(Unreal Engine 5)
無料で使えるゲーム開発ソフト「Unreal Engine 5.3」のプレビュー性能をテストします。
無料で配布されている「City Sample(The Matrix Awakens)」から「Small_City_LVL」を読み込み、既定のルートを1周してフレームレートを測定します。
「Big_City_LVL」だとメインメモリ容量が不足して動作が不安定だったため、メモリ容量32 GBでもなんとか動作するSmall版をテストしました。
(※クリックで比較グラフ拡大)
特に目立った性能差がないです。古いバージョンのUnreal Engineなら分かりやすく性能差が出ると思いますが、最新のUE5ではVRAMの消費量がかなり減っていて性能差が少ないです。
もっと大きなプロジェクトを読み込むと性能差が出るかもしれません。基本的にUnreal Engine 5を使った開発において、VRAM容量は多いほど有利です。
ゲーム実況配信(OBS Studio)
定番のゲーム配信ソフト「OBS Studio」を使って、レインボーシックスシージ(フルHD / 最高画質)を録画配信します。
- H.264(6000 kbps):60 fpsに制限して録画配信
- H.264(6000 kbps):360 fpsに制限して録画配信
- AV1(6000 kbps):60 fpsに制限して録画配信
- AV1(6000 kbps):360 fpsに制限して録画配信
Youtubeなら6000 kbps以上のビットレートに対応しますが、もうひとつの定番サイトTwitchが6000 kbps上限です。Twitchも想定して、あえて6000 kbpsに設定します。
配信時の画面サイズは圧倒的主流のフルHD(1920×1080)で、配信時の画面フレームレートは「60 fps」と「360 fps」の2パターンです。
Apex Legendsやレインボーシックスシージなど、競技性が求められるゲームでゲーミングモニターの使用を考えているなら、「360 fps」時の配信性能が重要です。
H.264エンコードで録画と配信を同時にすると、平均フレームレートが約20%落ち込みます。最低フレームレート(1%)も大きく下がるようです。
配信中のコマ落ち(ドロップフレーム)は問題なし。
AV1エンコードの方が負荷が軽いです。平均フレームレートこそ同じですが、最低フレームレート(1%)の安定性が向上します。
エンコード負荷が下がるため、当然コマ落ち(ドロップフレーム)も発生しなかったです。
RTX 4070 Ti SUPERの消費電力を比較
電力ロガー機能のついた電源ユニットを2台使って、CPUとマザーボードに電力供給を分割します。
テスト環境 | ||
---|---|---|
電源ユニット #1システム全体 | 850 W(80+ Platnium)使用モデル「Corsair HX850i」 | |
電源ユニット #2CPUや水冷クーラーなど | 850 W(80+ Gold)使用モデル「Toughpower iRGB PLUS」 |
システム全体を担当する電源ユニットから、+12Vレールの消費電力を見るとグラフィックボード単体の消費電力とほぼ一致します。
上記の接続方法だと、+12Vレールは基本的にグラフィックボード(6+2 pinとPCIeスロット)で使用されるため、CPUを取り除いておけば自ずとグラフィックボード単品の消費電力を抽出可能です。
ただし、電源ユニットの電力ロガーセンサーは刻み値が粗いです。変動幅が小さくなりがちな、低負荷時(低設定のフルHDなど)の精度はやや悪いです。
GPU単体の測定値を見るのではなく、他と比較して相対的に見るべきです。
誤:Aは平均200 Wらしい- 正:AはBと比較して50 W少ないらしい
これくらいのニュアンスでデータを見てくれると助かります。
特定のゲームをプレイ中の消費電力ではなく、テストした19個のゲームタイトルから平均消費電力を求めます。
(※クリックで比較グラフ拡大)
RTX 4070 Ti SUPERの消費電力です。フルHDで平均213 W、WQHDで平均239 W、4Kで平均256 Wでした。GPU使用率の高いゲームなら280 W前後まで上昇します。
RTX 4070 Tiと比較して約5~15 Wほど増えています。
消費電力10ワットあたりの平均フレームレートを計算したグラフです。
消費電力が増えた分だけ性能も伸びているため、ワットパフォーマンスもほとんど同じです。
高負荷時のGPU温度は?
GPU使用率が100%に達する「3DMark Speed Way」を10分連続で動かして、RTX 4070 Ti SUPER(Manli)のGPUコア温度を測定したグラフです(※テスト時の気温は25℃前後)。
エリア | 平均値 | ピーク値 |
---|---|---|
コア温度 | 65.0℃ | 66.8℃ |
VRAM温度 | 81.4℃ | 84.0℃ |
ホットスポット | 76.5℃ | 79.3℃ |
RTX 4070 Ti SUPERは10分を通して平均65.0℃(ピーク66.8℃)でした。
厚み67 mm(3.5スロット占有)のヒートシンクと、85 mm径トリプルファンを搭載しているだけあって、280 W前後の放熱を難なく処理できます。
騒音を10分テスト(動作音はうるさい?)
グラフィックボードから50 cm離れた位置にデジタル騒音メーターを置いて、「3DMark Speed Way」テスト中の騒音値を測定しました。
負荷がかかるとトリプルファンすべてが回り始め、37.5 dB前後まで上昇。その後テストが終わるまで「38.2 dB(やや静か)」前後に収まります。
騒音値(dBA) | 評価 | 目安 |
---|---|---|
30 ~ 32.49 | 極めて静か | 耳を近づければ聞こえるレベル |
32.5 ~ 34.9 | 静か | ファンが回っているのが分かる |
35 ~ 39.9 | やや静か | 扇風機を「小」で回したくらい |
40 ~ 42.49 | 普通 | エアコンよりは静かな音 |
42.5 ~ 44.99 | やや騒音 | エアコンの動作音に近い |
45 ~ 50 | 騒がしい | 扇風機を「中~大」で回した音 |
50 ~ | うるさい・・・ | 換気扇を全力で回した音 |
RTX 4070 Ti SUPERの動作音をステレオ録音しました。
3DMark Speed Wayなど、高負荷かつ低フレームレートだと、基本的にファンの「ブォーン」とした低周波が主な騒音です。
平均300 fps超えのハイフレームレートになると、個体コンデンサから高周波が鳴ります。
周波数成分が縞模様に。8000 ~ 10000 Hz帯に「コイル鳴き」と思われる周波数が乗っています。
原理的に、どのようなグラフィックボードでも(程度の差はあれど・・・)コイル鳴き自体は避けられないです。気になる方は垂直同期や可変リフレッシュレート(VRR)を使ったり、RivaTuner Statics Serverでフレームレートに上限を設定するといいでしょう。
まとめ:16 GB(256 bit)に増えたVRAMが魅力です
「RTX 4070 Ti SUPER」のデメリットと弱点
- 肝心のゲーム性能があまり伸びない
- 未だにDLSS 3.0対応ゲームが少ない
- 国内の販売価格が高い(約13万円)
- ゲーム性能のコスパに改善なし
「RTX 4070 Ti SUPER」のメリットと強み
- RTX 3090以上のゲーミング性能
- フルHDで240 fps超が可能
- WQHDで144 fps超が可能
- 4Kゲーミングも割と安定
- fpsをドカッと増やす「DLSS 3」
- ワットパフォーマンスが高い
- VRAM容量とバス幅が向上
- VRAM増量でAIイラストに強い
- 高画質で超高速な「AV1エンコード」
- NVEncエンコーダーを2基内蔵
- 安定した配信性能(コマ落ちが皆無)
- ケーブル1本でOK「12VHPWR」対応
- (一応)価格は据え置き・・・なお日本
VRAMに価値を感じない人にとって、値段が1~2万円ほど高いRTX 4070 Ti SUPERを選ぶメリットは限定的です。
今回のベンチマークで確認できた平均パフォーマンスの伸びはわずか5%程度、4Kですら9%程度にとどまります。ゲームタイトルによってはそもそも性能がまったく伸びません。
残念ながら価格差に見合う性能差を見込めないです。もっぱらゲーマーよりも、クリエイターに利益の多いグラフィックボードだと評価できます。
AIイラスト、動画編集、Unreal Engine 5など。VRAMをよく消費できる用途で、容量16 GB(256 bit幅)に強化されたVRAMが効果を発揮します。RTX 2070やRTX 3070を使っているなら、RTX 4070 Ti SUPERが乗り換え先に魅力的です。
国内販売価格が据え置きだったらもっと良い評価ができたのに・・・。NVIDIAの設定価格は799ドルで据え置き、日本に入った途端 +1~2万円も差額がついてしまって残念です。
差額がなければ無条件でRTX 4070 Ti SUPERで決まりです。しかし、現実にかなりの差額がある以上、自分の求める性能や用途に合わせてTiかTi SUPERどちらを選ぶかよく考える必要があります。
コスパ重視なら「RTX 4070 Ti」でいいです。動画編集やAIイラストが頭の片隅にあるなら「RTX 4070 Ti SUPER」でしょう。
以上「RTX 4070 Ti Superをベンチマーク:4070 Tiとどっちがいいか性能比較レビュー」でした。
RTX 4070 Ti SUPERを単品で買う
無難におすすめが「玄人志向(黒モデル)」です。国内最安クラスながら、標準3年保証がついてくるコストパフォーマンスが魅力的です。とりあえず迷ったら玄人志向でいい時代。
値段の安さだけで選ぶなら「Palit JetStream」が主な選択肢です。同じ価格帯のInno3Dが2連ファンに対して、Palitは3連ファンで冷却性能に優位性があります。
薄型モデルは「MSI GAMING X SLIM」がいい感じ。
白色モデルを買ったので、レビュー記事をアップしました。
RTX 4000搭載ゲーミングPC【解説】
RTX 40 SUPERのレビュー記事
グラフィックボードのレビュー記事
intelが「intel公式以上のPL2設定とアンペア設定を使うのはやめろ」という告知を始めましたけど、
ちもろぐさんのベンチ仕様ってどちら(無制限/公式)なんでしたっけ?
(本記事に関係ない話で草)
ぼくが使ってるASUS TUF Z690 PLUS WiFIの場合、発売当時のBIOSだとPower Limitは「無制限(4095 W)」で、その後のアプデで「253 W」に変更されてます
手持ちのRaptor Lakeシリーズはすべて、今日まで不具合なく正常に動作していますよ(もちろんマザボの保証を破壊する反り対策プレートも使ってません)
返信ありがとうございます
まとめがTiじゃないような?
すみません・・・4月に間に合わせたくてとりあえず投稿したので、今は修正済みです
いつもお疲れ様です。
VRAM16GBはかなり魅力的に思えます。5000シリーズがもっと高くなるという読みならこれでお茶濁しもありですね。
日本国内価格がアレなだけで
良心的と言ってもいい置き換え製品だね
せっかくパソコン買うなら良い奴買おうと思って4070tisuper買おうと思ってたけどゲームしかやらないなら4070superとかで良さそうっぽい?
ちょっと書くのが遅いし蛇足感もあるけれど
4070TiSをゲーム用として運用する場合はテレビに繋いで4Kゲーム機として使う、みたいなちょっと特殊な用途向けかと思います。ゲーム用パソコンとしてモニタを机に置いて使う場合は27インチが使いやすい最大サイズとなる場合が多いのでWQHD~FHDくらいで動くGPU、具体的には4070以下を選ぶのがオススメです。
またゲーム用パソコンとして運用するなら24インチFHD×2みたいな2画面構成もオススメです。メインモニタでゲームをやりつつサブモニタで攻略情報やDiscordあたりのチャット、YouTubeをダラダラ流したりするやり方ですね(配信をする場合はOBSをサブモニタに表示させるので必須)。この場合だとモニタ代金が2倍になりますが、GPUが4060か3060で十分だったりするのでトータルの支払額は4070のPCフルセットと同じくらいでまとまったりします。
まだ買うのは少し先で情報を集めていたところだったので色々と情報を知れて助かります
返信ありがとうございます。
そう思います。
4070がWQHDモニタで平均最低FPSが82なら十分でしょう。
4Kモニタで楽しみたいなら70TISが平均最低FPS60なのでこれ以上を買いたい所です。
AI画像もわざとVRAMを使う条件でテストしているみたいです。
現状、生成するだけならForgeを使えば不満が出るほどの差は無いと思います。
ですです
本記事のAIベンチはVRAMをたっぷり食わせてるので差が大きいですが、小さいサイズで生成したり、VRAMを節約するForge版なら16 GBの優位性は薄れます
個人的にForge版の生成結果が気に入らないのでA1111版を使ってますが、最初からForge版を使ってそちらに慣れてしまえば問題ないでしょう
お二人とも返信ありがとうございます
参考になりました。
VRAMの消費が多いラチェクラやRE4、ラスアスが無いのでなんとも言えませんが
VRC勢のためのグラボというのはほぼ確定に見えます
そのあたりの有名AAAタイトルは、商業誌に在籍するプロ(KTUさんやW1zarradさん)が積極的にやってくれるので、自分のブログでは意図的に避けてる事情があります。
・W1zarrad氏
https://bit.ly/3y1TGSs
・KTU氏
https://ascii.jp/archive/150/202405/
代わりにEscape from TarkovやVRChat、Genshin ImpactやDragon’s Dogma 2など、GPUベンチマークに不適切とされるタイトルをあえて採用するようにしてます。
有名AAAタイトルは~~~自分のブログでは意図的に避けてる~~~
ニッチなものを検証してくださるのは非常にありがたいですね。
自分も3080からの乗り換えの検討していましたがちょっと価格が予算オーバーなので見送りました。
Forge版の生成結果があまりよくないって話は聞くんですけどどうなんですかね?
今のところ自分は状況による派なので両方つかうのですが、A1111の方が良いなって場面が増えてくるのであればまたRTX 4070 Ti SUPERの再検討が始まるかもしれません。
生成AIのベンチはあるのですが、AIノイズ除去のベンチ探していたので有難うございました。
特にAMD系のグラボのベンチは無いに等しいのでありがたいです。
AIに弱いと思われているRadeon、最近は環境整備が進んだおかげで(値段の割に)行ける印象です。
言語生成はVulkan版、AIイラストはZULDA or ROCm版、ノイズ除去はPureRAWならNV or Radeonどちらも公平に使ってくれます(※AdobeだとGeForce贔屓がすごいですが・・・)。
足回りは4080並なのに、肝心のゲーム性能が4080とかなり差があるのは残念過ぎますね。
4080と比べるとかなりキャッシュ削られてるからね
CPUにおける3Dモデルと非3Dモデルくらい足まわりが違う
実際VRChatterの間では既にかなり人気のグラボになってますね
販売開始早々フレンドが何人か飛びついてましたし、4090には手が出せないけど4080はコスパが悪いし、4070TiじゃVRAM容量が3060と変わらない…と立ち往生してた層にぶっ刺さってます
MSI GAMING Xって「ブランド名に胡座をかいたボッタクリ」って言ってたじゃないですかー
この世代でまたまともになったんですかね?レビュー注目してます。
表かってのはその時のものの価値に左右されるから、客観的に見てコロコロ変わってるように見える状況って案外普通だったりすると思うよ
だから「この前は○○って言ってたのに、なんで今は××なの?」ってのはPCパーツの世界では愚問かと
情報のアップデートは常に必要だよ
表か→評価の間違いねw
4070tiの「でもVRAMが…」をきれいに消し去って精神衛生上良いけど、うまく使ってあげないと価格ほどの価値を引き出せない、マニア向けモデルの印象ですね。性能上これといった弱点が無いので将来の新モデル次第でスポットライトが当たるかもしれませんね?
AIイラストや動画編集以外にも、VRゲームもVRAMをよく食うので、VRゲーマーにも需要がありそうですね。
今の3070tiがお釈迦になったらこれかなぁと思っていたので
レビューありがとうございます 参考になります
ドス○ラでPalitの4070 ti super安かったんでポチりました
日銀が少々ドル売りしたところで円安止まらないしw
届いたのでeGPU BOXのAKiTiO Node Titanに突っ込んでみました
すっぽり収まってちゃんと動いてます (ミニPCに接続)
ゲームするにはフルパワーが活かせないけど生成AI目的なのでヨシ
3060(12GB)からのグレードアップですが価格が2倍以上の実感は
ありませんね ※個人のry
それにしてもPalitよ ソケットの保護カバーはおろか取付説明の紙1枚
付属させない潔よさ好きw
画像生成目的でpalitのやつ買いました 生成目的メインで4080買う金あるならをこっちに回して2TBのM.2SSDを買うなりしてstablediffusionのcheckpointの読み込みを爆速にする方をオススメします sdxl生成+androidエミュレータでのソシャゲ周回を同時に行う、とかコ○カツメイン+スタジオ+photoshopのなどの同時平行作業も快適に行えるのでVRAM16GBの恩恵は思ったより大きかったです
https://gazlog.jp/entry/nvidia-aib-cheap-out-thermal-paste/
サーマルペースト劣化するってよ
asusも
ひでえ…
かなり良さげな製品ですね。
あとは日本円だけが本当に問題、、、高すぎる。。