今年から新たに追加されたRTX 40 Superシリーズで、「RTX 4080 Super」がおそらく一番不人気です。
正直買いたくなかったけれど、買ってしまったので詳しくレビューします。先代のRTX 4080はもちろん、値段が近いRX 7900 XTXと比較してどうなのか? 性能を比較ベンチマークします。
(公開:2024/5/2 | 更新:2024/5/2)
「RTX 4080 SUPER」の仕様とスペック
GPU | RTX 4080 SUPER | RTX 4080 | RX 7900 XTX |
---|---|---|---|
プロセス | 5 nm製造 : TSMC | 5 nm製造 : TSMC | 5 nm + 6 nm製造 : TSMC |
シェーダー数CPUのコア数に相当 | 10240 | 9728 | 6144NV換算:12288 |
RTコア数レイトレ用の特化コア | 80 | 76 | 96 |
ブーストクロック | 2550 MHz | 2505 MHz | 2498 MHz |
VRAM | GDDR6X 16 GB | GDDR6X 16 GB | GDDR6 24 GB |
理論性能(FP32) | 52.22 TFLOPS | 48.74 TFLOPS | 61.39 TFLOPS |
PCIe | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 |
TDP | 320 W | 320 W | 355 W |
補助電源 | 16-pin | 16-pin | 8 + 8 pin |
MSRP | $ 999 | $ 1199 | $ 999 |
参考価格2024/05時点 | 168800 円 | 172800 円 | 156000 円 |
発売価格 | 162800 円 | 219800 円 | 179800 円 |
発売 | 2024/1/31 | 2022/11/16 | 2022/12/16 |
GPU | RTX 4080 SUPER | RTX 4080 | RX 7900 XTX |
---|---|---|---|
世代 | Ada Lovelace | Ada Lovelace | RDNA 3.0 |
プロセス | 5 nm製造 : TSMC | 5 nm製造 : TSMC | 5 nm + 6 nm製造 : TSMC |
トランジスタ数 | 459.0 億 | 459.0 億 | 577.0 億 |
ダイサイズ | 379 mm2 | 379 mm2 | 529 mm2 |
シェーダー数CPUのコア数に相当 | 10240 | 9728 | 6144 |
TMU数Texture Mapping Unitのこと | 320 | 304 | 384 |
ROP数Render Output Unitのこと | 112 | 112 | 192 |
演算ユニット数 | 80 | 76 | 96 |
Tensorコア数機械学習向けの特化コア | 320 | 304 | 0 |
RTコア数レイトレ用の特化コア | 80 | 76 | 96 |
L1キャッシュ演算ユニットあたり | 128 KB | 128 KB | 256 KB |
L2キャッシュコア全体で共有 | 64.0 MB | 64.0 MB | 6.0 MB |
L3キャッシュコア全体で共有 | – | – | 96 |
クロック周波数 | 2295 MHz | 2205 MHz | 1929 MHz |
ブーストクロック | 2550 MHz | 2505 MHz | 2498 MHz |
VRAM | GDDR6X 16 GB | GDDR6X 16 GB | GDDR6 24 GB |
VRAMバス | 256 bit | 256 bit | 384 bit |
VRAM帯域幅 | 736.3 GB/s | 716.8 GB/s | 960.0 GB/s |
理論性能(FP32) | 52.22 TFLOPS | 48.74 TFLOPS | 61.39 TFLOPS |
SLI対応 | – | – | – |
PCIe | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 |
TDP | 320 W | 320 W | 355 W |
補助電源 | 16-pin | 16-pin | 8 + 8 pin |
MSRP | $ 999 | $ 1199 | $ 999 |
参考価格2024/05時点 | 168800 円 | 172800 円 | 156000 円 |
発売価格 | 162800 円 | 219800 円 | 179800 円 |
発売 | 2024/1/31 | 2022/11/16 | 2022/12/16 |
「RTX 4080 SUPER」は、従来モデルのRTX 4080と同じくAD103チップをそのまま続投し、ほんの少しだけスペックアップしただけです。
- シェーダー数が5%増加(9728 → 10240シェーダー)
- VRAM容量そのまま(16 → 16 GB)
- VRAMバス幅も変わらず(256 → 256 bit)
- 消費電力は据え置き(320 Wのまま)
- 価格設定を値下げ(1199 → 999ドル)
このままだと競争力に欠けると判断したのか、価格設定を200ドル引き下げて999ドルに。
1000ドル前後のライバル製品が「RX 7900 XTX」です。日本国内価格だとRX 7900 XTXの方が約1万円も安くて、VRAM容量も1.5倍(24 GB)でお得です。
RTX 4080(無印)と比較して良いのは当然なので、値段が近いRX 7900 XTXと比較してどれくらい優位性があるかに注目すると興味深いでしょう。
RTX 4080 SUPERの性能をベンチマーク比較
テスト環境 「ちもろぐ専用ベンチ機(2024)」 | ||
---|---|---|
CPU | Core i9 13900K24コア32スレッド | |
CPUクーラー | NZXT Kraken X63280 mm簡易水冷クーラー | |
マザーボード | ASUS TUF GAMINGZ690-PLUS WIFI | |
メモリ | DDR5-4800 16GB x2使用メモリ「Crucial Native DDR5」 | |
グラフィックボード | ZOTAC GAMING RTX 4080 SUPER Trinity Black Edition | |
SSD | NVMe 4TB使用SSD「Hanye HE80」 | |
電源ユニット | 850 W(80+ Platnium)使用モデル「Corsair HX850i」 | |
OS | Windows 11 Pro検証時のバージョンは「22H2」 | |
ドライバ | NVIDIA 551.86 | |
ディスプレイ | 3840 x 2160@144 Hz使用モデル「INNOCN 32M2V」 |
「RTX 4080 SUPER」を比較するために用意した専用PCスペックです。
CPUにゲーミング性能でトップクラスの「Core i9 13900K」を使います。メモリは普通のDDR5-4800(ネイティブ)で容量32 GBで、テスト時のドライバは「551.86」です。
ベンチマーク用の莫大な数のゲームソフトやAIモデルを置いておくストレージは、容量4 TBのNVMe SSD(Hanye HE80)を使います。
今回のベンチマーク用に購入したRTX 4080 SUPERがこちら、ZOTAC GAMING製「RTX 4080 SUPER Trinity Black Edition」です。
PCIe 8 pin x3 → 12VHPWR端子に変換するコネクタが付属します。
12VHPWR非対応の標準的な電源ユニットをそのまま使える仕様です。たとえば、筆者やかもちは「Corsair HX850i(2021)」でRTX 4080 SUPERをトラブルなく、至って正常に運用できています。
ケーブル1本で配線をスッキリ仕上げたい場合は、電源ユニットの純正変換コネクタを使えば大丈夫。
VGAサポートステイ(支え棒)が付属します。長期間の使用によるバックプレートの歪みを防止する効果に期待できます。
90 mm径トリプルファンを搭載する外排気設計を採用。厚み59 mm、およそ2.5スロットを占有するハイエンドモデルの割にスリムなデザインです。
金属製のバックプレートを搭載します。裏基板のコンポーネントを保護するほか、バックプレートとコンデンサの間にサーマルパッドを挟んで、背面から放熱を促す設計です。
2ブロックのヒートシンクを搭載。合計7本の6 mm径ヒートパイプで接続され、90 mm径トリプルファンを回して周囲に熱を逃がします。
I/Oインターフェイス側のヒートシンクはGPUダイ本体だけでなく、受熱ベースプレートの間にサーマルパッドを挟んでVRM回路やVRAM(ビデオメモリ)をついでに冷却する設計です。
ボード全長307 mm、横幅119 mm、厚み59 mmとTDP:300 W級グラフィックボードとしてスリムな部類です。RTX 4090と並べて見れば、そのコンパクトさが一目瞭然です。
- Display Port 1.4a
- Display Port 1.4a
- Display Port 1.4a
- HDMI 2.1
全部で4つの映像出力端子を備えます。HDMI 2.1とDisplay Port 1.4aどちらも、4Kで160 Hzまで動作確認が取れています。
Display Port 1.4a(DSC有効時)で、おそらく4Kで240 Hzまで可能です。
参考までに、購入時の価格は実質148000円でした。
高額なグラフィックボードです。いつもどおり、ポイント還元が美味しい「Joshin Web(Yahooショッピング店)」にて、20%のポイント還元を使って実質14.8万円で購入しました。
Amazonで買ってもせいぜい3~4%のポイントしかつかないですし、10万円超のお高いグラフィックボードを買うならYahooショッピングを強くおすすめします。
筆者やかもちは還元されたPayPayポイントを、ふだんの食費に充てたり、マザーボードやM.2 SSDなどPCパーツの購入に使っています。PayPayに対応している店が多いので現金やクレジットカードに近い感覚で使えて便利です。
ベンチマーク内容の大部分を更新したので、過去のレビュー記事と(直接的に)比較できません。よって、比較ベンチマークデータから数多くのグラフィックボードが姿を消します。
更新後もほぼ差異が生じなかった項目については、過去のデータをそのまま比較グラフに掲載します。
あと、今回の記事から掲載するグラフを高解像度化(Stable Diffusion:R-ESRGAN 4x+)した影響で、縦線がところどころ薄いです。頭の中で勝手に補完して見てくれると幸いです。
Apex Legends
(※クリックで比較グラフ拡大)
Apex Legendsを最高設定で比較したグラフです。
RTX 4080 SUPERは当然ながら、RTX 4080(無印)とほとんど変わらない性能です。同じ価格帯のRX 7900 XTXはすべての解像度でRTX 4080 SUPERをあっさりと打ち負かします。
Apex Legendsをガチでプレイする前提なら、RX 7900 XTXを選ぶのが賢明です。
Escape from Tarkov(タルコフ)
(※クリックで比較グラフ拡大)
Escape from Tarkov(タルコフ)で、フレームレートが出づらいと有名な「Streets of Tarkov」で比較したグラフです。
設定はタルコフYoutuber「らっしーRushy_ve」さんを参考に、SSRをオフにしたり、Reflex Low Latencyをboost onにするなど、やや高画質な競技設定(→ 設定画面はこちら)を使用しました。
RTX 4080 SUPERはRTX 4080(無印)とほぼ同等の性能。RX 7900 XTXも大差なし。どれを選んでも性能差が小さいうえ、タルコフはCPUボトルネックが出やすいため、CPUにお金を掛けたほうがコスパが良いです。
※タルコフは他のプレイヤーやBOTがいるとCPUボトルネックが顕著に発生してしまい、フレームレートが伸びづらくなる傾向が強いです。シチュエーションによっては平均100 fpsすら難しい場合もあり。
Fortnite(フォートナイト)
(※クリックで比較グラフ拡大)
フォートナイトを最高設定(NANITE:無効)で比較したグラフです。
マップ「TILTED TOWERS」にて、複数のBOTと撃ち合いしたり建築物をミサイルで破壊しながら測定します。
RTX 4080 SUPERとRTX 4080(無印)の性能は同じです。RX 7900 XTXが若干振るわない性能に・・・。
Call of Duty:Modern Warfare 3
(※クリックで比較グラフ拡大)
コールオブデューティ:モダン・ウォーフェア3を、極限プリセット設定(解像度100%)で比較したグラフです。
本タイトルはRadeon RX 7000シリーズが猛威をふるいます。RTX 4080 SUPERがRTX 4080(無印)に対して微増で、RX 7900 XTXは完膚なきまでにRTX 4080 SUPERを叩きのめす脅威的な性能を見せます。
Overwatch 2(オーバーウォッチ)
(※クリックで比較グラフ拡大)
オーバーウォッチ2をエピック設定(解像度100%)で比較したグラフです。
思った以上にRTX 4080 SUPERが伸びます。フルHDでRX 7900 XTX超え、しかしWQHDと4KゲーミングだとRX 7900 XTXに勝てません。
R6S(レインボーシックスシージ)
(※クリックで比較グラフ拡大)
レインボーシックスシージを最高設定(レンダリング解像度:100%)で、付属のベンチマークモードを使って比較したグラフです。
オーバーウォッチ2と同じ傾向があり、VRAMの帯域幅がけっこう効く印象です。フルHDならRTX 4080 SUPERが優位で、WQHD以上になった途端RX 7900 XTXが逆転します。
Baldur’s Gate 3(バルダーズゲート)
(※クリックで比較グラフ拡大)
バルダーズゲート3をウルトラ設定で、グラフィックボードに負荷がかかりやすい「リズン街道」にてベンチマーク。
フルHDはゲーム側の仕様で頭打ちの傾向が見られますが、WQHD~4KゲーミングでRTX 4080 SUPERがおおむね高性能です。RX 7900 XTXも遅れてます。
Cyberpunk 2077
(※クリックで比較グラフ拡大)
重量級ベンチマークの代表例「サイバーパンク2077」をウルトラ設定(レイトレなし)で比較したグラフです。
RTX 4080 SUPERとRTX 4080(無印)がほとんど同じ性能。RX 7900 XTXはRTX 4080 SUPERを明確に上回り、RTX 4090に迫る性能(4Kゲーミング除く)です。
ドラゴンズドグマ2
(※クリックで比較グラフ拡大)
カプコンが開発した大ヒットタイトル「ドラゴンズドグマ2」を、最高設定(レイトレ:オフ)でベンチマーク。
マップはフィールド「アレス山麓」を採用。NPCが多い都市部(ヴェルンワース)だと極端なCPUボトルネックが発生してまったく比較にならなかったので、フィールドを採用します。
実際のゲームプレイでも都市部にいる時間は少なく、たいていバグバタルなどフィールドエリアにいる時間が長かったです。
ベンチマークの結果、解像度が上がるほどVRAM帯域幅が効いてくる傾向です。全体的にRadeonの方がCPUボトルネックに強い傾向が見られ、フルHDとWQHDでRX 7900 XTXが最高の性能、4KゲーミングでRTX 4080 SUPER以上の性能です。
エルデンリング
(※クリックで比較グラフ拡大)
エルデンリングを最高設定(レイトレ:オフ)で、ロケ地「ケイリッド地方」で比較したグラフです。
フルHDはゲーム側の仕様で頭打ち気味※ですが、WQHD~4Kゲーミングで性能差がなんとなく見えてきます。フルHD~4Kゲーミングまで、RTX 4080 SUPERとRX 7900 XTXが横並びの性能です。
※場所によってフレームレートの変動が激しいゲームです。ケイリッド地方で最大180 fps前後、魔術学院レアルカリアだと200 fps前後(ただしスタッター頻発)まで伸びる一方、リムグレイブ(初期エリア)や王都ローデイルはせいぜい120 fpsにとどまります。
モンハンワールド:アイスボーン
(※クリックで比較グラフ拡大)
全世界で2000万本超え、今もなお売れ続けている国産オープンワールドRPG「モンハンワールド:アイスボーン」を最高設定 + HiRes Texture Pack適用でベンチマーク。
ロケ地はあえて「古代樹の森」を採用。アイスボーンの「渡りの凍て地」まで進めたものの、結局「古代樹の森」が一番負荷が重たかったです。
RTX 4080 SUPERは、すべての解像度でRTX 4080(無印)より高性能です。フルHDのみ、RX 7900 XTXがやや優位です。
ARK:Survival Ascended(ASA)
(※クリックで比較グラフ拡大)
恐竜サバイバルゲームの最新作「ASA」を、最高設定ではなく「高設定」でベンチマーク。最高設定だとあまりにも重すぎて比較に使えなかったので、あえて一段低い「高設定」を使います。
それでもフレームレートが非常に伸びづらく、RTX 4080 SUPERですら平均60 fpsに達しないです。RTX 4080(無印)との性能差も限定的です。
基本的に「フレーム生成(Frame Generation)」ありきのゲームだと思われます。後ほど、アップスケーリング編で追加検証します。
PalWorld(パルワールド)
(※クリックで比較グラフ拡大)
国産サバイバルゲームの傑作「パルワールド」を最高設定でベンチマーク。
グラフィックボードに負荷がかかりやすい「花兎山山頂」にて、サラブレイズ(馬)で疾走しながら測定します。なお、初回ロード時のみスタッターが頻発するので、いったんコースを走ってから測定しました。
ベンチマークの結果、フルHDはゲーム側の仕様で頭打ちに。WQHDでかなりの性能差がなぜか出て、4Kゲーミングで同等の性能に戻ります。
Cities:Skylines II(シティスカ2)
(※クリックで比較グラフ拡大)
都市運営シミュレーション「Cities:Skylines II」を、最高設定(スケーリング:無効)でベンチマーク。
RTX 4080 SUPERはやはりRTX 4080(無印)から微増にとどまり、すべての解像度でライバルのRX 7900 XTXに敗北を喫する結果に。
Forza Horizon 5
(※クリックで比較グラフ拡大)
Forza Horizon 5を最高設定(MSAA x8 / レイトレなし)で比較したグラフです。
付属のベンチマークを使っているため、性能差がきれいに反映されます。Forza Horizon 5はRTX 4000シリーズやRadeon(RDNA)シリーズが得意な傾向です。
RTX 4080 SUPERはおおむねRTX 4080(無印)と変わらない性能にとどまり、ライバルのRX 7900 XTXにすべての解像度で負けます。
FF14:黄金のレガシー
(※クリックで比較グラフ拡大)
Final Fantasy 14:黄金のレガシーを公式ベンチマークで比較。最初から設定されている最高設定(FSRモード)を使います。
CPUボトルネックの影響でフルHDは全体的に頭打ちの傾向が見られ、WQHD~4Kゲーミングで性能差が確認できます。RTX 4080 SUPER / RTX 4080 / RX 7900 XTXの3つが横並びです。
原神(Genshin Impact)
(※クリックで比較グラフ拡大)
原神を最高設定(精度:1.5 / シーン細部:最高 / 異方性:x16)で比較したグラフです。
フルHDはCPUボトルネックで頭打ちの傾向、WQHDで微妙な性能差が出ますがゲーム側の変動だと思われ、4K解像度でようやく性能差が出てきます。
RTX 4080 SUPERとRTX 4080(無印)に性能差がなく、RX 7900 XTXは4KゲーミングでRTX 4080 SUPER以上の性能です。
マインクラフト:BE版
(※クリックで比較グラフ拡大)
マインクラフトBE版にVanilla RTXシェーダーを適用して、レイトレーシング描画距離を24チャンクに設定してベンチマーク。マップは筆者がクリエイティブモードで作成した水中マップを使います。
水中だからVanilla RTXシェーダーが劇的に効いて凄まじい映像美を発揮するかわりに、グラフィックボードにマイクラと思えない強烈な負荷を与えられます。
RTX 4080 SUPERは、RTX 4080(無印)に対してちょっとだけ高性能です。一方、RX 7900 XTXはまったく性能を出せません。設計段階でレイトレーシングに対する優位性がないため、Vanilla RTXシェーダーを使うとフレームレートが一気に伸びなくなります。
レイトレーシング処理の遅さはRX 7000シリーズの大きな弱点です。
VRChat
(※クリックで比較グラフ拡大)
VRゲームの代表例でありながら、ベンチマークをほとんど見かけないVRChatを比較したグラフです。
グラフィック設定をUltra設定(異方性 x8)に、フレームレート上限を解除して、「Yayoi Forest House(作:猫屋敷やよい さん)」のプライベートモードで測定しました。
VRChatは単純なグラフィック性能だけでなく、VRAMのバス幅も重要です。
RTX 4080 SUPERはシェーダー数の増量やVRAM帯域幅の向上により、4K解像度で思った以上の性能アップが見られます。しかし、384 bitのバス幅を持つRX 7900 XTXに一歩及ばないです。
VRChatをプレイする分には、RX 7900 XTXがかなりの穴場かもしれません。VRAM容量が24 GB(RTX 4090と同容量)もあり、同時にプレイする人数が多くてもフレームレートが下がりづらいです。
19ゲームの平均フレームレート
(※クリックで比較グラフ拡大)
テストしたゲームの平均フレームレートをまとめました(※注意:平均はしょせん平均なので参考にしすぎないように)。
今回テストした内容だと、RTX 4080 SUPERはRTX 4080(無印)に対してフルHDで約3%、WQHDで約3.4%、4K解像度で約2.5%高い性能でした。
同じ価格帯のライバルRX 7900 XTXに対して、フルHDでほぼ同等、WQHDで約4%、4K解像度で約3%低い性能です。レイトレーシングを含まなければ、RTX 4080 SUPERとRX 7900 XTXの性能差はさらに開きます。
(※クリックで比較グラフ拡大)
RTX 4080 SUPERを基準点として、相対パフォーマンスも計算してみた。
相対値で見ると面白い結果が分かります。RTX 3000シリーズは4Kになるほど性能が下がりづらく、RTX 4000やRX 7000シリーズは4Kになるほど性能差が下がります。
RTX 4080 SUPERは、RTX 4080(無印)と基本的に同じ性能と考えていいです。価格設定が200ドル引き下げられたため、単純なコストパフォーマンスは確実に改善されています。
アップスケーリング機能を比較ベンチマーク
最近のグラフィックボードはアップスケーリング技術を活用した、フレームレート底上げ機能に対応しています。
- NVIDIA GeForce:DLSS(Deep Learning Super Sampling)
- AMD Radeon:FSR(FidelityFX Super Resolution)
- Intel ARC:XeSS(Xe Super Sampling)
たとえば、GeForce RTXシリーズなら「NVIDIA DLSS」、AMD Radeonシリーズなら「AMD FSR」を対応するゲームで使えます。
DLSSまたはFSRに対応しているゲーム3本を使って、アップスケーリング有効時の性能を比較ベンチマークします。
(※クリックで比較グラフ拡大)
重たすぎてまともに動作しない「ARK:ASA(4K解像度)」でしたが、DLSS 3(フレーム生成)を使うとギリギリ平均60 fpsに届きそうです。
(※クリックで比較グラフ拡大)
サイバーパンク2077(レイトレ:ウルトラ品質)もそのまま動かすと非常に重たいですが、DLSS 2(FSR 2)の適用でかなりマシになります。
DLSS 3(フレーム生成)で平均60 fpsをかんたんに超え、平均100 fps近い快適な4Kゲーミングが可能です。ちなみに、FSR 3(フレーム生成)はゲーム側が対応してないです。
AMDは知名度の高いゲームタイトルにお金を積んで、FSR 3(フレーム生成)を実装させるべきです。
(※クリックで比較グラフ拡大)
4K解像度が意外と重たいタルコフも、DLSS 2(FSR 2)を適用すれば、4Kで平均100 fps超えの快適な動作に仕上がります。
ただし、同じバランスモードでもDLSS 2の方が画質がいいです。FSR 2で同様の画質を得るにはクオリティーモード以上が必要になりますが、品質を上げるとフレームレートも下がってしまいます。
主観的に見て同じ画質であれば、(今のところ)DLSS 2.xが高フレームレートです。
- フルHDでいったんレンダリング
- 機械学習を使って4Kにアップスケーリング
- 実質4Kのフレームが完成します
4K解像度のレンダリングは非常に重たい作業ですが、DLSSを使えばフルHDやWQHD相当のレンダリングで済ませられるので、フレームレートを稼ぎやすくなります。
ちなみに、どの程度の解像度でレンダリングするかどうかはゲーム側の設定で調整できます。
- 高画質な設定(クオリティー):WQHD相当
- 標準的な設定(バランス):フルHD相当
- 性能重視(パフォーマンス):HD相当
ゲームによって差があるものの、おおむね上記のようなイメージで合ってます。
なお、あくまでもフルHDやWQHD相当の解像度でレンダリングするだけなので、「CPUボトルネック(→ 解説)」に対して無力です。CPUボトルネックが出やすいゲームだと、DLSS:バランスを使ってもフレームレートがまったく伸びない場合も多いです。
DLSS 3(FSR 3)は、1枚目と3枚目の中間フレームをAI機能でイメージして補完する機能です。単純にフレームレートが2倍になり、入力遅延も2倍に跳ね上がります。
存在しないフレームをグラフィックボード側で生成して挿入する性質上、「CPUボトルネック」に対しても一定の有効性があります。理論値で50%までCPUボトルネックの影響をカットできます。
ただし、フレームを挿入する分だけ入力遅延が増加します。入力遅延の増加は競技性が問われるFPS / TPSゲームで不利です。もっぱらMMORPGやソロプレイゲーム向けです。
定番ベンチマークの比較グラフ
役に立つか分かりませんが、一応3DMarkとVRMarkのスコアを掲載します。
SNS(Twitter X)でフォロワーに「このくらいの位置づけらしいよ?」と、ダイジェスト的に軽く紹介する分には便利かもしれません。
(※クリックで比較グラフ拡大)
軽い負荷がかかる「3DMark Fire Strike」の比較です。
やや重たい負荷がかかる「3DMark Time Spy」の比較です。
かなり重たい負荷がかかる「3DMark Speed Way」の比較です。レイトレーシング非対応のグラフィックボードだと動作しません。
かなり重たい負荷がかかる「3DMark Port Royale」の比較です。レイトレーシング非対応のグラフィックボードだと動作しません。
(※クリックで比較グラフ拡大)
レンダリング解像度:2264×1348で動作する、負荷の軽い「VRMark Orange Room」の平均フレームレートです。400 fps前後で頭打ちです。
DirectX12向けの「VRMark Cyan Room」の平均フレームレートです。500 fps前後で頭打ちです。
非常に重たい負荷がかかる「VRMark Blue Room」の平均フレームレートです。なんと5120×2880(5K解像度)でレンダリングされてます。
VRChatにかなり近似した結果を出せますが、Blue RoomはVRAMのバス幅をそれほど考慮しないため鵜呑みにしないように。
RTX 4080 SUPERのクリエイティブ性能を比較
GPU | RTX 4080 SUPER | RTX 4080 | RX 7900 XTX |
---|---|---|---|
シェーダー数CPUのコア数に相当 | 10240 | 9728 | 6144 |
ブーストクロック | 2550 MHz | 2505 MHz | 2498 MHz |
VRAM | GDDR6X 16 GB | GDDR6X 16 GB | GDDR6 24 GB |
理論性能(FP32) | 52.22 TFLOPS | 48.74 TFLOPS | 61.39 TFLOPS |
グラフィックボードのクリエイティブ性能は基本的に、シェーダー数とクロック数から計算できる理論性能(FP32)に比例して高くなる傾向があります。
RTX 4080 SUPERの理論性能が約52テラフロップス、RTX 4080(無印)が約49テラフロップスで約7%の性能アップを期待できます。
RX 7900 XTXの理論性能はなんと約61テラフロップスもあり、RTX 4080 SUPER以上のクリエイティブ性能を見せられそうですが・・・、実際にいくつか試して確認しましょう。
GPUレンダリング(Blender)
(※クリックで比較グラフ拡大)
GPUレンダリングの定番ベンチマーク「Blender 4.1.0」では、わずか3%の伸びにとどまります。
RX 7900 XTXならRTX 4080 SUPERを超えられるかと思いきや、残念ながら「CUDA」でBlenderを動かせないため、RTX 4060 Ti相当の性能しか出せません。AMD Radeonは「HIP」でBlenderを処理しています。
AIイラスト(Stable Diffusion XL)
(Kamisato Ayaka SDXL Becnhmark)
AIイラストの定番ソフト「Stable Diffusion XL(AUTOMATIC1111版)」を使って、AIイラストの生成時間を比較します。
- モデル:Pony Diffusion V6 XL
- LoRA:全部で4つ(Detail Tweaker XLなど)
- 解像度:896 x 1152
- サンプラー:DPM++ 2M Karras
- ステップ:25
- Hires.Fix:1.25倍
- Hires.Fixステップ:12
個人的によく使っている手順です。SDXLの推奨サイズでいったん書き出したあと、Hires.Fixで少しだけアップスケールして好みの絵柄に仕上げます。
(※クリックで比較グラフ拡大)
グラフィックボードの処理性能をゴリゴリと贅沢に使ってくれます。
どちらも20 GBのVRAM容量があり、理論性能の差だけが反映されている様子です。RX 7900 XTXはCUDA互換の「ZLUDA」を使ってStable Diffusionを動かしていますが、それでもRTX 4070 Ti SUPER相当が今の限界です。
一応、これでもDirectML版と比較して格段に速くなっています。さらに性能を追求するならUbuntu(Linux)からROCm版を使ってみてください。RTX 4080と同じ処理速度になるはずです。
ピーク時に約20 GBもVRAMを消費するため、VRAMが20 GB以下のグラフィックボードは「–medvram-sdxl」オプションを付けてテストしました。AMD Radeonは「ZLUDA版」を使っています。
生成パターン別の処理時間は以下のまとめ記事を確認してください。
言語生成AI(ローカルChatGPT)
Windows 12からCPUにAI処理性能(40 TOPS以上)が求められるなど、一般的なローカル環境でもAI処理性能が要求される時代が到来します。
代表例が「言語生成AI」です。ローカル環境で動作するLLM(大規模言語モデル)を使って、1秒あたりの平均トークン生成数を比較します。
(※クリックで比較グラフ拡大)
RTX 4080 SUPERは、RTX 4080より約2.4%速いスピードで返答します。ほとんど誤差といっていい性能差です。
RAW写真のAIノイズ除去(DxO PureRAW 4)
写真現像ソフト「DxO PureRAW 4」を使って、暗い環境で撮影したノイズだらけのRAW写真からノイズを取り除きます。
「DeepPRIME XD2」によるAI処理で、3枚の写真からノイズを消すのにかかった時間をテストします。
(※クリックで比較グラフ拡大)
RTX 4080 SUPERは9.51秒(1枚あたり約3.2秒)でした。RTX 4080より約3%速いです。
(※ノイズ除去する前のRAW写真)
(※DeepPRIME XD2でノイズ除去)
4K動画編集(PremiereとDavinci)
Puget Systemsのベンチマークプリセットを使って、動画編集の定番ソフト「Adobe Premiere Pro」と「Davinci Resolve Studio」のGPU性能をテストします。
テストに使用される動画素材は基本的に4K解像度以上で、割りと負荷の重たいワークロードです。
(※クリックで比較グラフ拡大)
Premiere ProベンチマークのGPUスコアは「118.6点」で、RTX 4080から約3%の性能アップです。ただしVRAM容量の差があり、RX 7900 XTXには勝てません。
Davinci Resolve StudioのGPUエフェクト性能は「189点」で、RTX 4080から約4%の性能アップ。解像度の大きい動作素材を食わせるテストなので、VRAM容量が多いと有利です。
よってVRAM容量24 GB(384 bit幅)を備えるRX 7900 XTXには、やはり勝てません。
動画エンコード(NVEncなど)
世代 | RTX 4080 SUPER (Ada Lovelace世代) | RTX 3080 (Ampere世代) |
---|---|---|
NVEncエンコーダー | 第8世代(2基) | 第7世代 |
NVEncデコーダー | 第5世代 | 第5世代 |
AV1エンコード | 対応 | – |
AV1デコード | 対応 | 対応 |
RTX 4080 SUPERに内蔵されている第8世代NVEncデュアルエンコーダーを検証します。
rigayaさん作のAviutl拡張プラグイン「NVEnc 7.50」を使って、動画エンコードの処理速度(平均fps)と品質スコア(VMAF Score)を調べます。
テスト内容は1分30秒ほどのゲームプレイ録画(動きの激しい原神プレイ動画)を、VBR形式(Bフレーム挿入あり)でエンコードするだけです。
2基のNVEncを使ったデュアルエンコードの効果が大きいです。AV1エンコードで約1.67倍、HEVCエンコードで約1.72倍に高速化されます。
RX 7900 XTX(VCEEnc)と比較して、AV1エンコードで2倍以上の差です。ただし、HEVCエンコードとH.264エンコードはRX 7900 XTXの方が速いです。
エンコード品質(VMAFスコア)も高いです。
RTX 4080 SUPER(NVEncデュアルエンコーダー)は処理速度の割にエンコード品質が高く、RX 7900 XTX(VCEEnc)は処理速度が速いと相応にエンコード品質を落とす傾向が見られます。
WQHD(2560×1440 / 16000 kbps)と4K(3840×2160 / 32000 kbps)のエンコード比較です。
同じNVEncエンコーダーを積んでいるので、RTX 4080 SUPERとRTX 4080に性能差はありません。RX 7900 XTXはAV1エンコードだけ遅く、HEVCとH.264ならRTX 4080 SUPERより速いです。
ゲーム開発(Unreal Engine 5)
無料で使えるゲーム開発ソフト「Unreal Engine 5.3」のプレビュー性能をテストします。
無料で配布されている「City Sample(The Matrix Awakens)」から「Small_City_LVL」を読み込み、既定のルートを1周してフレームレートを測定します。
「Big_City_LVL」だとメインメモリ容量が不足して動作が不安定だったため、メモリ容量32 GBでもなんとか動作するSmall版をテストしました。
(※クリックで比較グラフ拡大)
特に目立った性能差がないです。古いバージョンのUnreal Engineなら分かりやすく性能差が出ると思いますが、最新のUE5ではVRAMの消費量がかなり減っていて性能差が少ないです。
もっと大きなプロジェクトを読み込むと性能差が出るかもしれません。基本的にUnreal Engine 5を使った開発において、VRAM容量は多いほど有利です。
ゲーム実況配信(OBS Studio)
定番のゲーム配信ソフト「OBS Studio」を使って、レインボーシックスシージ(フルHD / 最高画質)を録画配信します。
- H.264(6000 kbps):60 fpsに制限して録画配信
- H.264(6000 kbps):360 fpsに制限して録画配信
- AV1(6000 kbps):60 fpsに制限して録画配信
- AV1(6000 kbps):360 fpsに制限して録画配信
Youtubeなら6000 kbps以上のビットレートに対応しますが、もうひとつの定番サイトTwitchが6000 kbps上限です。Twitchも想定して、あえて6000 kbpsに設定します。
配信時の画面サイズは圧倒的主流のフルHD(1920×1080)で、配信時の画面フレームレートは「60 fps」と「360 fps」の2パターンです。
Apex Legendsやレインボーシックスシージなど、競技性が求められるゲームでゲーミングモニターの使用を考えているなら、「360 fps」時の配信性能が重要です。
H.264エンコードで録画と配信を同時にすると、平均フレームレート1割下がります。
RTX 4080 SUPERは性能にかなり余裕があるので、360 fps制限時のフレームレートが下がりづらいです。GPU使用率もRTX 4080(無印)より緩和され、結果的に最低フレームレート(1%)の安定性に大きな性能差も。
配信中のコマ落ち(ドロップフレーム)も問題なし。
最新世代のNVEncはAV1エンコードが得意です。エンコード負荷が下がり、最低フレームレート(1%)の安定性が向上します。
エンコード負荷が下がるため、当然コマ落ち(ドロップフレーム)も発生しなかったです。
RTX 4080 SUPERの消費電力を比較
電力ロガー機能のついた電源ユニットを2台使って、CPUとマザーボードに電力供給を分割します。
テスト環境 | ||
---|---|---|
電源ユニット #1システム全体 | 850 W(80+ Platnium)使用モデル「Corsair HX850i」 | |
電源ユニット #2CPUや水冷クーラーなど | 850 W(80+ Gold)使用モデル「Toughpower iRGB PLUS」 |
システム全体を担当する電源ユニットから、+12Vレールの消費電力を見るとグラフィックボード単体の消費電力とほぼ一致します。
上記の接続方法だと、+12Vレールは基本的にグラフィックボード(6+2 pinとPCIeスロット)で使用されるため、CPUを取り除いておけば自ずとグラフィックボード単品の消費電力を抽出可能です。
ただし、電源ユニットの電力ロガーセンサーは刻み値が粗いです。変動幅が小さくなりがちな、低負荷時(低設定のフルHDなど)の精度はやや悪いです。
GPU単体の測定値を見るのではなく、他と比較して相対的に見るべきです。
誤:Aは平均200 Wらしい- 正:AはBと比較して50 W少ないらしい
これくらいのニュアンスでデータを見てくれると助かります。
特定のゲームをプレイ中の消費電力ではなく、テストした19個のゲームタイトルから平均消費電力を求めます。
(※クリックで比較グラフ拡大)
RTX 4080 SUPERの消費電力です。フルHDで平均209 W、WQHDで平均278 W、4Kで平均301 Wでした。GPU使用率の高いゲームなら320 W前後まで上昇します。
メーカー公称値のTDPはどちらも320 Wなのに、RTX 4080 SUPERの方が少し多めに電力を消費するようです。
消費電力10ワットあたりの平均フレームレートを計算したグラフです。
RTX 4080 SUPERとRTX 4080のワットパフォーマンスに目立った差はないです。しかし、ライバルのRX 7900 XTXはRTX 4080 SUPERに一歩劣ってしまいます。
MCM(マルチチップモジュール)方式を使った影響でしょうか、RTX 4000シリーズと同じTSMC 5 nmプロセスを使った割にワットパフォーマンスに優れません。
高負荷時のGPU温度は?
GPU使用率が100%に達する「3DMark Speed Way」を10分連続で動かして、RTX 4080 SUPER(ZOTAC GAMING)のGPUコア温度を測定したグラフです(※テスト時の気温は27℃前後)。
エリア | 平均値 | ピーク値 |
---|---|---|
コア温度 | 69.3℃ | 71.1℃ |
VRAM温度 | 77.0℃ | 80.0℃ |
ホットスポット | 79.6℃ | 82.3℃ |
RTX 4080 SUPER Trinity Black Editionは10分を通して平均69.3℃(ピーク71.1℃)でした。
厚み59 mm(2.5スロット占有)の比較的薄いデザインの割によく冷えている印象です。300 W前後の熱を出しながら70℃前後まで抑えています。
騒音を10分テスト(動作音はうるさい?)
グラフィックボードから50 cm離れた位置にデジタル騒音メーターを置いて、「3DMark Speed Way」テスト中の騒音値を測定しました。
負荷がかかるとトリプルファンすべてが回り始め、38.0 dB前後まで上昇。その後テストが終わるまで「38.3 dB(やや静か)」前後に収まります。
騒音値(dBA) | 評価 | 目安 |
---|---|---|
30 ~ 32.49 | 極めて静か | 耳を近づければ聞こえるレベル |
32.5 ~ 34.9 | 静か | ファンが回っているのが分かる |
35 ~ 39.9 | やや静か | 扇風機を「小」で回したくらい |
40 ~ 42.49 | 普通 | エアコンよりは静かな音 |
42.5 ~ 44.99 | やや騒音 | エアコンの動作音に近い |
45 ~ 50 | 騒がしい | 扇風機を「中~大」で回した音 |
50 ~ | うるさい・・・ | 換気扇を全力で回した音 |
RTX 4080 SUPER(ZOTAC GAMING Trinity Black Edition)の動作音をステレオ録音しました。
3DMark Speed Wayなど、高負荷かつ低フレームレートだと、基本的にファンの「ブォーン」とした低周波が主な騒音です。
FF14ベンチマークの序盤など、負荷が軽くて平均400 fpsを超えるハイフレームレートなシーンで個体コンデンサから高周波が鳴ります。
コンデンサが鳴ると、周波数成分のグラフが「しましま模様」に変化します。しましま模様がハッキリ写っているほど「コイル鳴き」がよく聴こえる傾向です。
原理的に、どのようなグラフィックボードでも(程度の差はあれど・・・)コイル鳴き自体は避けられないです。気になる方は垂直同期や可変リフレッシュレート(VRR)を使ったり、RivaTuner Statics Serverでフレームレートに上限を設定するといいでしょう。
まとめ:汎用性 vs ゲーム特化の悩ましい選択
「RTX 4080 SUPER」のデメリットと弱点
- RTX 4080とほぼ変わらない性能
- 未だにDLSS 3.0対応ゲームが少ない
- VRAM容量は16 GBのまま
- 価格ががとても高い(約17万円)
- RX 7900 XTXに劣るシーンがある
「RTX 4080 SUPER」のメリットと強み
- 非常にパワフルなゲーミング性能
- フルHDで300 fps超が可能
- WQHDで200 fps超が可能
- 4Kゲーミングもかなり安定
- fpsをドカッと増やす「DLSS 3」
- ワットパフォーマンスが高い
- 優れたAIイラスト性能
- 高画質で超高速な「AV1エンコード」
- NVEncエンコーダーを2基内蔵
- 安定した配信性能(コマ落ちが皆無)
- ケーブル1本でOK「12VHPWR」対応
- 価格設定が200ドル安くなった
まずRTX 4080 SUPERそのものの評価は「退屈」としか言えないです。
平均わずか2~3%の性能アップを提供しつつ、価格設定を200ドル(約17%)引き下げます。単純なコストパフォーマンスが確実に向上しており、今から買うなら4080よりも4080 SUPERでしょう。無印モデルに価値はありません。
しかし値下げした結果、まったく同じ価格帯のRX 7900 XTXが立ちはだかります。日本国内の販売価格だと、むしろRX 7900 XTXが約1.3万円ほど安く買え、平均パフォーマンスでRTX 4080 SUPERと同等です。
さらに容量24 GB(384 bit幅)のVRAM、高速かつ品質の高いHEVCエンコード、ひと手間(ZLUDA版やROCm版)かければRTX 4080に匹敵する処理速度のAI性能など。低価格な割に多くのメリットがついてきます。
正直、どちらを選ぶか非常に悩ましいです。
少し多い消費電力と、1世代遅れのレイトレーシング性能を気にしないなら、RX 7900 XTXは十分魅力的な選択肢に入ってくるでしょう。対応ゲームの少なさがネックですがDLSS 3に相当する「FSR 3」も用意されています。
以上「RTX 4080 Superをベンチマーク:RX 7900 XTXとどっちがいいか性能比較レビュー」でした。
RTX 4080 SUPERを単品で買う
無難におすすめが「玄人志向(黒モデル)」です。国内最安クラスながら、標準3年保証がついてくるコストパフォーマンスが魅力的です。とりあえず迷ったら玄人志向でいい時代。
玄人志向(黒モデル)に並んでおすすめが「PNY VETRO」です。知名度が低いですが、Yahooショッピングで安く買えるタイミングが多く、実質的に玄人志向(黒モデル)より安い場合があります。
それでいて3年保証付き。冷却性能と静音性も玄人志向と同等クラスですし、安く買えるタイミングにあえればアリ。
薄型モデルは「ZOTAC GAMING Trinity Black Edition」がおすすめ。厚み59 mm(2.5スロット占有)のスリムなデザインで、平均的な静音性と冷却性能を維持します。今回のレビュー記事で使ったオリジナルファンモデルです。
トップクラスの静音性が「ASUS TUF OC GAMING」モデルです。値段も相応に高いですが、Quiet Mode時の静音性はRTX 4080 SUPERモデルで最高クラス。
RTX 4000搭載ゲーミングPC【解説】
RTX 40 SUPERのレビュー記事
グラフィックボードのレビュー記事
7900XTXをVRChatterが使わないのもまさにその安心の問題なんだよね
お金はあるけど知識がない人が口コミで仲間の真似して買っていくからどうしても安牌な(RTX+QUEST)環境が増えていく
さらにド素人がコンテンツを作ってる都合上やっぱり相性問題が出てしまうこともある
そうなるとダベるためのツールなのに「ごめん…せっかく見せてくれた新しいギミック…私ラデオンだから表示されないの」的な問題が起こる可能性がでてしまう
これをチャットツールとして致命的だと感じる僧も多く昔の「DOCOMOケータイだとハートマークの絵文字使えないから他にいく!」くらいのノリでラデ離れが更に進む
そしてVRプレイヤーはAIボイチェンや録画配信などにも手を出しやすいんだけどそのへんはCUDAコアがあってエンコードが強いRTXが有利
なかには3060を同時挿ししたりサブマシンでボイチェンする剛の者もいるけど普通はそこまでいかない
というわけで消去法で3060と4070tisと4090にVRChat民は群がっていったんだ
ゲームだけで考えればRadeonはいい選択肢だと思うが、レイトレ入れるかもって少しでも考えると、じゃあRTXにするかって考えになりがちなのも問題かな
実際そんなゲーム少ないんだけど。
RTX4080Sについては本当に安くなっただけって感じだね
BTOだと4080モデルを値下げして4080superを以前の4080モデルより高く設定してるのが多い(ド●パラもフ●ンティアもツ●モですらも)から、4080sが世に出た一番のメリットは4080の値下げかもしれない
RX 7900 XTX(Radeon系)をVRChatを使ってる実際にユーザーが少ない理由として
物理的にシェーダー数が少ない。最適化が進んで居ない。という欠点があります。VRAMが多く、価格も安いということでRX 6800 XTとVIVE Proを一時期使っていましたが、ワールドやアバターがRTXに比べ正常に読み込まれない。という不具合がありました(点滅やシェーダーエラーのピンク色になってしまう) 他にもRadeonを使っていた知人も居ましたが、同様の現象でRTXシリーズに変えた。という話も複数聞いています。自分も3060(12G)に変えたら不具合は解消しました。
また、X(旧:Twitter)にてRadeonのグラボでもVRChatは正常に動作する! 設定が間違っている。というデマが拡散、更にG-FORCEユーザーに対する嫌がらせなような投稿もありました。それらも重なりVRChatterのRadeon離れが進んだと思っています。
Radeonのグラボは細かい設定を行わなければならず、それでもやはり不具合(ワールド・アバター等が正常に読み込まれない)が続き。
特に面倒な設定をしなくても、VRChatが楽しめる、安価なquestが発売されPCの知識が少ない人でも気軽にVRを楽しめる。(ここが一番重要なのかと)
それらを経験したユーザーは、リスクの少ないG-FORCEを新規ユーザーに勧める。または選ぶようになったと推測されます。
あくまでこれは一意見と経験です。しかしG-FORCEの独壇場と化したVRChatというのは望んでいません、VRChatという特殊なゲームではありますが、VRゲームの中でもプレイ人数が多いので、できればAMDは正式に対応して欲しい・・・。MSIがAMDグラボから撤退というのは記憶に新しいです。
いずれにせよ、VRChatterに選択肢がほぼ無い状況は(価格競争や性能面)良くないと思っています。
VRChatは自作のデータを見せ合って遊ぶコミュニケーション・ツールだから
コミニティのどこかにRADEONで不具合が出るワールドやキャラが1つあるだけで「知り合いみんな不具合出した!」って状態になるんだよね
逆にそういうとこに行かない層はまったく何も起きないから「俺の周りにそんな奴一人もいないよ?ケチつけるのはよくないよ。おま環なんじゃないの」となる
どっちも極端にバイアスがかかってみえてるんだよね酷くない?
この層の数万円差は利便性をひっくり返すほどの
アドバンテージにならんわね
ゲームの最適化不足は昔からだし
AIお絵かきも「出来るようになった」では
windows上で数クリックすれば環境が構築できるGeForceと勝負にならないよ
4080 Superは無印より実消費電力が増えてワットパフォーマンスが悪化しているのは気になるが、それ以上に7900XTXの消費電力が高く世代レベル以上の格差を感じる。
マイクラのレイトレ距離24チャンクレベルの高レイトレ処理になると純粋なレイトレ性能差が表れるようで、7900XTXでも3060Tiクラスで同じく世代レベル以上の格差を感じる。
演算スペックや帯域など理論的なスペックは高いのに、AIも含めたクリエイティブ関連も弱いまま。
動画関連も含めた画質で劣る。
結論:もっと価格差がないとかなり厳しい。
グラボに16万とか出すほど画質にこだわってるゲーマーならレイトレやDLSSも重要なんだろうな
ミドル以下はレイトレ性能要らないから少しでも安くしてくれって層が多い気がするけど
VRChatって、そもそもずっとβ版で完成されていないゲームだからなんらかの不具合が起きるのは当たり前って聞いた。なら、トラブルが少ないNVIDIAを買うのは当然の流れなんじゃないかと。あと、VRC以外もプレイしたいゲームがあるならレイトレ有利のNVIDIAを買うでしょ、AMDは未だにそこが弱いし。
それとVRChatってコミュニケーションツールだから、技術の見せあいとかそういうのはプレイしてて感じない、新しいワールドやゲームが出来たら見に行くし、VRCで知り合ったみんなで行く感じ
別にこれすごいだろ!みたいなもんは感じない、Vketとかに出店してる一部の企業っぽい
ワールド製作者やアバターをいじってる人たちはunityやblenderを使ってる段階で、どう考えても素人ではないと思うけどなぁ 重ねるけどVketというイベントでは企業も参加してるし、海外のユーザーと日本のユーザーで考えとか表現でかなり差があるだろうけど
実際、オンラインでアバターを売って商売してる人がたくさん居る不具合のサポートとかもよっぽど酷い作者じゃなきゃちゃんとしてくれる
話それたけど
安定と複数のゲームを遊ぶ前提ならNVIDIA製のグラボしか選択に無い気がする
「よくわからんけどAIでエ〇画像作ったりVRCやるならビデオメモリ?ってやつが多いほどいいんだろ?」
ってレベルの層ならVRAM24GBにつられて7900XTX買うかも
そのレベル買い物するなら、なおさらにRADEON買わずに4090や3090を買うかな
VRゲーマーも種類がいるけど
メタバースでダベりたい層はnVIDAのメモリが16以上あるやつ
(MMOの街で永遠とおしゃれ着を褒め合いながらチャットしてたような層)
運動量の多い体感ゲーム好きはUnrealEngineの5Kゲーミングが多いからRADEON向け
風景を楽しむシミュレーション好きは40世代のなるべく高いやつ
になる気がする
LLMベンチの結果が面白いなあ
RX7900XTXがRTX4080無印にすら届かないなんて
メモリ帯域はRX7900XTXの方がだいぶ速いはずなのにな
CUDAより不利なプロンプト処理を含むならともかく、トークン生成のみでも遅いのはなんでだろ
メモリ帯域以外にもトークン生成に影響する要素があるのかな。テスト条件が気になる
7Bってことは量子化無しVRAM全載せtransformerかな?
VRCをRX7900XTXでプレイしていますが、現状目立つ不具合やゲームが落ちたりなんかは経験ないです。(ちなみにグラボ遍歴は5700→3090→7900XTX)おおよそVRCでの問題の原因はシェーダーであり、個人製作が多い関係上製作者が使用していない環境だとデバックが行えず不具合に…という流れであり、5700時代には確かにそういうのはありましたが最近は見ていないですし、ユーザーが増えれば解決していく問題ではあると考えます。とはいえ、やはり記事の最後でも述べられている通り、Radeonの弱点である、ユーザー数の少なさから来る情報共有スピードなんかもあり、安定感でRTXが選ばれているのが現状だと思います。ただ、私の環境では3090の時にVALORANTで突然のフリーズも経験しており、VRC内でも私が落ちない中で4000シリーズ使用者が落ちたりなんかも多々あるので安定に関しては正直おま環のほうが、、といった意見です。ただ安心感でユーザーが選んでる以上、Nvidiaが本当にやばいレベルの不具合とか出して大ゴケでもしない限りRadeon使用者は爆発的に増えないでしょうし、シェーダー最適化も自信をもって問題ないといえるほど進まないとは思います。
RDNAはゲーミング特化という割にはそのゲームですら誤差レベルな上に
ワットパフォーマンスでボロ負け、総合力では全く及ばない
その上ここまでシェアを減らしてしまったらソフトウェア開発側が対応を躊躇ってしまうので
将来性にも期待できない
もはや競合より少々安い事とメモリが多い程度でRadeonを選べるような状況ではない
RDNA3は絶対性能では無くコストあたりの性能に主眼を置いたアーキテクチャらしいけど
シェアがボロボロになっている状況でこんな微妙なものを出している場合じゃない