NVIDIAからまたもや問題作が投入されました。その名も「RTX 4060 Ti 16GB」です。
GeForceのVRAM違いはスペックに差をつけている場合が多いですが、今回のRTX 4060 Tiに至っては本当にVRAMを2倍に増やしただけ。
VRAMが増えただけでどのような性能が得られるのか、実際に性能を比較してみましょう。
(公開:2023/8/1 | 更新:2023/8/1)
「RTX 4060 Ti 16GB」の仕様とスペック
GPU | RTX 4060 Ti 16GB | RTX 4060 Ti |
---|---|---|
プロセス | 5 nm製造 : TSMC | 5 nm製造 : TSMC |
シェーダー数CPUのコア数に相当 | 4352 | 4352 |
RTコア数レイトレ用の特化コア | 34 | 34 |
ブーストクロック | 2535 MHz | 2535 MHz |
VRAM | GDDR6 16 GB | GDDR6 8 GB |
理論性能(FP32) | 22.06 TFLOPS | 22.06 TFLOPS |
PCIe | PCIe 4.0 x8 | PCIe 4.0 x8 |
TDP | 165 W | 160 W |
補助電源 | 16-pin | 16-pin |
MSRP | $ 499 | $ 399 |
参考価格 | 83800 円 | 59800 円 |
発売価格 | 88800 円 | 67800 円 |
発売 | 2023/7/20 | 2023/5/24 |
GPU | RTX 4060 Ti 16GB | RTX 4060 Ti |
---|---|---|
世代 | Ada Lovelace | Ada Lovelace |
プロセス | 5 nm製造 : TSMC | 5 nm製造 : TSMC |
トランジスタ数 | 229.0 億 | 229.0 億 |
ダイサイズ | 190 mm2 | 190 mm2 |
シェーダー数CPUのコア数に相当 | 4352 | 4352 |
TMU数Texture Mapping Unitのこと | 136 | 136 |
ROP数Render Output Unitのこと | 48 | 48 |
演算ユニット数 | 34 | 34 |
Tensorコア数機械学習向けの特化コア | 136 | 136 |
RTコア数レイトレ用の特化コア | 34 | 34 |
L1キャッシュ演算ユニットあたり | 128 KB | 128 KB |
L2キャッシュコア全体で共有 | 32.0 MB | 32.0 MB |
L3キャッシュコア全体で共有 | – | – |
クロック周波数 | 2310 MHz | 2310 MHz |
ブーストクロック | 2535 MHz | 2535 MHz |
VRAM | GDDR6 16 GB | GDDR6 8 GB |
VRAMバス | 128 bit | 128 bit |
VRAM帯域幅 | 288.0 GB/s | 288.0 GB/s |
理論性能(FP32) | 22.06 TFLOPS | 22.06 TFLOPS |
SLI対応 | – | – |
PCIe | PCIe 4.0 x8 | PCIe 4.0 x8 |
TDP | 165 W | 160 W |
補助電源 | 16-pin | 16-pin |
MSRP | $ 499 | $ 399 |
参考価格 | 83800 円 | 59800 円 |
発売価格 | 88800 円 | 67800 円 |
発売 | 2023/7/20 | 2023/5/24 |
RTX 4060 Ti 16GBのスペックはとてもシンプルです。VRAM容量が8 GBから16 GBに増えただけで、シェーダー数やVRAMのバス幅などはそのまま。
歴代のVRAM違いGeForce | |||
---|---|---|---|
GPU | VRAM | シェーダー数 | バス幅 |
GTX 1060 | 3 GB / 6 GB | 1152 / 1280 増えた | 192 / 192 bit |
RTX 2060 | 6 GB / 12 GB | 1920 / 2176増えた | 192 / 192 bit |
RTX 3060 | 8 GB / 12 GB | 3584 / 3584 | 128 / 192 bit増えた |
RTX 3080 | 10 GB / 12 GB | 8704 / 8960増えた | 320 / 384 bit増えた |
RTX 4060 Ti | 8 GB / 16 GB | 4352 / 4352おいこらっ | 128 / 128 bitおいこらっ |
過去5~6年のVRAM違いモデルをまとめた表です。VRAMが多い方が、シェーダー数やバス幅が強化される傾向がありましたが、今回のRTX 4060 Tiは本当にVRAM容量が違うだけ・・・。
VRAMが8 GB増えただけで、MSRPはなんと100ドルも跳ね上がり、国内の実売価格では約2.4万円(+40%)もの差額が付いています。
RTX 4060 Ti 16GBの性能をベンチマーク比較
テスト環境 「ちもろぐ専用ベンチ機(2023)」 | ||
---|---|---|
CPU | Core i9 13900K24コア32スレッド | |
CPUクーラー | NZXT Kraken X63280 mm簡易水冷クーラー | |
マザーボード | ASUS TUF GAMINGZ690-PLUS WIFI D4 | |
メモリ | DDR4-3200 16GB x2使用メモリ「Elite Plus UD-D4 3200」 | |
グラフィックボード | ASUS RTX 4060 Ti OC Edition | |
SSD | NVMe 1TB使用SSD「FireCuda 520」 | |
電源ユニット | 850 W(80+ Platnium)使用モデル「Corsair HX850i」 | |
OS | Windows 11 Pro検証時のバージョンは「22H2」 | |
ドライバ | NVIDIA 536.67 | |
ディスプレイ | 3840 x 2160@144 Hz使用モデル「INNOCN 32M2V」 |
「RTX 4060 Ti 16GB」を比較するために用意した専用PCスペックです。
CPUにゲーミング性能でトップクラスの「Core i9 13900K」を使います。メモリは普通のDDR4-3200(ネイティブ)で容量32 GBで、テスト時のドライバは「536.67」です。
テスト用のRTX 4060 Ti 16GBは「Palit JetStream OC」を使います。
全長250 mm、厚み49.6 mm(2.5スロット占有)のスタンダードなサイズ感が魅力。実測76 mmの小型ファンを3つ搭載し、公称値で165 WのRTX 4060 Ti 16GBを冷やします。
ちなみに買った理由は単に安かったからです。本当はASUS ProArtモデルが欲しかったものの、国内に入ってこないので致し方ありません。
参考までに、購入時の価格は83800円(実質7.8万円~)でした。
競技FPS:VALORANTなど
まずは競技性が重視されるFPSゲームで、設定別にフレームレート(性能)を比較しました。
Apex Legendsの「低設定」「高設定」で比較したグラフです。
RTX 4060 Ti 16GB版と8GB版で目立った性能差は見られません。Apex LegendsのフルHD程度の負荷では、VRAM容量がボトルネックにならないから当たり前です。
フォートナイトの「中設定」「高設定」で比較したグラフです。
Apexと同じく、フォートナイトのフルHDも負荷が低くVRAM容量がボトルネックにならないです。当然、性能差も出ません。
競技FPSの代表的タイトル、VALORANTを最高設定で比較したグラフです。Apexやフォートナイトと同じように、VALORANTもVRAM容量で差がつきにくいです。
Apex Legends
Apex Legendsを最高設定で比較したグラフです。RTX 4060 Ti 16GBと8GBで目立った性能差が見られません。
Escape from Tarkov(タルコフ)
Escape from Tarkov(タルコフ)の重たいマップ、Streets of Tarkovで比較したグラフです。
設定はタルコフYoutuber「らっしーRushy_ve」さんを参考に、SSRをオフにしたり、Reflex Low Latencyをboost onにするなど、やや高画質な競技設定(→ 設定画面はこちら)を使用しました。
タルコフはフルHDですらVRAM使用量が13 GBに達するVRAM大食いタイトルですが、残念ながら目立った性能差を得られません・・・でした。
原因としては、そもそもRTX 4060 Ti自体の性能差が低いのに加えて、VRAMの帯域幅が128 bitと狭いせいで容量より先に帯域がボトルネックになっている可能性が高いです。
VRAMの容量だけでなく帯域やコア自体の性能も重要だと、あらためて示してくれる良い代表例に仕上がりました。VRAMが多いからといって、必ず性能にプラスの効果をもたらすとは限らないです。
Overwatch 2
オーバーウォッチ2をエピック設定(解像度100%)で比較したグラフです。
やはり、RTX 4060 Ti 16GB版と8GB版に性能差が見られません。
Fortnite(フォートナイト)
フォートナイトを最高設定(NANITE:無効)で比較したグラフです。
RTX 4060 Ti 16GBと8GB版でほぼ同じ性能でした。
R6S(レインボーシックスシージ)
レインボーシックスシージを最高設定、マップをファベーラにて比較したグラフです。
VRAMが16 GBに増えても、実性能でRTX 3070に届かず、RTX 3060 Tiをわずかに上回る程度にとどまります。8 GB版とほとんど同じ性能です。
Dead by Daylight(デドバ)
デッドバイデイライトをULTRA設定、マップ「バダム幼稚園」で比較したグラフです。
フルHDとWQHDはフレームレート上限120 fpsにぶち当たり、性能差がありません。4K解像度でも16 GBと8 GB版に性能差は出ません。
Cyberpunk 2077
重量級ベンチマークの代表例「サイバーパンク2077」をウルトラ設定(レイトレなし)で比較したグラフです。
RTX 4060 Ti 16GBと8GBに目立った性能は現れません。
エルデンリング
エルデンリングを最高設定で比較したグラフです。
フルHDから4K解像度まで、悲しいほどに性能差が出ないです。
原神(Genshin Impact)
原神を最高設定(精度:1.5 / シーン細部:高)で比較したグラフです。
フルHDはCPUボトルネックで頭打ちの傾向、WQHDで微妙な性能差が出ますがゲーム側の変動だと思われ、4K解像度でほぼ同じ性能にとどまります。
VRAMが足りている限り、16 GBと8 GBで性能差はほとんど生じません。
Forza Horizon 5
Forza Horizon 5を最高設定(レイトレなし)で比較したグラフです。
付属のベンチマークを使っているため、性能差がきれいに反映されます。Forza Horizon 5はRTX 4000シリーズやRadeon(RDNA)シリーズが得意な傾向です。
フルHDから4Kまで、すべての解像度で両者の性能はほぼ同じです。
Microsoft Flight Simulator
MSFS(Flight Simulator)をUTLRA設定で比較したグラフです。
フルHDとWQHDは同じ性能ですが、4K解像度で約18%の性能アップを確認できます。VRAM容量の多さがプラスの効果を示した数少ない実例です。
しかし、RTX 4070に下剋上できるほどの性能差は得られません。
マインクラフトBE版
Java版より最適化が洗練されているマインクラフトBE版を、最高設定(16チャンク読み込み)で比較したグラフです。
RTX 4060 Ti 16 GBはすべての解像度で8 GB版と大差なし。RTX 3070に下剋上できません。
ブループロトコル
MMORPGブループロトコルを最高設定で比較したグラフです。
悲しいほどに性能差が出ず、4K解像度ではむしろ8 GB版より性能が下がっています。
FF14:暁月のフィナーレ
GPUベンチマークとしては不適切な・・・、FF14:暁月のフィナーレを最高設定で比較したグラフです。
なお、フレームレートが極端に跳ね上がる中盤以降をカットしたデータです。他のデータと同じく、16 GBと8 GB版で顕著な性能差は出ません。
VRChat
VRゲームの代表例でありながら、ベンチマークをほとんど見かけないVRChatを比較したグラフです。
グラフィック設定をUltra設定(異方性 x8)に、フレームレート上限を解除して、「Yayoi Forest House(作:猫屋敷やよい さん)」のプライベートモードで測定しました。
多くの人がVRChatにおいてVRAMの多さを信じていますが、GPUコアの性能を覆せるほどの性能アップは見込めません。
128 bitしかない狭いVRAMのバス幅も災いして、RTX 3070どころかRTX 3060 TiやIntel Arc A770にすら4K解像度で敗北します。
VRAMを大量に消費するシーンで性能を維持できる可能性がありますが、あと1万円足してRTX 4070を買った方が確実でしょう。
16ゲームの平均フレームレート
テストしたゲームの平均フレームレートをまとめました(※注意:平均はしょせん平均なので参考にしすぎないように)。
今回テストした内容だと、RTX 4060 Ti 16 GB版は8 GB版に対してフルHDでほぼ同じ、WQHDでほぼ同じ、4K解像度でほぼ同じ性能でした。
fpsを底上げ「DLSS」を使った結果
- フルHDでいったんレンダリング
- 機械学習を使って4Kにアップスケーリング
- 実質4Kのフレームが完成します
4K解像度のレンダリングは非常に重たい作業ですが、DLSSを使えばフルHDやWQHD相当のレンダリングで済ませられるので、フレームレートを稼ぎやすくなります。
ちなみに、どの程度の解像度でレンダリングするかどうかはゲーム側の設定で調整できます。高画質な設定ならWQHD相当で、性能重視な設定だとフルHDやHD相当でレンダリングを行います。
RTX 4000シリーズは、コア内部に搭載された機械学習に特化した「Tensor」コアを用いて、高画質なアップスケーリングを用いたフレームレート底上げ機能「DLSS」を利用できます。
今回はDLSS 2以上に対応している3本のゲームで、DLSSの効果をテストしました。
タルコフ(4K解像度)でDLSSを使った結果、フレームレートが約1.8倍に跳ね上がります。
DLSS有効時ならRTX 4060 Tiで4Kゲーミングが出来そうです。と思いきや、RTX 3060 TiやRTX 3070の方がむしろ性能の伸びがよく、コストパフォーマンスが終わってます。
次はRTX 4000シリーズ独自の強み「DLSS 3.0(フレーム生成」に対応したゲームで、旧世代を圧倒できるかチェックします。RTX 4070までなら、DLSS 3有効時の性能はまさに別次元でしたが・・・果たして?
サイバーパンク2077(4K解像度 + パストレーシングモード)の検証結果です。
DLSS 2だけだと厳しい動作ですが、RTX 4000シリーズ限定のDLSS 3(フレーム生成)を使うと現実的な動作に改善されます。
DLSSはVRAM使用量が増えるため、16 GB版と8 GB版で1.5倍近い性能差が出ています。
MSFS(4K解像度 + ウルトラ品質)でDLSSを使った検証結果です。
VRAM容量の多さが効いています。16 GB版と8 GB版を比較すると、DLSS 2有効時で約1.7倍、DLSS 3(フレーム生成)で約1.6倍の性能差です。
- A Plague Tale: Requiem
- Atomic Heart
- Bright Memory: Infinite
- Cyberpunk 2077
- Conqueror’s Blade
- Dakar Desert Rally
- Deliver Us Mars
- Destroy All Humans! 2 – Reprobed
- Dying Light 2
- F1 22
- FIST: Forged In Shadow Torch
- Forza Horizon 5
- Hitman: World of Assassination
- Hogwarts Legacy
- Jurassic World Evolution 2
- Justice
- Loopmancer
- Marvel’s Midnight Suns
- Marvel’s Spider-Man: Miles Morales
- Marvel’s Spider-Man Remastered
- Microsoft Flight Simulator
- Mount & Blade II: Bannerlord
- Need For Speed Unbound
- Perish
- Portal with RTX
- Sackboy: A Big Adventure
- The Witcher 3: Wild Hunt – Game of the Year Edition
- Warhammer 40,000: Darktide
- WRC Generations
- Black Myth: Wukong
- Chernobylite
- Diablo IV
- Icarus
- Marauders
- Midnight Ghost Hunt
- Naraka: Bladepoint
- Ripout
- STALKER 2: Heart of Chornobyl
- Scathe
- Super People 2 (available now in early access)
- Sword and Fairy 7
- Synced
- The Cycle: Frontier
- The Day Before
- The Finals
- The Lord of the Rings: Gollum
- Throne and Liberty
- Tower of Fantasy
- Warhaven
- Witchfire
2023年3月時点、上記の50タイトルがDLSS 3.0に対応する予定です。
3DMark等の定番ベンチマークに興味がないので説明は省きます。
3DMarkとVRMarkどちらも16 GB版と8 GB版でほとんど同じ性能です。
RTX 4060 Ti 16GBのクリエイティブ性能を比較
GPU | RTX 4060 Ti 16GB | RTX 4060 Ti |
---|---|---|
シェーダー数CPUのコア数に相当 | 4352 | 4352 |
ブーストクロック | 2535 MHz | 2535 MHz |
VRAM | GDDR6 16 GB | GDDR6 8 GB |
理論性能(FP32) | 22.06 TFLOPS | 22.06 TFLOPS |
グラフィックボードのクリエイティブ性能は基本的に、シェーダー数とクロック数から計算できる理論性能(FP32)に比例して高くなる傾向があります。
16 GB版と8 GB版の理論性能はどちらも約22テラフロップスですが、VRAM使用量が多い使い方なら8 GB版以上の性能を発揮できるかもしれません。実際にいくつか試して確認しましょう。
GPUレンダリング(Blender)
GPUレンダリングの定番ベンチマーク「Blender 3.5.0」では、16 GB版と8 GB版で性能差なし。
スコアの内訳(Monster / Junkshop / Classroom)はそれぞれ以上のとおりです。
画像のAIアップスケーリング
AI(機械学習)を用いた画像のアップスケーリングをテストします。
シェアウェアだとTopaz Gigapixel AIが有名ですが、今回は無料で使えるStable Diffusion Web UIのExtrasから「R-ESRGAN x4+」を使って、画像の4倍超解像を試しました。
2048 x 2048 pxの4倍アップスケーリングは28.5秒かかり、8 GB版の27.9秒とほとんど同じです。
AIイラスト(Stable Diffusion)
AIイラストの定番ソフト「Stable Diffusion(AUTOMATIC1111 web ui版)」を使って、AIイラストの生成時間を比較します。
使用するベンチマーク内容は以下のガイド記事より3点です。
- ハローアスカベンチ(512 x 512)
- 神里綾華(LoRA + ControlNet)ベンチ(512 x 768)
- 神里綾華(LoRA + Latent x2.0)ベンチ(1024 x 1536)
生成時間が短いほど高性能です。
ハローアスカベンチ(10枚分)の生成時間は、16 GB版が26.5秒、8 GB版が26.1秒でした。
神里綾華(LoRA + ControlNet)ベンチの生成時間は、16 GB版が52.6秒、8 GB版が50.8秒でした。VRAMが足りている場合だと目立った性能差が出ません。
神里綾華(LoRA + Latent x2.0)ベンチではHires Fix(アップスケーリング)の処理スピードが大きく改善され、8 GB版より約1.4倍の高速化です。
しかし、上位モデルのRTX 4070はさらに約1.4倍ほど処理が速く、AIイラスト目的ですらRTX 4060 Ti 16GB版は微妙なポジションです。
機械学習(Tensor Flow 2)
python 3.10.6にGPU版Tensor Flow 2を読み込み、kerasパッケージの「手書き文字の識別トレーニング(MNIST)」を実行します。25 epochの学習を合計5回実行して、処理にかかった平均時間を求めます。
16 GB版は平均19.3秒、8 GB版が18.2秒で学習を終え、特に性能差はありません。理論性能(FP32)から期待される性能をまったく出せておらず、VRAMバス幅のボトルネックが深刻です。
動画編集(PremiereとDavinci)
Puget Systemsのベンチマークプリセットを使って、動画編集の定番ソフト「Adobe Premiere Pro」と「Davinci Resolve Studio」のGPU性能をテストします。
テストに使用される動画素材は基本的に4K解像度以上で、割りと負荷の重たいワークロードです。
Premiere ProのGPUスコアは「67点」で、8 GB版から性能アップなし。
一方、素材のプレビュー性能(Live Playback)では16 GB版が「124.3点」で、8 GB版から1割近い性能アップです。
Davinci Resolve StudioのGPUエフェクト性能は「88点」で、8 GB版と大差なし。下手するとIntel Arc A770にすら追いつかれそうです。
動画エンコード(NVEncなど)
世代 | RTX 4070 Ti SUPER (Ada Lovelace世代) | RTX 3070 (Ampere世代) |
---|---|---|
NVEncエンコーダー | 第8世代(2基) | 第7世代 |
NVEncデコーダー | 第5世代 | 第5世代 |
AV1エンコード | 対応 | – |
AV1デコード | 対応 | 対応 |
RTX 4070 Ti SUPERに内蔵されている、第8世代NVEncデュアルエンコーダーを検証します。
rigayaさん作のAviutl拡張プラグイン「NVEnc 7.50」を使って、動画エンコードの処理速度(平均fps)と品質スコア(VMAF Score)を調べます。
テスト内容は1分30秒ほどのフルHD動画(原神のプレイ動画)を、VBR形式(ビットレート9000 kbpsでBフレーム挿入あり)でエンコードするのみ。ログに記録される処理速度(fps)で性能を比較します。
- 動画素材:動きの激しいゲームプレイ動画(原神)
RadeonはNVEncを使えないので、AMD VCE(VCEEnc)を使います。VBR形式(ビットレート9000 kbps)で、プリセット:Qualityです。
VCEEncではBフレーム挿入を使っても画質がまったく改善せず、いたずらにエンコード速度を半減させるだけなので、Bフレーム挿入をあえて使いません。
遅い割に画質が変わらない「罠」です。
さすがの処理速度。RTX 4070 Ti SUPERは、AV1エンコードを平均470 fps、HEVCエンコードを平均300 fpsで処理します。
エンコード品質(VMAFスコア)も高いです。
ゲーム開発(Unreal Engine 5)
無料で使えるゲーム開発ソフト「Unreal Engine 5.1.1」のプレビュー性能をテストします。
無料で配布されている「City Sample(The Matrix Awakens)」から「Small_City_LVL」を読み込み、既定のルートを1周してフレームレートを測定します。
「Big_City_LVL」だとメインメモリ容量が不足して動作が不安定だったため、メモリ容量32 GBでもなんとか動作するSmall版をテストしました。
16 GB版と8 GB版でほぼ2倍の性能差です。テストに使用した「Small_City_LVL」はVRAMを約11 GB近くも消費するため、VRAMが多いほどGPUコアの性能を発揮できます。
VRAMが8 GBしかないRTX 3060 TiやRTX 3070を完全に打ち負かし、RTX 4070に迫る性能です。
VRAMを大量に消費する、かつUE5製のゲームであればRTX 4060 Ti 16GBが活躍できる可能性に期待できます。
ゲーム実況配信(OBS Studio)
16 GB版と8 GB版でまったく性能差が出なかったため、データと解説を省略します。
AV1エンコードを使った4Kゲーム配信ですら、処理性能やドロップフレーム(コマ落ち)率に変化がなかったです。
RTX 4060 Ti 16GBの消費電力を比較
電力ロガー機能のついた電源ユニットを2台使って、CPUとマザーボードに電力供給を分割します。
テスト環境 | ||
---|---|---|
電源ユニット #1システム全体 | 850 W(80+ Platnium)使用モデル「Corsair HX850i」 | |
電源ユニット #2CPUや水冷クーラーなど | 850 W(80+ Gold)使用モデル「Toughpower iRGB PLUS」 |
システム全体を担当する電源ユニットから、+12Vレールの消費電力を見るとグラフィックボード単体の消費電力とほぼ一致します。
上記の接続方法だと、+12Vレールは基本的にグラフィックボード(6+2 pinとPCIeスロット)で使用されるため、CPUを取り除いておけば自ずとグラフィックボード単品の消費電力を抽出可能です。
ただし、電源ユニットの電力ロガーセンサーは刻み値が粗いです。変動幅が小さくなりがちな、低負荷時(低設定のフルHDなど)の精度はやや悪いです。
GPU単体の測定値を見るのではなく、他と比較して相対的に見るべきです。
誤:Aは平均200 Wらしい- 正:AはBと比較して50 W少ないらしい
これくらいのニュアンスでデータを見てくれると助かります。
特定のゲームをプレイ中の消費電力ではなく、テストした16個のゲームタイトルから平均消費電力を求めます。
タルコフやMSFSなど、CPUボトルネックの影響でGPU使用率が上がりにくいタイトルが含まれているため、RTX 4060 Ti 16GBのフルHD消費電力は平均135 Wに。
WQHDで平均147 Wに、4K解像度で平均151 Wの消費電力です。8 GB版と比較して、16 GB版は約13~15 Wほど消費電力が増えています。
消費電力1ワットあたりの平均フレームレートを計算したグラフです。
消費電力の増加に伴い、ワットパフォーマンスも悪化します。16 GB版を8 GB版と比較すると、フルHDでおよそ1割、WQHDも1割、4Kでも約1割ほどワットパフォーマンスが低下します。
単純にVRAMが増えた分だけ消費電力が増加した、と考えるのが自然です。
高負荷時のGPU温度は?
GPU使用率が100%に達する「3DMark Speed Way」を10分連続で動かして、RTX 4060 Ti 16GB(Palit JetStream OC)のGPUコア温度を測定したグラフです(※テスト時の気温は27℃前後)。
RTX 4060 Ti 16GBは10分を通して平均64.6℃(ピーク77℃)でした。消費電力がわずかに増えた分だけ冷やしづらいと考えられますが、8 GB版とGPUクーラーの設計が違うため厳密な比較は不可能です。
グラフィックボードの温度比較は、テストに使用したボード設計に大きく左右されます。
同じRTX 4060 Ti搭載モデルでも、分厚くて全長の長いトリプルファンモデルなのか、今回のようにコンパクトなデュアルファン設計かどうかで冷え方や騒音がまったく違います。
GPUチップ本体の発熱度合いではなく、ボード設計の上手さを比較しているため参考程度に見てください。
騒音を10分テスト(動作音はうるさい?)
デジタル騒音メーターを距離50 cmに置いて、騒音値を測定しました。
テスト開始時に40 dB超えで正直うるさいものの、時間がたつと少しずつファンの回転数とGPU温度が下がって、平均的に「やや静か」な範囲に収まります。
グラフィックボードの動作音(騒音)比較も、温度と同じくテストに使用したボード設計に大きく左右されます。
単純に、ヒートシンクが分厚くて大口径な冷却ファンを搭載している設計の方が有利です。特定のGPUチップだから静か、ではなく巨大な設計だから静かに冷えやすい(またはコンパクトな設計だからうるさい)と見てください。
上記のグラフから確からしい情報は、特定のボード設計がどれくらい静かに動作できるかどうかに過ぎず、参考程度に見るべきです。
騒音値(dBA) | 評価 | 目安 |
---|---|---|
30 ~ 32.49 | 極めて静か | 耳を近づければ聞こえるレベル |
32.5 ~ 34.9 | 静か | ファンが回っているのが分かる |
35 ~ 39.9 | やや静か | 扇風機を「小」で回したくらい |
40 ~ 42.49 | 普通 | エアコンよりは静かな音 |
42.5 ~ 44.99 | やや騒音 | エアコンの動作音に近い |
45 ~ 50 | 騒がしい | 扇風機を「中~大」で回した音 |
50 ~ | うるさい・・・ | 換気扇を全力で回した音 |
まとめ:8 GBが16 GBに増えても・・・性能は渋い
「RTX 4060 Ti 16GB」のデメリットと弱点
- 4K解像度でRTX 3060 Tiと同等
- 前世代から性能の伸びが少ない
- DLSS 3.0対応ゲームが少ない
- NVEncエンコーダーが「1基」にカット
- 動画編集の性能がなぜか低い
- MSRPはなんと499ドル
- 国内の販売価格が高い(8.3万円)
- 性能あたりコスパが悪い
「RTX 4060 Ti 16GB」のメリットと強み
- フルHDで144 fps↑が可能
- WQHDで100 fps↑は可能
- fpsをドカッと増やす「DLSS 3.0」
- 依然としてワットパフォーマンス高い
- 高解像度なAIイラスト性能が高い
- 高画質で超高速な「AV1エンコード」
- 安定した配信性能(コマ落ちが少ない)
- 定格モデルなら補助電源「8 pin」
- Unreal Engine 5で高性能
RTX 4060 Ti 16 GB版と8 GB版の比較で、VRAM容量が多いからといって劇的な性能アップを見込めるとは限らない、とあらためて確認できました。
特にゲーミング用途は残念な結果です。VRAMの多さが効いたのはMSFS(4K解像度)だけで、タルコフやVRChatでまったく効果が出なかったです。
Hires FixやTiles Diffusionなどを使った高解像度なAIイラスト生成や、VRAMを大量に使うUnreal Engine 5でのゲーム開発など。特定の用途で大きな性能アップを見込めますが、価格がネックに思えます。
現時点でRTX 4060 Ti 16GBは安くても約8.3万円からで、予算をあと5000~8000円足すと確実に高性能を見込める上位モデル「RTX 4070」に手が届いてしまいます。
スペックをRTX 3500 Ada相当(5120シェーダーで192 bitバス幅)に強化するなど、従来どおりVRAM容量以外のスペックに手を入れていれば、もう少しマシな評価ができたでしょう。
現状の価格では、「何かの役に立ちそうですが買うならRTX 4070で良くない?」で終わるグラボです。
以上「RTX 4060 Ti 16GB版に価値ある?:実際に8GB版と性能を比較してみた」でした。
基本的に「RTX 4070」がコスパ良し
2023年8月時点、RTX 4060 Ti 16GBが約8.3万円から、RTX 4070が約8.8万円から買えます。
両者の価格差は約5000円(+6%)で得られる性能差がフルHDで約20%、WQHDで約24%、4Kでは約31%です。価格あたりコストパフォーマンスはRTX 4070が圧倒的に良いです。
RTX 4060 Ti 16GBを単品で買う
日本国内で16 GB版を取り扱っている代理店が少ないせいで、選択肢も限られます。
ASUS ProArtモデルが国内に入っていればよかったですが、残念ながら入ってくる気配がないので消去法でPalit JetStreamです。
RTX 4000搭載ゲーミングPC【解説】
RTX 40 SUPERのレビュー記事
グラフィックボードのレビュー記事
バス幅改善と併せて4070と4070tiでやれよと言われそうなスペックアップですな…
ゲーム目的ならまず必要とされないでしょうね
4070は3080と横並びとはいえRAM12GBで3080同性能なら特に不満もないし60tiシリーズがある意味とは一体
機械学習の学習にメモリ量があってたすかるみたいなことはないのかな
まあGPU買うより1000円払ってcolabでも使ったほうがいいだろうけど(うるさいし激熱だし)
人工無能用だろう良いじゃん
こんなに手間かけてるベンチマン中々いない大変良い記事でした
先日どうしても10マソ以内でAIもやりたくて4070にしたけど、妥協して60tiにしなくて良かった..
500w電源でパワリミ弄って140w運用出来てます、良い物を買いました
Cities Skylines 2用に良いかなって思ってるんだけどなぁ・・・
不人気で売れ残ってどんどん安くなってくれてたら嬉しいなw
どうなんでしょう。
Escape from TarkovのようにVRAMを大量に食うゲームですら、先にバス幅がボトルネックで性能を出せない例もあるので、必ずうまく機能するとは限らないのがまた・・・。
検証お疲れ様です
レイテンシ増加で僅かに下がる傾向が確認できて、ゲーム用途なら今のVRAM構成が正しいと言うnvidiaの叫びが聞こえそうですね
5月ごろいっぱいいたVRAMもっとよこせ言ってた人たちはどこ行ったんだろう
VRAM欲しいって言ってた層だけど128bitで出されても困るわ。
「これがもっとあったらいいですね」であって「質は問わないから増やしてくれ」ではないんだよ。そのくらいわかるだろ。
RTX4000から帯域向上効果あるキャッシュ搭載で、VRAM 8GBでもよりある程度回せてしまうのも理由でしょうね。
ゲーム全体がMSFSの4Kのようになれば、8GBと16GB版で1.2~1.6倍もの差がつくのでしょうけれど、大半は8GBで事足りているということ。128bitは関係なさそうなほどの伸びは確かにあるにはあるようですが。
たしかその頃はThe Last of Us(PC版)という、最適化がロクにされてないグラ品質の割に動作が重たすぎる極端な実例が存在して、その実例をベースにVRAM:8 GBを叩く風潮が海外で流行っていた影響かと思います。
最適化で改善されるにつれて、8 GBじゃ足りない教はかなり減った印象です。
とはいえ、下のコメントにもあるように、そもそも4060 Ti程度の性能に16 GBを載せたところで・・・容量より先にバス幅や性能がボトルネックになってしまいますね。
みんなが騒いでた時期は最適化不足のタイトルが大量リリースされてた
そういうのには実際16GBと8GBで動画と紙芝居ってぐらい差がつく箇所があった
いやvramは増やしてほしいけど
8GBじゃ流石に心配
今回のバス幅128bitで16GBとかいう極端な例出してそんなこと言われても困る
これだけの価格帯でPCIeが8レーンだと誰もが思いつくのが2枚差しですよね~ Z790 AERO D (海外ですら出ていない) とかが安く手に入れば気軽にできるのですが。余ったレーンをNVMe SSDに活用するのも良いですが、このGPUを2つ搭載した変態グラボ出てきそう。(4スロット占有のやつとか。)
なぜうんだ
VRChatの計測が難しいのはわかりますがこのレビューでの結論には首を傾げざるを得ないです。
そもそもVRChat目的でグラボを求めるのはその「VRAMを大量に消費するシーン」が多い故なので、「多くの人がVRChatにおいてVRAMの多さを信じていますが、GPUコアの性能を覆せるほどの性能アップは見込めません。」などの記述は極めてナンセンスです。個人的にVRChat目的でグラボを選ぶ際に重要だと思うのは、平均fpsよりもVRAMが溢れてfpsが急激に低下するのを避けることです。
まぁそれでも4070がこの値段で買えるのに60Ti16GBを買う理由は無いのはその通りだと思いますけどね…
Twitterで延々とRadeonすすめてるおじさんみたいなこと言ってるな
ほならね、あなたが納得のいく検証というものをね自身でやってもろて
そういう状況を作るのって1人でやるのは難しいんですよね。
5人くらい集めてVRChatを4重に起動させて重いアバターでわちゃわちゃやらないと
検証ができないと思います。
現実的なアバターで12GBまでを枯渇させるほど集めるとなると数十人レベルでは?そんな状況を検証の度に毎回作るのはやっぱり無理…と思ったんですがアバターミュージアムなら可能かもしれません。再現性は確保できますし、ただワールドの描画負荷だけのyayoiさんのところよりは検証に適してそうです
すみません、数十人集めるのは現実的ではないので、
5人くらい集めてデスクトップモードで多重起動させて、
その光景をVRで見るのがまだ現実的にやれることかなと思ってましたが、
トンチンカンな考え方でした。
スペック弄らないならVRAM事態は8GB以上あればまぁ正解なのか
16シリーズの時も似たような事思ったけど、一週間分の昼飯代を足せば上位機種になるような価格設定見直せばいいのに…
もう本当にお疲れ様としか言えない
心折れるだろ…この検証…
40系のグダグダっぷりを見るともうnvidiaはクーデターでも何でもして革ジャンの首挿げ替えたほうがいいんじゃないかな…ってなる
無駄だよ
企業向けのA800とかH100がめちゃくちゃ売れててエンドユーザーに売る意味も今はほとんどない状況
nvidiaは株価も絶好調だし
4070以下は売れないから価格維持のために供給止めたりしてるし4000シリーズは売れなくてもいいってスタンスだからね
AIブームが終わるまでは個人に安売りする気がないからamdに頑張ってもらうしかない
悲しいなあ…
ガチでこの世の誰もレビューすらしてなかったけどようやくまともな計測が
結果はまあ、知ってた
RTX30シリーズの発表の時はあんなにGDDR6Xをアピールしてたのに。何かの戦略なのか?
RTX3000もですが、下位モデルはコストの安いGDDR6でしたので同じ理由でしょう。
3060Ti は後にGDDR6Xになったものが出てきてますが7%アップ程度で電力も同程度上がっているようなのでコスト優先は当然かと。
VRユーザから補足します
VRゲームの多くは「VRAMを大量に消費する、かつUE製のゲーム」の定義にあてはまります
Unreal Engineで4K解像度で動かした時のグラフがVRゲーマーの求める物に近いです
しかしグラフをよく見てください
ラデの6800XTを買った方がはるかにマシです
一方でVRchatは最適化を投げ捨てたUnityゲーです
5K以上の解像度で描写した世界で何時間もダベり続けます
下手するとVR睡眠で20時間つけっぱなしなんて事もあります(流石に大帝は寝る前に解像度を落としますが…
そのためワッパと発熱もかなり重要です
VRなのに30fpsも出ないような事も実際よくありますが、ぼんやり話をするだけだから90fps割っても何とかなっちゃうんですよ
なので激重アバター複数でメモリ圧迫しても安定するかどうかのほうが実問題で重要なんです
これで値段が素の4060tiに近ければまあそんなもんかで済んだけど上位の4070とほぼ変わらんやんけとなればまあ…ねえ…
ご祝儀価格にしても…ねえ…
よそでさんざん言われてるけど型番が一個ズレると値段も性能もはるかに収まりよくなるんですけどね
nvidiaはマイニングバブルの後遺症をいつまで引きずるつもりなんでしょうか
いくら企業向けのAI需要があるといっても、実績もあって安定した需要のある一般向けを蔑ろにするのは賢い戦略には見えない
まあ賢くないからマイニングでこれだけ尾を引いてるのかもしれませんが
ライバルが弱すぎるのも要因でしょう。
RX 7900XTXは今回同じ9番モデルの4090には大差があり、下位の4080に対しても総合的には特に性能が欲しい場面で差を付けられて、7900の下位モデルは7番モデルとも争わないといけないほど弱体化が目立ちます。
コスト増や為替の影響が大きいのも確かですが、ライバルたちが弱すぎるのも不味いなと。
まぁ…売り渋りでも売れなくて
在庫過剰で更に値下げが進めば…
用途によっては買ってもいいかなって感じ
すさまじい力作記事ですね、お疲れ様でした
VRAM 8GBだとメモリ不足の警告が表示されるタイトルが時々あるので、もうちょっと変わるものかと思ってましたが
そんなに単純な話でもなかったんですね
そういうケース場面での計測はここではほぼしていないですね。
VRAM 8GBで不足する場面では16GB版は1.4倍以上速くなるようですので。
ゲーム目的ならもうPS5が1番だねw4K動もかせるしチーター少なくて平和だし。
原神のfps制限解除って違反行為なんだからいい加減やめなよ…堂々とブログに書くとかどういう精神してるんですかね…
今でもギリギリ4万しない3060(12GB)が並んでるから軽く生成AIで遊ぶなら断然こっちだろうね
> どういう精神してるんですかね…
この点に関しては「好奇心に勝てない測定厨」とだけ答えておきます。既存のSKUに対してコスパで負けが確定している16 GB版をわざわざ買ったのも、どうしても知りたいデータがあったからです。
なお、Genshin fps unlockerは2021年にリリースされて以来、これが原因でBANされたユーザーが今のところ報告されていません。高画質化MOD「ReShade」と同様に、mihoyoから黙認されているのが現状です。
ただし、あくまでも黙認されているだけでmihoyoの利用規約的にはアウトなはず。利用は自己責任となります。同様にMSI AfterburnerやRivaTunerなどの外部ツールも厳密にはアウトになりうるので注意が必要ですね。
原神ならツール検知と使用記録がしっかりとれらているので
外部ツール使用違反ならHoyoから垢BAN警告が来ると思いますよ
>外部ツール使用違反ならHoyoから垢BAN警告が来ると思いますよ
「グレーはセーフ」という意図でしたら、貴方自身はそれをどう思いますか?
運営の意図として、「CS機版では不可能な高画質化は、マルチプラットフォームに
おける均一なサービス提供の観点でマイナス」と考える可能性はありえるので、
野良パッチの導入は個人的にあまり好ましいと思えません。
貴方はどうお考えですか? それを明示しないと、主様を擁護してるのか
暗に批判してるのかわかりません。
正直この手のキヤクガーさんは無視していいと思うよ。
相手するだけ無駄。
ちもろぐさんが自分なりに自己責任でやってることなんだしそれでいいじゃん。
別に使用を推奨しているわけでもなし。
こういう「自分は正しいことをしている!」って居丈高になってる厄介読者はどんな場所でも出てくるものだしかまってあげるだけ損するよ。
検証ありがとうございます!
生成ai検証について、よけれは、生成画像のサイズ上限(=vramエラーにならない限界)の比較もできないでしょうか?
お願いします!
Hires FixやTiled Diffusion、Ultimate SD Upscalerを使わずに、ネイティブ解像度で高解像度を生成する、という意味ですよね?
ぼくがよく使うモデルだと700 x 1000を超えたあたりから奇形の発生率が上がるので、ネイティブ高解像度の生成に意味があるかは分かりませんが、一応どこまでサイズを上げられるかチェックしてみます。
Torch 2.1.0、xformers 0.0.17(Ada Lovelace最適化ビルド)にて検証しました。使用モデルは「7th_Anime_v3_A」です。
15ステップでおよそ1分20秒かかりますが、最大サイズの2048 x 2048まで問題なく動作を確認できました。人物だと奇形が発生して辛いので、風景画(the forest)で検証しています。
なので、おそらくネイティブであってます。
すみません、経緯としては
・512×768程度の低解像度画像を1度t2i等で生成する
・それをi2i controlNet Tileで描き込みを増やしながら高解像度リサイズしたい
・3060だとx2.5(1280×1920)程度でメモリ不足になる
⇒4060ti 16GB等他のgpuならどれぐらいまで大きくできるか知りたい
といった感じです!
(Tiled VAEを使う選択肢もあるのですが、指定倍率に実質的に制限があるみたいなので、メモリを潤沢にする方向で考えてる感じです)
使用した設定と作例→ https://imgur.com/a/3bCfe0n
512 x 768をCN Tileで4倍(2048 x 3072)だと、処理時間が約4分50秒、使用したVRAMが約13800 MB(約14 GB)でした。
704 x 1056を4倍(2816 x 4224)だと、約11分20秒、VRAMが約15990 MB(約16 GB)でした。
ありがとうございます!
お辛いとこすみません
家の環境と比較して検討してみます!!!
検証お疲れ様です。
ずっと発売を待っていたけど、結局RTX4070無印以上を買っていたほうがよかったパターンとは…
がっかりすぎる…
ゲームあまりしない人のai用途ではコスパ良いですよ?
google colabはたしかエチ絵禁止だったはず
一般的には12gbで絵用途は十分ですがモデルや用途(超高解像度)次第では有用です12gbでは絶対に不可能なことがある
速さはxyz プロットで1000枚10000枚放置出力するのでいらない場合が多いですし
llmでも12gbじゃ足りないですね
今後のai業界の動向次第では大人気になる可能性もありえます
あとは価格がこなれてくればな……
RTX 4080が20万円近いので、Ada Lovelace世代の16 GBがとにかく安く欲しい人にはアリ、なのかも。
今後これより安い価格帯で16 GB版が出るとは思えないですし。
値下がったらAI需要で使われるのか?と思わなくもないけど、ほぼ4070と値段同じは御祝儀価格とはいえ攻め過ぎ
$ 499 * 143円(為替 + 海外事務手数料) * 1.06(輸入消費税)+ 2000~3000円(送料)だと7.7~7.9万円くらいなので、代理店の取り分を考慮するとドスパラの82800円はすでにご祝儀価格を終えてそう・・・だったり。
楽天だと実質7.7万円で買えるので、もう~とにかく~円安が邪悪すぎるんですよね。
もちろん、Nvidiaの「499ドル」設定も大いに問題ありだとは思います。
なぜ8GBより16GBが下がることがあるのかというと
「128-bitと言うバス幅のまま16GBにVRAM容量を増やしたという事でRTX 4060 Ti 16GBには表面と裏面にそれぞれ4枚、合計8枚のメモリーモジュールを搭載していますが、通常の8GB版であればメモリーモジュール辺り32-bitなのですが、16GB版では無理やり16GB積んでいるためメモリーモジュール辺りのバス幅は16-bitに半減されており、これが原因でメモリーレイテンシーが増えてしまい、パフォーマンスが落ちている可能性があります。」
ということだそう。
図らずも4060ti程度の性能だと8GBで十分なことと、バス幅の限界を証明してしまったのか。
今後グラボ買う時の目安になる良いデータだ。とても参考になりました。
それは間違った見解。
他所で8GBで収まらない場面では16GB版はかなり速いことは証明されている。
この1440p以下ターゲットクラスは128bitで必要十分。
最近3060 12GB買ったばかりだけど
AI学習って8GB は出来ないんじゃなかったの?
学習方法が改善されてるからですね
大雑把に言えば、学習する為に範囲全ての資料を展開して勉強していたのが、プログラマ達が学習の特徴を把握できてきて最低限の資料展開で学習させれる様になった感じです。
ただ、1からではなく追加学習だから8GB以下で出来るだけで、1から学習させるには100GBとかの大容量が必要になります。
AIで遊んでる連中がいい加減(現在の)AIはしょうもないもんだって気付いて飽きてくれるといいんだけどなかなか気付かないのがなぁ…
ほんとうにしょうもないですよね
出来損ないの糞便みたいな連中ですよAI生成師とやらは
コンプレックス丸出しのチーギュウがイラストレーターを
逆恨みしているだけですからね
プロの漫画家が商業連載でAIを使ってるのにお遊び扱いされちゃたまらんだろうねぇ
お前のレスよりしょうもないもんはこの世にはないし
しょうもないことにしか時間も金も使ってなさそう
「AI全般について知ってる」のか
それは大したものだね
ところで「将棋AI」って知ってる?
将棋ではAIで正に革命が起きてるんだけど・・・
(あんまこういうところで喧嘩する内容でもないですけど)普通にいつも絵描いてる工程の一部を時短する目的で使ったりしてて、かなりお金と時間の節約になってたりするので使い方次第だと思いますよー
何がしょうもないのか教えてよ。
それってお前の感想だろ?
stable diffusion XL性能比較の項目を追加することは可能でしょうか?
VRCはユーザーが沢山いる複数のアバターがいる状況でVRAM容量の差が出るのでは???
比較は難しいと思いますが、プライベートで自分だけという評価方法は無理があるのではないかと思います。決まった数人を呼んで同じように立ってもらうとかだともう少し信頼性のあるデータになるのではないでしょうか。
レビューはレビューする人の感想や論評であり、参考値の範囲です。
そもそも、同一メーカーの同一ロットですら性能ばらつくのに、別メーカーだと性能絶対に違いますからね。
他人の影響まで考慮するのはレビューではなく、お金払ってやって貰う調査ですよ
訂正:信頼性のあるデータ→現実味のあるデータ
色んな界隈の人がごった返してるコメント欄で面白い
やはりちもろぐさんは検証やってくれてた、そこに痺れる憧れる
16GBで可能になることがあるかどうかですね
画像生成は12GBあれば概ね学習も出来るがSDXL1.0リリースで少し敷居が上がって来ているという所
言語モデル方面は16GB欲しいとは聞きますね
VRAM 8GBあればゲームはほぼ回せるということですね。
しかし為替 RTX3000発売時の1ドル105円程度なら、16GB版で6.5万円程度だったのにね。130円以上が普通になってきてしまっているのがもうね。
争いごとが収まってももうこの感じが続きそうで、コストもますます増加に歯止めが掛からないようで正に泣きっ面にハチ。
ブルプロ用にグラボ買い換えたかったので助かります。
RTX3090やRTX3080、3080Tiはどれと同じくらいでしょうか?
ブルプロならVRAM目一杯使わないのでRTX 4070くらいではないでしょうか。
少なくとも大差なさそうです。
記事一番上のブログタイトルわクリックするだろ
記事一覧の6月1日にブルプロまとめがあるだろ
その他にもグラボ比較記事がいくつもあるだろ
そこを確認してから聞こうぜ
ゲーミング向けの性能じゃないのは分かってたけど、それでもコスパが悪いなぁ
ワッパが良い+UE5が快適ってゲーム開発してる所は嬉しいんだろうけど
なんというか…4000番台が出そろってそういった顔ぶれを見てみると4090以外はゲームをメイン目的としては作られてなくどちらかというとはやりのAIに傾けて作られてる印象だなぁ
3000番台でゲーム配信動画編集している人は5000番台を待つか3000番台内でアップグレードするのが最良の選択肢かもね~
あの性能と値段はわざわざ買ってまで欲しいものではない。
3000使っているなら3000でアップグレードは愚でしょう。
素直に実質5万ちょいで買える4060Tiか、実質7万円台で買える4070とか選ぶ方が普通に賢いと思う。AV1でも配信されてきている現状からも。
5000番台はハイエンドが2025年でミドルは2026年近くまで待つ必要がありそうでかなりまだ先であり、かつ5000は4000よりお高くなりそうな状況ですが。
元コメ投稿した者です。
その意見にも頷けるなぁ…確かに今まで大活躍だった3000番台もいつしか最先端の技術に追いつけなくなっているのは必然なわけだし。
ただゲームをし続けるグラボの寿命が5年前後として、そうなると技術が追い越す以前に先に買い替え時がくると思う
3000番台ユーザーについては、いつ買ったかにもよるけど、現状DLSSの対応範囲が安定していてハイエンドにもなれば4Kゲーミングも安心してできることにかなりのメリットがあると思ったんだよね
あとは、5000番台が出るころには(よほどの感染症流行や大規模戦争・大恐慌)が起こらない限りは&為替が改善されれば、4000番台の初販価格を下回ってくれるんだと勝手に期待しているのもある。
省電力云々に関しては、どうせPCゲームするならとそんなに気にしている人も実際は少なそうだし。
「前世代より確実に良くなっているけど、部分的にグレードダウンしている」4000番台を買うぐらいなら…ってのがやっぱり気持ちとして強いかな
3Dゲームに対してのグラボ性能はもう10年すれば頭打ちになるんかね…
今更録に値下げもしてない30xxに手を出したくはないのは同意
でも40xxがダメダメだから30xxを売り切れる前に買う方がマシかなぁ…
具体的には3080の12G
4070と4060tiは性能が欲しいシチュエーションだけ的確に息切れするし30xxからだとパワーダウンも見える
革ジャンは上から下まで生産停止で供給絞ってるしAMD側はAI需要で買い占めが始まりそうって話もあり円安も見えてる
これはもう2年くらい気絶しておきたい
4090Tiが発売中止(これは本当らしい)になって、4070と4060にテコ入れ(4070Tiと4070の間、4060Tiと4060の間?)があるって噂があるが・・・
4000番はどいつもこいつも腐ってやがるな
正統進化した5000番はよ
RTX 5000は順当に1.3倍以上目指してTSMC 3nmを使うならかなり不味い状況ではある。
理由はより数割もウェハ価格が高く、そのうえでイールドがかなり悪いらしいので。
GDDR7の採用も見送らないと不味そうなほど大幅なコスト上昇がもはや避けられない。
ミドルは128bit 8GBが主のままでしょうね。
あくまで早すぎるリーク情報ではあるけど、5000番台はフラグシップで512bitって話はあるね。
そうするとハイエンドで384bit、ミドルハイで256bit、ミドルローで192bitくらいは有り得そう。
まぁ今の段階のリーク情報に信用性なんか有ったもんじゃないけど、バス幅が見直されるらしいって話は前々からあるので、大なり小なり広げてはくると思う。
4000番台でバス幅による天井が見えたから余計に。
こんなネタ(ゴミ)グラボより4060のレビューやってほしい
だいたいは4060Ti以上に酷評されてるが、4万5千円切る値段を考えると割とありかなと思うが、実際のパフォーマンスを知りたい
4060も価格と性能のバランスを考えると悪くはないんだよね
VRAMが減らされたせいかAdobe系ソフトの一部ベンチが3060に負けてるっぽいからその辺使うなら要注意だろうけど今から買うなら4060でいいんでねっていう
そんなゴミ買うくらいなら3060(12GB)買うし
性能不満なら3060tiだし
マジで4000ゴミ
なんでもかんでもゴミゴミ言ってる人が一番のゴミってそれいち
投稿者批判するくらいなら4060ti褒めて言い返してやれよw
不快だと思うならコメ欄見るな
産廃扱いだった4070の引き立て役としては価値がありますね
むしろ4070以外がより・・・
いや何でもない
楽しく拝見させて貰いました、3070如きに敗北しまくるのは震えが止まりません
バス幅おそるべし
VRAM 8GBで足りないゲームもあるので、その場合は逆に2~3割速くかつカクつかない。
3070だけでなく場合によっては3080よりスムーズ。
3080よりスムーズって具体的になんのゲーム?
私が確認した限りそんなゲームないから知りたい
ってか10GB(or12GB)で足りないとか大半の人が困るゲームなんて特殊すぎる
価格差がすべてをぶち壊す感じですねぇ
8GB版に$50乗っけた程度ならまだ説得力あったんですがねぇ
たしかにそれ。
VRAM 8GBで足りない10~12GBでもギリギリのケースはあるので、RTXで16GBなのは一定価値需要が間違いなくある。
6万円で販売してたらバカ売れだったのにな
全て値段が悪いわ
今の為替で6万円となると赤字処分セールでもう製造しないってことになるが。
既に発売前から生産数を抑えているという噂もあるので価格は期待できない。
AIにも強いRTXでレアな16GBあるなら8万しても需要は変わらなくあるようにも思う。
バス幅が狭い所に無理矢理増量するんで、こうなるって予測されていた通りになってるね。
メモリ量が増えると普通は容量がっつり食う用途特化だと思うが、それがバス幅狭すぎ問題で性能伸びないものが出てくるっていう、誰得なんだか分からない16GB版になったし、価格は上位版が買えるレベルなんだから、ほんま要らない子になった。
12GBくらいでもう少し価格抑えられたらマシだったかもしれないけど、多分4GB落とした所でそんなにコスト変わらないだろうからなぁ。
円安と128bitな時点で終わってた。
8GBで足りない場合にしか16GB版の価値が発生しないだけでバス幅は関係ない。
足りない場面では1.2~1.5倍程度速いより精度高い検証結果も出てきている。
タ、タルコフ~~ッ!!
言語モデル使おうとするとモデル次第では16GBでないと動かない、というのは普通にありえますね。16GBでたりないことも当然ありますが、8とは全然違います。
自分は1080ti11gbで足りなかったので3060 12GBを2枚目にして合計23GBの環境でやってます。
メモリが必要になる場面はあまり多くはないですが、言語モデル用にメモリがっつり積んでいて、そこまで値の張らないものがあればまた購入検討したいなと思ってます。
グラボメモリの共有(拡張)は業務用のNVIDIA RTX やQuadro のSLI限定で、
GeForce系のSLIやDirectX12のマルチGPU機能のEMA などはメモリ自体は共有しないので増えないはずです。
一枚を画面表示用にする事で、もう一枚はメモリをフルでAIに使えますが、それでも11GBと12GBの組み合わせでは12GB以上は扱えないはずです。
AI系のベンチ時にVRAM Usageの統計量(中央値とか最大値とか)やバッチ数/iter数を一緒に出すことってできますか?
仮に設定ミスって8GB以下しかVRAMに載せられてなかったとしてもこうなるだろうなみたいなグラフでちょっと恐いので
記事を読んでいってUnreal Engine 5のグラフのところで、今まで疑問だった何故VRCで大人数になると本来性能がボトルネックになって越えられないはずの3060が3070に勝つことが出来たのか感覚的に理解できました。(FPSがその条件で言われていた数字と一致していたため)
ワールド中のテクスチャ等がVRAMに展開されてるような話は聞いたことがあったのでそれと合わせてです
過去の窃盗とか都合の悪いコメントは削除ですか?
機会学習ではバッチサイズ倍にすれば差が出ると思う。実施済み?反映済み?
タルコフの為に16GB版行こうか悩んでましたがなるほど 神検証ありがとうございます~~!!!!
いつも検証お疲れ様です。現在価格が下がって最安だと70000万を切っていますが、ちもろぐさん的には現在のコスパについてはどうお考えか聞いてみたいです。個人的にはAIもいじってみたいけどこれ以上のグレードのグラボは手が届かないって人にはいい選択肢になったのかなと思ってます。
実行に大量のVRAM食うLLMの類の検証もあったら嬉しいです
特に速度が重要になるコード補完とかその辺りの分野
現在ゲーム用途とAIの処理でGPU自体が2極化していると思います。
またAdobeLightroomのAIノイズ処理(高ISO撮影の写真革命ともいわれてます)でGPUベンチをとっている人が非常に少なくもし追加していただけると非常に助かります。
「AIイラストにおすすめなグラボをガチで検証」の記事ではSDXLを持ち出して「RTX 4060 Ti 16 GBは高解像度なAIイラスト生成に適したグラボです。最新のSDXL 1.0でフルHD~HD相当のネイティブ解像度でイラストを生成するなら、現状トップクラスのコストパフォーマンスを誇ります。」と書かれていたのに、こちらでは「AIイラスト目的ですらRTX 4060 Ti 16GB版は微妙なポジションです。」
たった数日でこの心変わりは一体?複数人で別々に記事を書かれていますか?
(こちらの記事では単にXLを取り上げていないだけで、XLやりたければ16GBいいよという結論自体は矛盾しないのだろうと受け止めてますが)
それと、SD1.5(512×512)の場合はベースモデルは512×512なのですが、Loraは必ずしかも同じ解像度とは限らず、画質を上げる為に960×960で学習する人も居ます。
SDXLも同様にベースモデルの解像度が1024×1024でも、Loraはそれよりも高い解像度な事があります。
この為、要求VRAMが多くなる場合が多く、生成だけする場合と学習もする場合では、必要なVRAMが異なって来るので、よく考える必要があります。
SD1.5 (512×512)とSDXL (1024×1024)では要求VRAMが全然違いますからね。
例えば、RTX3060 12GBで2048×2048でLora学習する場合は、精度をFP8に落としてUnetのみでBatch1にすればギリギリ可能です。
これがVRAM16GBあれば、UnetとTE両方同時に学習してもVRAMが溢れないなら大きな差があると言えるかもしれません。
VRAMが足りないと精度や解像度等を妥協して下げるしか無いです。(指先等が崩れやすくなります)
逆にあればある程精度や解像度を上げることが出来るので、24GBだろうが48GBだろうが、あっても使い切るように調整するだけです。
設定次第では96GBでも余裕で使い切れますね。
※1024×1024,FP8,Unet/TE,Batch4, 6000Steps,3時間
※2048×2048,FP8,Unet,Batch1, 6000Steps,12時間
https://i.imgur.com/ftFoAlk.png
これを購入するなら4070か値段が同じ7700購入した方が良いわ
性能変わらないどころかワットパフォーマンス悪化しててどうしようもない
いつも頭が下がる思いで拝見させて頂いてます。
今更感がハンパないですが、誰も指摘されて無い様ですので、
一応指摘させて頂きます。
「動画エンコード(NVEncなど)」なのですが、
何故かRTX 4070 Ti SUPERの内容になっていますよ。
今まで誰も気付かなかったとは思えないので、
初出から今までの間に、何らかの不具合で入れ替わってしまったのでしょうか?
お忙しいでしょうから、時間の空いた時にでも訂正なさってくれると助かります。
StableDiffusion使ったAIイラスト生成の場合VRAM12GBだと容量ギリギリで特定の処理や画像サイズ書き出しで失敗を頻出するんだよね
だから速度よりVRAM容量の大きいグラボを買う人はそれなりにいる