当ブログはWeb広告を導入しています（景表法による表示）

2025.08.24 グラフィックボード / GPU やかもち（管理人）

【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】

月額料金なし、検閲なし、枚数制限もなし。

無制限かつ自由にAIイラストを生成させるなら、Stable Diffusion XLやQwen Imageをパソコンで動かせる「ローカル版AIイラスト」が必要です。

しかし、ローカル版AIイラストはグラフィックボードも必須です。

VRAM容量が大量に欲しい
GeForceシリーズが絶対に良い
Radeonは玄人向けだから避けるべき

などなど、いろいろな情報が飛び交っていますが実際のところはどうなのか？

やかもち

グラフィックボードをなぜか40枚ほど所有している筆者が、実際にStable Diffusionを動かして徹底的に検証します。

（公開：2023/3/8 | 更新：2025/8/24）

この記事の目次

AIイラスト（Stable Diffusion）におすすめなグラボを検証

検証方法：AIイラストの生成速度をテストする

AIイラスト（SDXLやQwen Image）におすすめなグラフィックボードをテストする方法はシンプルです。

実際にAIイラストを何枚か生成させて、処理にかかった時間と生成速度を比較します。比較した中で、時間が短く速度が速いグラボほどおすすめだと分かります。

今回のStable Diffusionベンチマークでは、以下2つの数値を「性能」として扱います。

ログに表示される生成時間（Prompt executed）
ステップ数を生成時間で割った速度（Iterations per Second）

生成時間が一番分かりやすい指標です。生成ボタンをクリックしてから、完成したAIイラストが表示されるまでにかかった時間を示します。

イラストを10枚生成するのに60秒や120秒もかかるグラボより、10秒や20秒でサクッと終えられるグラボの方が高性能です。

生成速度（it/s）はもっぱらそこまで気にしなくていい指標です。ベンチマークオタクがグラボの性能を比較するときに役立つ程度で、基本的に「生成時間」に注目しましょう。

【もっと詳しく】生成「時間」と「速度」の違い

Iterations per Secondを略して「it/s」と呼ばれる、いわゆる生成速度ですが、誤解を招きやすい深刻な欠点があります。

AIイラスト生成は少なくとも5～6段階の工程がある、かなり複雑なワークフローです。モデルをロードし、指示内容（プロンプト）を読み、ノイズ画像を目的の画像に変換します。

このうち「生成速度（it/s）」が測定している範囲は、「データを生成する1工程」だけです。生成と同じくらい時間がかかる場合も多々ある「データを画像に戻す工程」が含まれません。

専門用語で「VAEデコード」と呼ばれる処理で、フルHDや4K解像度のイラストを生成させると、意外にもデータ生成と同じか以上の時間がかかってしまいます。

しかし、どれだけ時間がかかっても生成速度（it/s）に一切含まれないため、非常に誤解を招きやすい指標です。

速度が速いのに一向に画像が出てこない･･･なんてグラボを買いたくないですよね？

結論、「生成時間（秒）」を参考にしてください。

なお、本ブログに掲載する生成速度（it/s）は、合計ステップ数を生成時間で割ったオリジナル指標です。VAEデコードも含めた生成速度なので、実態に近い数値を出せます。

テスト環境：使用したグラボとPCスペックを紹介

テスト環境「ちもろぐ専用ベンチ機（2025）」
スペック	NVIDIA GeForce	AMD Radeon	Intel ARC
CPU	Ryzen 7 9800X3D（レビュー）
マザーボード	ASUS TUF GAMING X670E-PLUS WIFI
メモリ	DDR5-5600 128GB（64GB 2枚組） → Crucial Pro DDR5-5600
グラボ全40枚	RTX 5090 32GB RTX 5080 16GB RTX 5070 Ti 16GB RTX 5070 12GB RTX 5060 Ti 16GB RTX 5060 Ti 8GB RTX 5060 8GB RTX 4090 24GB RTX 4080 SUPER 16GB RTX 4070 Ti SUPER 16GB RTX 4070 Ti 12GB RTX 4070 SUPER 12GB RTX 4070 12GB RTX 4060 Ti 16GB RTX 4060 Ti 8GB RTX 4060 8GB RTX 3090 24GB RTX 3080 10GB RTX 3070 8GB RTX 3060 12GB RTX 3050 8GB RTX 2080 Ti 11GB RTX 2070 SUPER 8GB RTX 2060 SUPER 8GB RTX 2060 12GB GTX 1660 SUPER 6GB GTX 1650 G6 4GB GTX 1080 Ti 11GB GTX 1070 Ti 8GB GTX 1060 6GB GTX 1050 Ti 4GB	RX 9070 XT 16GB RX 9070 16GB RX 7900 XTX 24GB RX 7800 XT 16GB RX 7700 XT 12GB RX 7600 XT 16GB RX 9060 XT 16GB	Arc B580 12GB Arc A770 16GB
SSD データ置き場	WD Black SN850X 8TB → 8 TB版レビューはこちら
OS	Windows 11 Pro （24H2）
生成ソフト	ComfyUI v0.3.50 pytorch 2.7.1 + cu128	ComfyUI v0.3.51 pytorch 2.6.0 + rocm6.4.2	ComfyUI v0.3.51 pytorch 2.9.0 + xpu
ドライバ	Game Ready 580.88 WHQL	Adrenalin 25.6.3 WHQL	Intel Graphics 32.0.101.6989
ライブラリ	NVIDIA CUDA	AMD ROCm PyTorch for ROCm 6.4.2	Intel XPU Intel Extension for PyTorch

今回のStable Diffusion（SDXLやQwen Image含む）ベンチマークで使用するテスト機のPCスペックです。

CPUにRyzen 7 9800X3D（8コア16スレッド）、メモリにDDR5-5600（JEDEC準拠）を容量128 GBたっぷり搭載しました。

テストに使用したグラフィックボードは全部で40枚（GeForce：31枚 + Radeon：7枚 + Intel ARC：2枚）です。

約50枚ほどグラボを検証用に所有していますが、時間の都合で古い世代を見送っています。

やかもち

40枚もあればベンチマークとして性能を比較するのに十分な量です。

【グラボ別】AIイラスト（Stable Diffusion）の生成速度

目次：ベンチマーク結果

512×512：ハローアスカベンチマーク
832×1216：神里綾華ベンチマーク
832×1216：神里綾華（10バッチ）ベンチマーク
832 x 1216：神里綾華（ControlNet）ベンチマーク
1664 x 2432：ヘルタ（Hires.Fix）ベンチマーク
3840 x 2160：ヘルタ4K（Hires.Fix）ベンチマーク
832 x 1216：Qwen Imageベンチマーク

全7種類のベンチマークで生成時間（秒）と生成速度（it/s）を比較します。

テストごとに使用したモデルやプロンプト、細かい設定やシード値はそれぞれのテストごとに記載します。テストごとに、ComfyUIで使えるテンプレート（workflow）も配布します。

注意点：生成結果の「再現性」はまちまち･･･

省VRAM化に特化した生成ソフト「ComfyUI」と「ReForge」が主流になり、計算負荷を下げて処理速度を向上する時代に切り替わっています。

結果的に、計算負荷が非常に重かった初代「A1111 Web UI」と比較して、同じプロンプトや設定に対する生成結果の「再現性」が下がりました。

そもそもForge版が登場した時点で、A1111版と比較して生成品質に違和感を覚えた人は決して少なくないはず。計算を端折る「高速化」「効率化」技術は往々にして、品質や再現性をわずかに捨てている傾向です。

Stable Diffusionの起動オプションはこちら

Stable Diffusion 起動オプション「Stability Matrix」の引数
GeForce RTX 30～50シリーズ	`--fast --use-sage-attention`

Stability Matrixから設定できる「Launch Options」を、グラフィックボードの仕様に合わせて調整します。

GeForceシリーズは基本的な高速化オプション「--fast」と「--use-sage-attention」を入れて、わずかな品質低下と引き換えに約15～20%程度の高速化です。

GeForce RTX 20シリーズ	`--fast`
GeForce GTX 16xxシリーズ GTX 10xxシリーズ	`--fast --lowvram`

RTX 20シリーズ以前の場合、Sage Attention有効化でかえって生成速度が大幅に悪化するので、sageオプションのみ削除します。

VRAM容量に余裕がないGTX 16xxシリーズは、メインメモリの利用比率を増やす「--lowvram」オプションを追加します。

GTX 10xxシリーズも同じく「--lowvram」オプションを入れています。律儀にFP32演算で処理するせいか、異様にVRAM使用量が多いので苦肉の策です。

速度を犠牲にメインメモリを活用するLOW_VRAMモードですが、そもそもVRAM容量が少ないグラボなら、むしろ安定して動作する傾向です。

AMD Radeon RX 9000シリーズ RX 7000シリーズ	`--use-sage-attention --bf16-vae --disable-xformers`

AMD Radeonシリーズは、処理速度を向上させる「--use-sage-attention」と、一部のVAE処理を安定化させる「--bf16-vae」も併用します。

Intel ARC A / Bシリーズ	`--normalvram --bf16-unet`

Intel ARCの場合、なぜかVRAM比率に関係するオプションがまったく効果を示さなかったので、諦めて「--normalvram」をそのまま使います。

「--bf16-unet」は、生成品質をほんの少しだけ捨てて、代わりに動作の安定性を向上させるオプションです。

あの有名な「–xformers」は入れないの？

やかもち

ComfyUIはデフォルトでxformersが入ってるから問題なし。ちなみに「–xformers」をわざわざ引数で書き込むと、ComfyUIが起動しなかったです。

テストに使用した生成AIソフトはこちら

テストに使用した生成AIソフト
GeForce用	ComfyUI（Stability Matrix）（https://lykos.ai/）
Radeon用	ComfyUI（Stability Matrix）（https://lykos.ai/）
Intel Arc用	ComfyUI（Intel XPU）（https://github.com/ai-joe-git/ComfyUI-Intel-Arc-Clean-Install-Windows-venv-XPU-）

パッケージ管理システムを「Stability Matrix」に、Stable DiffusionやSDXLなどAI生成を実行するソフトを「ComfyUI」に一本化します。

豊富な人材と資金に恵まれ、長年にわたってサービスが続く可能性がもっとも高いです。

動画生成モデル「Wan2.2」や、画像生成モデル「Qwen Image」や「Qwen Image Edit」など、最新技術へのネイティブ対応も他に類を見ない最速級。

PyTorchやSage Attention（Triton）など、各種ライブラリの対応も非常に早くて助かります。以前、Web UI系がなかなかRTX 50シリーズに対応しない中、ComfyUIはわずか7日で対応していました。

あの早さを見て以降、ComfyUIに乗り換え確定です。わざわざ「pip install ～」から始まる面倒で複雑な呪文を唱える必要もありません。

もちろん、Web UI系に匹敵する大量の拡張プラグインも存在していて、自分の好みに合わせて使い方を最適化しやすいです。

テンプレートファイル（ワークフロー）をComfyUIに放り込むだけで設定値をキレイに再現できる仕様があり、正確なベンチマークに使いやすい利点もあります。

なお、以前のテストで使っていた「AUTOMATIC1111版」と、lllyasviel氏が開発した「Forge版」はどちらもサポート終了済みです。

やかもち

A1111とForgeは個人制作（ほぼボランティア）のソフトです。特にA1111の功績は偉大でした。今まで更新してくれてありがとうございます。

512×512：ハローアスカベンチマーク

「Hello Asuka Benchmark」の設定はこちら

生成モデル：nai-anime-v1-full.safetensors
（https://huggingface.co/TechnoByte/nai-furry-anime-safetensors/）

プロンプト（呪文）設定
Positive	`masterpiece, best quality, masterpiece, asuka langley sitting cross legged on a chair`
Negative	`lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts,signature, watermark, username, blurry, artist name`
各種設定
sampling method	Euler	sampling steps	28
Width	512	Batch count	1
Height	512	Batch size	10
CFG Scale			12
Seed			2870305590

ComfyUI用
ワークフローをダウンロード

「ハローアスカベンチマーク（Hello Asuka Benchmark）」は、日本のとある生成AI系Wikiで考案された、伝統的なStable Diffusionの定番ベンチマークです。

いにしえの「SD 1.5」モデルをベンチマークに使うため、2025年の今となっては処理が軽すぎて参考にしづらいです。

しいてメリットを挙げるなら、VRAM容量に引っかかる可能性がほとんどない性質から、グラボ本来の純粋なAI生成性能（計算性能）を比較できます。

（※クリックすると画像拡大）

ハローアスカベンチマーク（512 x 512）の生成時間（秒）をグラボ別に比較したグラフです。

最強クラスのRTX 5090～RTX 4090は、なんと4秒台を記録します。1枚あたり、たった0.3～0.4秒でハローアスカを生成します。

定番グラボのRTX 5070なら10秒、1枚あたり1秒で生成でき、RTX 5060 TiやIntel ARC B580は1枚あたり1.5秒前後です。

全体的な傾向をざっくり見ると、RTX 50～40シリーズがやはり猛威をふるい、Intel ARCシリーズがコスパ面でポテンシャルを感じる結果に。

一方で生成AIが不得意とされるRadeonシリーズですが、Windows版ROCmの最適化が進んだおかげで以前より速度が早く改善されています。

特にRX 7000シリーズがおおむねスペック値に近い性能を出せています。RX 9000シリーズはまだまだ最適化不足で、今後のベンチマーク結果に暗雲が立ち込めています。

（※クリックすると画像拡大）

生成速度（1秒あたりステップ数）の比較グラフです。

ハローアスカを細かく分析しても、あまり意味がないので傾向をざっくり要約します。

Intel ARCにポテンシャルあり
Radeonは全体的に不調気味
GeForceの安定感

負荷の軽いハローアスカベンチの傾向です。

次からもっと重たい生成モデルや、大きな解像度で性能がどう変化していくか、順番に見ていきます。

832×1216：神里綾華ベンチマーク

「Ayaka XL Benchmark」の設定はこちら

生成モデル：WAI-NSFW-illustrious-SDXL v14.0
（https://civitai.com/models/827184）

プロンプト（呪文）設定
Positive	`1girl, kamisato ayaka, \(chainsaw man\), ponytail, kimono, floral print, japanese clothes, head tilt, holding weapon, katana, violent theme, half-closed eyes, bored, glowing eyes, loose collar, light smile, yandere, maniac, adjusting clothes, moonlight, light rays, Falling petals, anime coloring, masterpiece, best quality, amazing quality,`
Negative	`chiaroscuro, 3d, bad quality, worst quality, worst detail, sketch, censor,`
各種設定
sampling method	Euler	sampling steps	28
Width	832	Batch count	10
Height	1216	Batch size	1
CFG Scale			5
Seed			20210932

ComfyUI用
ワークフローをダウンロード

ここからは筆者が作成したオリジナルベンチマークで、AIイラストの生成時間を比較します。

圧倒的な支持を得ている大人気生成モデル「WAI-NSFW（v14.0）」を使って、特定のキャラクター（原神より：神里綾華）を生成するベンチマークです。

SDXL世代でもっとも主流な解像度「832 x 1216」を検証します。ベースモデルが「SDXL 1.0」に切り替わり、解像度も大きくなったから、ハローアスカベンチより約6～8倍も重たいです。

（※クリックすると画像拡大）

生成時間（秒数）の比較ベンチマークです。5枚ほど連続で生成させて、1枚あたりの平均時間を比較しています。

RTX 5090がわずか2.5秒で1枚生成する驚異的な速さですが、正直なところRTX 4090と体感性能が変わらないです。

5秒台を出せているRTX 5070やRTX 5070 Tiでも、十分に速いと感じる人がおそらく多い予感もします。

許容できる時間は人それぞれなので、処理時間ごとに区切った中でコスパがいいグラボを選べば問題ないです。

リアルタイム生成：RTX 4090
5秒前後：RTX 5070
10秒前後：RTX 5060 Ti
（またはIntel ARC B580）
15秒台：未だにRTX 3060 12GB

といった具合で、基本的にRTX 50シリーズから選びます。

（※クリックすると画像拡大）

生成速度（1秒あたりステップ数）の比較グラフです。

単純なコストパフォーマンスで見ると、Intel ARC B580が異色の強さを見せています。RTX 5060 Tiに迫る生成速度を、4万円台で出せています。

逆にRadeonシリーズが軒並み不調です。Windows版ROCmが登場して以前より高速化したものの、同時にGeForceも最適化が進んでいて性能差を埋められない構図に。

RX 7900 XTXでようやくRTX 4070に並びます。Intel ARCにコスパで敗れ、GeForceに性能で勝てない、見慣れたいつもの光景が眼前に広がります。

VRAM容量を大量に食っていたA1111版であれば、VRAM容量の割に価格が安いRadeonに一定の優位性がありました。

しかし、現在主流のComfyUI（ReForge）は本当に省VRAM化が進化していて、SDXL推奨サイズ（832 x 1216）を生成するくらいなら容量8 GBで十分です。

技術の進歩で相対的に大容量VRAMのニーズが薄れ、ほどほどのVRAM容量で処理速度が速いGeForceやIntel ARCが優位な状況です。

832×1216：神里綾華（x10）ベンチマーク

「Ayaka XL x10 Benchmark」の設定はこちら

プロンプト（呪文）設定
Positive	1girl, kamisato ayaka, \(chainsaw man\), ponytail, kimono, floral print, japanese clothes, head tilt, holding weapon, katana, violent theme, half-closed eyes, bored, glowing eyes, loose collar, light smile, yandere, maniac, adjusting clothes, moonlight, light rays, Falling petals, anime coloring, masterpiece, best quality, amazing quality,
Negative	chiaroscuro, 3d, bad quality, worst quality, worst detail, sketch, censor,
各種設定
sampling method	Euler	sampling steps	28
Width	832	Batch count	1
Height	1216	Batch size	10
CFG Scale			5
Seed			20210932

ワークフローの配布はありません。Ayaka XL Benchmarkのバッチサイズを10に変更して実行するだけです。

コメント欄でまれにリクエストがあった、バッチサイズ：10のベンチマークです。

batch count：1枚ずつ繰り返し生成
batch size：一度に複数まとめて生成

バッチカウント（count）が連続キュー処理に対して、バッチサイズ（size）は並列スレッド処理です。並列処理は大量にVRAMを消費するため、VRAMの容量と利用効率が求められます。

（※クリックすると画像拡大）

生成時間（秒数）の比較ベンチマークです。

連続して10枚生成するより、一度にまとめて10枚生成させた方が効率よく性能を伸ばせます。

今回のベンチマークをざっくり見る限り、SDXL 1.0の推奨サイズ（832 x 1216）をまとめて10枚生成する程度なら、ほとんどのグラボが連続処理より高速化します。

VRAMが少ないRTX 5060ですら、1枚ずつ出すより5～10枚まとめて出したほうが速いです。

ComfyUI（ReForge）の省VRAM技術が進化したおかげで、VRAM容量がボトルネックになりづらい傾向が明らかです。ある程度のVRAMがあれば、単なる性能比較になります。

（※クリックすると画像拡大）

生成速度（1秒あたりステップ数）の比較グラフです。

処理が軽すぎるのか、RTX 5090がイマイチ伸びません。RTX 4090から価格相応の伸びにとどまります。

RTX 5070は従来世代より約1.3倍近い性能アップを実現していて、7～8万円クラスで最高のコストパフォーマンスに。

しかし、Intel ARC B580が番狂わせな性能を見せます。約4万円台の低価格ながら、RTX 4070に迫る性能で、RTX 5070に対して2割ほど遅いだけです。

主流のSDXL 1.0系モデル（WAI NSFWなど）をコスパよく動かすなら、Intel ARC B580がコスパ最強格。もちろん、初心者にはRTX 5070やRTX 5060をおすすめします。

やかもち

Intel ARC B580がゲームでもAI性能と同じくらい高性能だったら、本当にコスパ最強でした。ゲームも含めるとRTX 50シリーズに抗えない･･･。

832×1216：神里綾華（ControlNet）ベンチマーク

「Ayaka XL ControlNet Benchmark」の設定はこちら

プロンプト（呪文）設定
Positive	`1girl, kamisato ayaka, \(chainsaw man\), looking at viewer, ponytail, ryougi shiki, leather jacket, japanese clothes, kimono, neon genesis evangelion, head tilt, holding weapon, katana, glowing eyes, naughty face, light smile, neon lights, neon palette, cityscape, science fiction, cyberpunk, looking_back, masterpiece,best quality,amazing quality,`
Negative	`3d, bad quality,worst quality,worst detail,sketch,censor,`
各種設定
sampling method	Euler	sampling steps	28
Width	832	Batch count	1
Height	1216	Batch size	5
CFG Scale			5
Seed			20210932
ControlNet設定
Image
Weright	0.60	Model	CN-anytest_v4-marged.safetensors https://huggingface.co/2vXpSwA7/iroiro-lora/blob/main/test_controlnet2/

ComfyUI用
ワークフローをダウンロード
ControlNet用
参照画像をダウンロード

「ControlNet」モデルを適用すると、狙った構図やポーズを決めてAIイラストを生成可能です。

万能タイプのControlNetモデル「AnyTest v4」を用いて、中央にいるキャラクターを維持したまま、背景やライティング（照明効果）だけを書き換えます。

生成速度がやや下がるものの、目的の構図やポージングを高い確率で生成でき、時間を節約できる技術です。

やかもち

プロンプト（指示内容）に合わせて書き換えできます。背景や光源だけでなく、着ている服もチェンジ可能。いわゆる「差分」を作るのに便利です。

（※クリックすると画像拡大）

生成時間（秒数）の比較ベンチマークです。まとめて5枚生成するのにかかった時間を比較します。

ControlNetモデルの適用でVRAM使用量が増え、一部のグラボで大きく性能が下がります。Radeonシリーズも全体的に大きく速度を落とし、グラフの下の方へ追いやられます。

1枚あたり10秒：RTX 5060 Ti 16GB
1枚あたり6秒台：RTX 5070
1枚あたり5秒切：RTX 5080

ControlNetモデルを使う前提なら、もっぱらRTX 50～40シリーズから予算に合わせて選ぶしかない状況です。

（※クリックすると画像拡大）

生成速度（1秒あたりステップ数）の比較グラフです。

RTX 5090が毎秒10ステップを叩き出し、RTX 4090と比較して約1.5倍に達します。重たい処理になればなるほど、巨大なシェーダーユニットを備えるRTX 5090が有利になります。

コスパ部門のエースはやはりRTX 5070です。約7～8万円の安い価格なのに、10万円を軽く超えるRTX 4070 Ti前後に食いつく性能です。

期待の隠れコスパ枠だったIntel ARC B580は残念ながらVRAM不足で大きく速度を落としてしまい、RTX 3050と大差ない性能に終わります。

Radeon勢･･･、特にコメントはないです。

やかもち

「ControlNet」モデルの処理性能は完全にRTX 50～40シリーズの独壇場です。他社陣営に勝てる見込みなし。

1664×2432：ヘルタ（Hires.Fix）ベンチマーク

「Helta Hires.Fix Benchmark」の設定はこちら

プロンプト（呪文）設定
Positive	`the herta (honkai star rail), \(chainsaw man\), looking at viewer, 1girl, adult, teacher, mature female, medium breasts, violent theme, glowing eyes, light smile, BREAK ponytail, long hair, glaring, best quality, amazing quality, dynamic angle, dynamic pose, arm support, pencil skirt, belt, black pantyhose, collared shirt, (button gap:0.64), sleeves rolled up, book, holding, desk, feet out of frame, collarbone, nail polish, jewelry,`
Negative	`chiaroscuro, 3d, bad quality,worst quality,worst detail,sketch,censor,`
各種設定
sampling method	Euler	sampling steps	28
Width	832	Batch count	1
Height	1216	Batch size	5
CFG Scale			5
Seed			20250145
Hires.Fix設定（Tiles Diffusion）
upscale	x0.5（=2倍）	sampling steps	7
upscaler	4xUltrasharp_V10	strength	0.50
ControlNet	illustriousXL_tile_v2.5	start – end	0 ～ 0.5

ComfyUI用
ワークフローをダウンロード

WQHD以上のネイティブ高解像度（1664 x 2432）なAIイラストをベンチマークします。

ローカル生成ユーザー的にあまり需要がない解像度に見えて、「#desksetup」界隈で意外な人気を集めています。

しかし、高解像度に最適化されたSDXL 1.0モデルですら、フルHD以上の解像度を出力されると解剖学の崩壊や奇形的な肉体が頻発します。

人体の崩壊を防ぎつつ、高解像度なAIイラスト生成に役立つ機能が「Hires.Fix」です。

ComfyUI（ReForge）が主流になった今風な言い方をすると、おそらく「Tiled Diffusion」や「ControlNet Tile」と呼ばれています。

今回はアップスケーラーに「4xUltrasharp_V10」、アップスケール倍率に「0.5（= 4.0 x 0.5 → 2.0倍）」、ノイズ除去の強さを「0.5」に設定して1664 x 2432サイズの高解像度イラストを生成します。

細部の破綻を防ぎつつ、シャープさやディティールを追加で書き込むControlNetモデル「Tile（IllusriousXL版）」を併用し、ステップ0～50%に範囲で適用します。

省VRAM技術「Tiled VAE Encode & Decord」

なお、Tiled Diffusionは省VRAM技術「Tiled VAE」に対応しますが、今回のベンチマークはタイル分割サイズ数をなるべく大きく設定します。

分割タイル数を増やすほど少ないVRAM容量でテストを突破可能ですが、肝心の品質が大幅に劣化し、かえって奇形化を招く要因に。

よって、VRAM容量に応じて最低1024 px以上の範囲でタイルサイズを調整します。512 px前後だと、見てのとおり破綻がひどく使いづらいので避けます。

（※クリックすると画像拡大）

生成時間（秒数）の比較ベンチマークです。

WQHD相当の大きなイラストを生成している割に、VRAM容量をそれほど要求されず、意外と生成時間が短い印象を受けます。

VRAM容量がたった8 GBしかない「RTX 5060」程度でも、1664 x 2432の生成を1枚45秒ちょっとで終えています。

分割タイルサイズをいい塩梅に調整さえすれば、容量8～12 GBのVRAMですんなり生成可能です。生成品質をギリギリ維持できる1024 ～ 1280 px分割まで耐えられます。

VRAM容量に収まる状態なら、もうシンプルにグラボの性能比較です。

たとえばRX 7900 XTXは約50秒でなかなか悪くないように見えて、Intel ARC B580やRTX 5060よりも遅いです。RX 7900 XTXより安いRTX 5070は時間が半減します。

やかもち

省VRAM技術（分割VAE）が発展した結果、値段の割にVRAM容量が多いRadeonの優位性が骨抜きに。GeForceが強いのは当然として、Intel ARCにすら負ける始末。

（※クリックすると画像拡大）

生成速度（1秒あたりステップ数）の比較グラフです。

VRAM容量が足りる状況でも、Radeonシリーズが全体的に不調に終わり、GeForceシリーズが圧巻の成績を収めます。

Intel ARCシリーズも意外な活躍を見せていますが、GeForceよりVRAMの使用量がやや多く、容量12 GBでようやく8 GB相当の仕事をこなすイメージです。

なお、世代間の妙な逆転劇はおおむねPCIe x8で説明できます。たとえば、RTX 3060 TiとRTX 4060 Tiが分かりやすい例です。

ComfyUIはVRAMとメインメモリを何度か行き来する挙動があるせいで、PCIeバス幅にやや敏感です。だからPCIe x16をx8に減らされるとボトルネックになります。

やかもち

「Hires.Fix」もずいぶんと軽くなって、RTX 5060程度で1600 x 2400 pxものイラストを生成できます。省VRAM技術の進化がすごい。

3840×2160：ヘルタ4K（Hires.Fix）ベンチマーク

「Helta 4K Hires.Fix Benchmark」の設定はこちら

プロンプト（呪文）設定
Positive	`the herta (honkai star rail), long hair, medium breasts, \(chainsaw man\), violent theme, looking at another, dress, ruan mei (honkai star rail), hair ornament, 2girls, glaring, adalt, mature female, armpitsm, staff, jewelry, fingernails, eyelashes, dynamic angle, facing another, magic circle, clock tower, night sky, outdoors, best quality, amazing quality,`
Negative	`chiaroscuro, 3d, bad quality,worst quality,worst detail,sketch,censor,`
各種設定
sampling method	Euler	sampling steps	28
Width	1920	Batch count	1
Height	1080	Batch size	1
CFG Scale			5
Seed			20250122
Hires.Fix設定（Tiles Diffusion）
upscale	x0.5（=2倍）	sampling steps	12
upscaler	4xUltrasharp_V10	strength	0.50
ControlNet	illustriousXL_tile_v2.5	start – end	0 ～ 0.5

ComfyUI用
ワークフローをダウンロード

SDXLベンチマークで使っている生成モデル「WAI-NSFW（v14.0）」は、ネイティブ高解像度の耐性が高いです。

the herta (honkai star rail), ruan mei (honkai star rail), 2girls,

若干ガチャ率が上がりますが、フルHD（1920 x 1080）程度なら意外と崩れず生成できるし、複数のキャラクターを同時に生成できます。

Hires.Fix（Tiled Diffusion）を使って、フルHDから一気に4K解像度（3840 x 2160）にアップスケーリングします。

とにかくVRAM容量を激しく要求される高難易度なSDXLベンチマークです。

（※クリックすると画像拡大）

生成時間（秒数）の比較ベンチマークです。

･･･まず、Radeonシリーズが全滅しました。分割タイルサイズを768 pxまで下げても、体感90%の確率で「miopenStatusUnknownError」で処理が止まります。

（4K出力に耐えられないRadeon）

現状のRadeon（ROCm）だとHires.Fixで4K解像度を生成できないです。4K解像度のイラストを生成するなら、GeForceかIntel ARCの2択です。

特にRTX 50シリーズがやはり優秀。PCIe 5.0 x16対応によりComfyUIと根本的に相性がいいし、VRAMも効率よく使ってくれて、動作の安定性も驚異的。

コスパで「RTX 5070」を、予算をもっと抑えるなら「RTX 5060 Ti 16GB」をおすすめします。

やかもち

Intel ARC B580も悪くない選択肢に見えるけど、VRAMの食い方が明らかに大きいです。タイルサイズと品質のバランスがちょっと難しい気がします。

（※クリックすると画像拡大）

生成速度（1秒あたりステップ数）の比較グラフです。

RTX 5090が別格すぎて敵なしの状況。RTX 4090に対して約1.5倍もの生成速度※を叩き出し、価格に見合う性能差をきっちり見せています。

約8万円で買えるRTX 5070はコスパの華です。しかし、半額近い4万円台で買えるIntel ARC B580の誘惑もなかなか強烈かも･･･。

タスクマネージャーから共有メモリの漏れ具合を見ながら、自分で分割タイル設定を適切にこなせる前提なら、Intel ARCが少なくとも選択肢に入ってくるでしょう。

※補足：VRAM容量が多いほど、タイル分割数を減らして処理速度を向上できます。RTX 5090は容量32 GBもの巨大VRAMだから、4K解像度をシングルタイル（1×1）で処理可能です。RTX 4090は最低でも2タイル（2×1）使う必要があり、処理速度でRTX 5090に勝てないです。

やかもち

GeForceの強さは常識かつ当然で驚く余地がない一方、Intel ARC B580の妙な強さにびっくりです。4万円台に見合わない生成AI性能を発揮してます。

832×1216：Qwen Image Q3ベンチマーク

「Qwen Image Q3 Benchmark」の設定はこちら

生成モデル：Qwen_Image-Q3_K_M.gguf
（https://huggingface.co/QuantStack/Qwen-Image-GGUF/）
翻訳モデル：Qwen2-VL-7B-Instruct-Q3_K_M.gguf
（https://huggingface.co/tensorblock/Qwen2-VL-7B-Instruct-GGUF/）

プロンプト（呪文）設定
Positive	Create a semi-realistic anime scene of a beautiful teenage girl holding up a graphics card to the camera. There are two cooling fans for the graphics board. Context: In the dimly lit back streets of New York State, where there are few streetlights, illegal transactions take place. Behind them are two muscular black men wearing tank tops, one on the left and one on the right. The tank top of the man on the left reads “Qwen,” and the tank top of the man on the right reads “Benchmark". Characters: The beautiful teenage girl holds the graphics card in both hands with an urgent expression and presents it to the camera. The girl looks Japanese, with brown eyes, straight black hair, and a red hair accessory holding her hair in a ponytail. She wears a cross earring in her right ear. She has green nail polish on the fingertips of her left hand and red nail polish on the fingertips of her right hand. Lighting: The overall atmosphere is dim, but a ray of light faintly illuminates the beautiful girl's face. The graphics board is also illuminated by a ray of light, sparkling and reflecting.
Negative
各種設定
sampling method	Euler	sampling steps	8
Width	832	Batch count	1
Height	1216	Batch size	1
CFG Scale			1
Seed			1050008

ComfyUI用
ワークフローをダウンロード

中国アリババから公開された、最新世代の画像生成モデル「Qwen Image」を軽量化した「Q3_K_M」版をテストします。

現在主流の「SDXL 1.0」世代は3.5億パラメータ（3.5B）ですが、「Qwen Image」は約7倍近い20.0億パラメータ（20B）を誇る超巨大モデルです。

自然言語を正確に理解する驚異的なプロンプト追従性と、英語と中国語をほぼ間違いなく描写するテキスト生成能力を備えます。

たとえば

「グラフィックボードの闇取引をします。ニューヨークの物騒な感じ。背後にタンクトップを着た黒人を2名配置し、左の男に"Qwen"、右の男に"Benchmark"と英語で書いてください。中央にグラフィックボードを差し出す日本風アニメ美少女を配置してください。持ってるグラボはデュアルファンモデルです。美少女の左手に緑色のマニキュア、右手に赤色のマニキュアを塗ってください。」

などなど、長ったらしい自然言語をおおむね理解して、かなり正確に生成可能です。

当然ながら、これほどの性能を出すためにモデル本体だけで約41 GBにもなる巨大サイズで、RTX 5090にすら収納できません。

一般的なコンシューマ向けグラボでQwen Imageを扱うには、生成品質をなるべく維持しつつ、サイズをシュリンクさせた量子化モデルの出番です。

今のところ、Qwen Imageに対応した分割タイルモードが見当たらないので、そこそこ軽量で精度もいい「Q3_K_M」版でベンチマークします。

（※クリックすると画像拡大）

生成時間（秒数）の比較ベンチマークです。

生成サイズ（832 x 1216）の割に、負荷が妙に重たい傾向です。1枚あたり10秒を切ったグラボがRTX 5090のみ。

RTX 4090以下は揃いも揃って10秒すら切れません。生成モデルだけでなく、翻訳モデル（テキストエンコーダー）も処理するせいで、SDXL 1.0よりずっと時間がかかります。

Radeonに対して一貫して強かったIntel ARCも、Qwen Imageを相手にすると苦戦気味。しかも、VRAMから少しでも漏れれば、まともに動作できません。

少ないVRAM容量でやり繰りする能力において、GeForceがやはり猛威をふるいます。

VRAM容量が8 GBしかないRTX 5060ですら、2倍のVRAMを持つARC B580やRX 9060 XTにダブルスコア（約2倍）の性能差を叩き出します。

Q3_K_M版：RTX 5060以上
Q4クラス：RTX 5070以上
Q6～Q8版：RTX 5060 Ti 16GB以上

Qwen Imageはまだ分割VAEエンコードを使えないため、基本的にVRAM容量がモノをいいます。サイズが大きい量子化モデルほど、要求されるVRAM容量も増えます。

やかもち

結局「5060 Ti 16GB」や「5070」あたりがおすすめに･･･、Radeonはコスパがイマイチ、Intel ARCは現状Qwenで使い物にならないです。

（※クリックすると画像拡大）

生成速度（1秒あたりステップ数）の比較グラフです。

RTX 5090がRTX 4090に対して約1.6倍もの生成速度を記録します。両者の最安価格に約1.3倍の開きがあるから、見事にコストパフォーマンスの逆転が起こっています。

単純なコスパならRTX 5070が強いです。PCIe 5.0バス（最大32 GT/s）に支えられ、計算性能でやや負けているはずのRTX 4070 Tiを上回る性能を維持します。

VRAMが不足しやすい環境下において、ComfyUIはVRAMとメインメモリをうまく使います。しかし、メインメモリに移動するときにPCIeバスを通過するため、PCIe帯域幅がモロに効いてる傾向です。

RTX 5070以上：PCIe 5.0 x16（最大32 GT/s）
RTX 4070以上：PCIe 4.0 x16（最大16 GT/s）

帯域幅はなんと2倍です。

Qwen Imageなど、生成モデル + 翻訳モデルを必要とする巨大モデルを使うなら、なるべく新しいバス規格（Gen5以降）のグラボをおすすめしたいです。

やかもち

Qwen Imageは二次元に弱いから、今後の強化学習モデルに期待してます。Qwenをベースにした次世代「Pony」や「NoobAI」が出たら、ようやく次世代への大移動が始まる予感。

今回のベンチマーク調査で、SD 1.5世代からSDXL 1.0世代の複合的な処理、そして最新世代Qwen Imageまで。パターン別の画像AI生成性能が判明しました。

では、難易度の高いベンチマークを中心にコストパフォーマンスを計算して、「AIイラストにおすすめなグラボ」を絞り込みます。

（※クリックすると画像拡大）

Radeonシリーズは議論の余地なく論外です。Intel ARCシリーズも悪くない戦いぶりでしたが、VRAM不足とPCIe x8が災いして今ひとつな結果に。

結局、欲しい性能や予算に合わせて、RTX 50シリーズから選ぶだけです。

「Speed C/P」の中身について

832×1216：神里綾華（10バッチ）ベンチマーク
832 x 1216：神里綾華（ControlNet）ベンチマーク
1664 x 2432：ヘルタ（Hires.Fix）ベンチマーク
3840 x 2160：ヘルタ4K（Hires.Fix）ベンチマーク
832 x 1216：Qwen Imageベンチマーク

以上のベンチマークで取得した「生成速度（it/s）」を、まとめて幾何平均（Geomaen）に変換して、レビュー時点で入手可能な新品価格で割ってコスパを求めます。

生成速度の幾何平均 / 新品価格 = コスパ

支払った金額あたりの生成速度が高いグラボほど、コストパフォーマンスが良好です。

VRAM容量が考慮されていないのでは？･･･もちろん、VRAM容量もすでに織り込み済み。重量級の4K Hires.FixやQwen Imageをきちんと幾何平均の中に含まれます。

逆にVRAMがほとんど関係ないハローアスカや連続キューテスト（1 x 10 batch）を、幾何平均から省いています。ComfyUIの巧みな省VRAM性に支えられ、以前よりVRAM容量による性能差が出づらい傾向です。

RTX 3060 12GB：AIイラスト向け入門グラボ

GALAKURO GG-RTX3060-E12GB/OC/DF

玄人志向 / ブーストクロック : 1777 MHz / ファン : デュアル内排気 / 厚み : 2スロット（41.5 mm） / TDP : 170 W（8 pin）

AIイラスト入門におすすめなグラフィックボードが「RTX 3060 12GB」です。

もちろん、筆者やかもちも驚いています。まさか2025年にもなって、未だにRTX 3060 12GBがAI生成用途にしぶとく生き残る性能を持っているなんて･･･。

4K解像度（Hires.Fix）やQwen Imageも含む、重量級コストパフォーマンス計算※から、RTX 3060 12GBが頂点を収めます。

※ ハローアスカ（512）と神里綾華XL（832）を含まない計算。

RTX 3060が意外な勝利を収めた原因は、おもに3つです。

PCIe x16バスを搭載
VRAM容量が12 GB
新品価格が3.5万円～

約3.5万円から買えるリーズナブルな価格設定ながら、PCIe x16インターフェイスを備え、RTX 4060 Tiすら超える約360 GB/sの帯域幅があります。

要するに価格が安いです。安い割にお値段以上の仕事をこなす（= 高コスパな）グラボです。

予算3万円台でSDXL 1.0世代のアップスケーリング（Hires.Fix）から、時間はちょっとかかりますが最新世代のQwen Imageまで、一通り安定して動かせます。

まさに生成AI入門モデルに相応しいグラフィックボードでした。

GALAKURO GG-RTX3060-E12GB/OC/DF

玄人志向 / ブーストクロック : 1777 MHz / ファン : デュアル内排気 / 厚み : 2スロット（41.5 mm） / TDP : 170 W（8 pin）

「RTX 3060 12GB」をAmazonで探す

やかもち

お･･･おかしいぞ、本当はRTX 5060あたりが来る想定だったけど、まさかRTX 3060（12 GB）が生き残ってしまうなんて。

RTX 5070 12GB：快適なAIイラストに最適なグラボ

ZOTAC RTX 5070 SOLID OC【国内正規品】

ZOTAC / ブーストクロック : 2542 MHz / ファン : 3個 / 厚み : 2.0スロット（42 mm） / TDP : 250 W（16 pin） / 保証 : 1年

RTX 3060はあくまでも入門向けモデルで、正直なところ生成速度そのものは結構遅く感じます。

10万円を超えない現実的な予算感の中から、AIイラスト生成に適したグラボを選ぶなら、やはり「RTX 5070」を推したいです。

RTX 5070の重量級コストパフォーマンスをあらためて確認します。

約7～8万円の価格帯で異質なコスパを放っています。一般的に、価格が高いほどコスパが下がる指標ですが、RTX 5070は価格の上昇に性能が追いついてきます。

価格が上がった分だけ、性能もきちんと伸びているから、コストパフォーマンス（性能 / 価格）が高いです。

ちなみに、RTX 5070がとてもリーズナブルな要因として、動画投稿サイトにおける不審なネガティブキャンペーンを挙げられます。

不自然なほど対抗陣営（主にRadeon）を持ち上げて、実態以上にRTX 5070を低く評価する風潮のおかげで、RTX 5070を非常にコスパよく買える状態です。

（ComfyUI-MultiGPUノードで使う予定）

Palit GeForce RTX 5070 Infinity 3【国内正規品】

Palit / ブーストクロック : 2512 MHz / ファン : 3個 / 厚み : 2.0スロット（41.3 mm） / TDP : 250 W（16 pin） / 保証 : 1年

おかげさまで筆者も2台目を7万円台で導入できました。

コスパが悪いと評されるRTX 50シリーズの中で、RTX 5070は特異点と言っていいレベルで「革ジャン唯一の良心的モデル」です。

（Hires.Fixで4000 x 2140）

（Hires.Fixで4000 x 2258）

「RTX 5070」搭載でおすすめなゲーミングPC：4選

LEVEL THETA（RTX 5070）

最新の価格とスペックは公式サイトで確認してください

やかもち

省VRAM化がすすむ「ComfyUI」や「ReForge Web UI」のおかげで、「RTX 5070」で十分に快適なAIイラスト生成が可能に。

RTX 5090 32GB：価格差に見合った「最速のAIグラボ」

MSI RTX 5090 32G VENTUS 3X OC【国内正規品】

MSI / ブーストクロック : 2437 MHz / ファン : トリプル内排気 / 厚み : 3.3スロット（67 mm） / TDP : 575 W（16 pin）/ 保証：2年

コンシューマ向け（業務向けを含まない）グラフィックボードで、現行最速モデルが「RTX 5090 32GB」です。

他製品でほとんど替えが効かない唯一無二の性能を誇る、文句なしの最強グラボです。予算に糸目をつけず最高のAIグラボを買うなら、RTX 5090 32GBで決まりです。

4K Hires.FixやControlNetモデル、Qwen Imageまで含む重量級コストパフォーマンス比較です。

価格が高いだけミドルクラスのグラボに単純なコスパで勝てませんが、体感性能はまったくの別次元。あまりにも処理速度が速すぎて、一度使うと･･･もう二度と下位グラボに戻れないでしょう。

なお、最上位モデル同士の比較なら、決してコストパフォーマンスも悪くないです。

（2025/08時点）

重量級タスクの処理性能であれば、RTX 4090に対して約1.3～1.6倍の速度を出せます。最安値ラインの価格差が約1.3倍ほどの開きにとどまるため、結局コスパで勝ってます。

VRAM容量が24 → 32 GBに増えた影響もあり、今後出てくる最新世代の画像生成モデルや、動画生成AI（Wan 2.2など）も安心して対応できる余裕があります。

Gainward RTX 5090 Phantom【国内正規品】

Gainward / ブーストクロック : 2407 MHz / ファン : トリプル内排気 / 厚み : 3.5スロット（70 mm） / TDP : 575 W（16 pin）

5090を2台買っちゃうほど5090推しなのは知ってるんだけど、やっぱり30万円超えはちょっと･･･。

「グラボに30万円超えは非常に高い」と感じて当然なので、次点でRTX 5080やRTX 5070 Tiが候補です。

重量級コストパフォーマンスで見る限り、両者のコスパはほぼ拮抗します。パフォーマンス重視でRTX 5080を、コスパ重視でRTX 5070 Tiを推せます。

MSI RTX 5070 Ti 16G VENTUS 3X OC【国内正規品】

MSI / ブーストクロック : 2482 MHz / ファン : 3個 / 厚み : 2.5スロット（49 mm） / TDP : 300 W（16 pin） / 保証 : 2年

Amazonで探す

G-GEAR GE7A（RTX 5080）

最新の価格とスペックは公式サイトで確認してください

やかもち

筆者が日常的に「Wan 2.2（動画）」や「SDXL 1.0（画像）」で使ってるグラボがRTX 5090です。実際に使って圧巻の強さを把握してるので、予算があるなら普通におすすめ可。

GeForce以外なら：Intel ARC B580が候補

宗教上の理由でGeForceを使えない方は･･･Radeonよりも、Intel ARCが有力候補です。

SDXL 1.0推奨サイズ（832 x 1216）で生成したり、Hires.Fix（Tiled VAE）で4K相当までアップスケーリングする程度なら、Intel ARC B580で問題なく使えます。

RadeonのようにMi Openに絡んだエラーもまったく経験なく、VRAM容量が足りている限り、不思議なほど安定して動いています。

ComfyUI（Intel XPU版）
（https://github.com/ai-joe-git/ComfyUI-Intel-Arc-Clean-Install-Windows-venv-XPU-）

導入方法も驚くほどシンプルです。

pythonとgitをインストールした後、上記のページに書いてある内容をバッチファイルに入れて、順番に実行するだけで環境整備が終わります。

いったん動いてしまえばVRAM容量との戦いになるので、タスクマネージャーの共有メモリ漏れを見ながら、VAE分割サイズを適切に調整してください。

SPARKLE Arc B580 TITAN OC【国内正規品】

SPARKLE / ブーストクロック : 2740 MHz / ファン : トリプル内排気 / 厚み : 2.2スロット（44 mm） / TDP : 200 W（8 pin）/ 保証 : 2年

Amazonで探す

やかもち

pythonやgitにアレルギーがあったり、VAE分割処理のワークフローを組める気がしないなら、おすすめしません。素直にGeForceをどうぞ。

以上「【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】」でした。

動画生成AIにおすすめなグラボ

【Wan2.2】動画生成AIにおすすめなグラボを検証

SDXLで生成した画像をヌルヌルと動かせる、最新の動画生成AIモデル「Wan2.2」におすすめなグラボ解説です。

全40枚のグラフィックボードで徹底的に検証しました。

生成AIタスクにおすすめなBTOパソコン

AIイラストや動画生成におすすめなBTOパソコン：3選

これからAIイラスト用にパソコンを用意するなら、基本的にBTOパソコンを推奨します。手っ取り早く完成済みかつプロが組み立てたパソコンを入手できます。

メーカー側で互換性を確認している、いわゆる最新パーツで構成されているから、旧世代のパソコン（メモリがDDR3世代）を延命するより安心です。

記事更新内容

2023/03/08：Stable Diffusion Web UIのGPUベンチマーク結果をアップ
2023/03/13：RTX 4070 Tiのベンチマーク結果を追加
2023/03/14：RTX 4000（最適化設定）の性能を追加
2023/04/15：RTX 4070の性能を追加
2023/08/08：RTX 4060 Ti 16GBの性能を追加
2023/08/09：SDXL 1.0のベンチマーク結果を追加
2024/02/08：RTX 4070 Superの性能を追加
2024/02/09：SD 1.5、SDXL 1.0、Forge版のベンチマーク結果を更新
2024/04/03：RTX 4070 Ti Super / RTX 4080 Superの性能を追加
2025/08/24：全ベンチマークを刷新 / Qwen Imageの結果を追加（UPDATE !!）

画像生成AIのPCスペックでよくある質問

CPUの性能は影響あるの？

CPU側のオーバーヘッドが生成速度に与える影響はとても軽微です。

しかし、ComfyUIやReForge Web UIの場合、VRAMとメインメモリを往復する処理が多いです。その経路となる「PCIe世代」が性能に響いてきます。

RTX 5090で検証しました。

PCIe世代がGen5からGen4に下がり、帯域幅が最大32 GT/sから16 GT/sへ減った場合、約20%も速度が下がるケースもあります。

PCIe 5.0対応グラボなら、マザーボードとCPUもPCIe 5.0対応モデルが相応しいでしょう。逆にPCIe 4.0対応グラボだったら、無理にPCIe 5.0世代のパーツへ移行しなくても問題なし。

SSDの性能は影響あるの？

シーケンシャル性能が速いSSDほど、生成モデルを速く読み込めます。

SDXL 1.0モデルの場合、Gen5世代が2秒台、Gen4世代は3～4秒台です。SATA SSDだと約20秒まで伸びます。

コスパ的にGen4世代の定番SSDで十分です。迷ったら「SN7100」をおすすめします。

WD Black SN7100【2TB】

Western Digital / NAND : KIOXIA製 3D TLC NAND / 性能 : 最大7250 MB秒 / 容量 : 2TB / 耐久性 : 1200 TBW / 保証 : 5年

SSDベンチオタクがおすすめなSSDを解説【10選】

メモリの容量はどれくらい必要？

「ヘルタ4K Hires.Fix」ベンチマークで、ピーク時に約21 GBです。

「Qwen Image」ベンチマークにて、生成モデルをQ8版に切り替えてテストしても、ピーク時に約30 GB程度です。

画像生成だけ：メモリ容量32 GB
マルチGPUで複数同時：メモリ容量48 GB
動画生成（Wan 2.2）：メモリ容量64 GB以上

画像生成メインなら容量32 GBで間に合います。

Crucial Pro DDR5-5600 / 6000（16 GB x2）

Crucial / DDR5-5600 / 16 GB（2枚組）/ 型番：CP2K16G60C36U5B / 備考：互換性の高いネイティブ規格品

Amazonで探す

Crucial Pro 64GB【DDR5-5600 32GBx2】

Crucial / DDR5-5600 / 64 GB（2枚組）/ 型番：CP2K32G64C40U5B / 備考：互換性の高いネイティブ規格品

Amazonで探す

306 件のコメント

詳細なデータありがとうございます。
最近の高性能ＣＰＵやＧＰＵは私の使用目的では勿体なさ過ぎると感じていましたが、こういう使い方をする人にとってはわずかな出費の違いがパフォーマンスにものすごい差を示すのですね。

RTX 4090	10×1	5×2	2×5	1×10
512×512	13.08	9.35	8.78	7.18
512×768	16.15	11.66	–	–
512×768：LoRA	26.37	15.88	–	–
512×768：LoRA + ControlNet	33.68	18.25	–	–
512×1024：LoRA + ControlNet	35.01	24.91	–	–
1024×1532：LoRA + アップスケーリング	43.93	38.33	–	–

AIイラスト（Stable Diffusion）におすすめなグラボを検証

検証方法：AIイラストの生成速度をテストする

テスト環境：使用したグラボとPCスペックを紹介

【グラボ別】AIイラスト（Stable Diffusion）の生成速度

512×512：ハローアスカベンチマーク

832×1216：神里綾華ベンチマーク

832×1216：神里綾華（x10）ベンチマーク

832×1216：神里綾華（ControlNet）ベンチマーク

1664×2432：ヘルタ（Hires.Fix）ベンチマーク

3840×2160：ヘルタ4K（Hires.Fix）ベンチマーク

832×1216：Qwen Image Q3ベンチマーク

まとめ：AIイラストにおすすめなグラボ【3選】

RTX 3060 12GB：AIイラスト向け入門グラボ

RTX 5070 12GB：快適なAIイラストに最適なグラボ

RTX 5090 32GB：価格差に見合った「最速のAIグラボ」

GeForce以外なら：Intel ARC B580が候補

シェア！

306 件のコメント

コメントを残す コメントをキャンセル

ABOUTこの記事をかいた人

NEW POST最新の記事

INNOCN 49C1R：WQHDを2枚合体「DWQHD（32：9）」ゲーミ…

Lenovo LOQ 26ADR10 買ってレビュー：ノーパソ用CPUで格安…

ゲオ（GEO）で売ってる激安SSDをレビュー：容量2TBで2万円台なのにハイ…

be quiet! DARK POWER 14レビュー：定番OEM「CWT」…

RECOMMENDこちらの記事も人気です。

「RTX 2080」はGTX 1080 Tiと同性能だが、高評価は難しい。

RTX 2060 Superをレビュー：ゲーミングモニターに最高の1枚

PCI Express 3.0 x8 と x16でグラボの性能に差はあるのか…

RTX 5070 Tiベンチマーク：RX 9070 XTとどっちがいいか性能…

PNY RTX 5070 Ti Overclocked Triple Fan…

Intel UHD 750レビュー：Xe Graphics内蔵GPUの性能を…

RX 5700をレビュー：低電圧化で最強のワッパを実現する逸品

RTX 4080 Superをベンチマーク：RX 7900 XTXとどっちが…

LINEスタンプ発売中

「ちもろぐ」の筆者

筆者お気に入りの通販

筆者が使ってる光回線

アーカイブ

カテゴリー

コメントを残すコメントをキャンセル