中国アリババが公開した「Wan2.2」モデルで、快適に動画を生成できるグラフィックボードを実際に検証します。今回はとりあえず20枚のグラボで性能比較です。
定番GeForceシリーズは直近3世代、マニア向けのRadeonシリーズは直近2世代を取り上げます。

(公開:2025/8/10 | 更新:2025/8/10)
動画生成AI(Wan2.2)におすすめなグラボを検証
検証方法:動画の生成時間をテストする
実際に動画生成させる |
---|
(指示内容:被写体のまわりを一周して)
動画生成AI(Wan2.2)に適したグラフィックボードをテストする方法はシンプルです。
実際に動画を作らせて、処理にかかった時間を記録します。短時間で動画を生成できればできるほど、動画生成AIに適したグラボです。
なお、生成速度(Iterations per Second)は指標に使いません。「20 it/s」などの数値に、VAEデコード時間が含まれておらず、実態以上の性能に誤認させるリスクが高いです。

最終VAEデコードが終わって、完成品が表示されるまでにかかった時間(Prompt executed seconds)を評価します。

動画生成に使うソフトは「ComfyUI」です。
- Download for ComfyUI(comfy.org)
Wan2.2がリリースされた初日からネイティブ対応済み。イラスト生成時代に定番だった「A1111」や「Forge」は、動画生成AI界から存在感が消えています。

ComfyUIに導入する拡張プラグインは基本中の基本となる「ComfyUI-Manager」に加え、「ComfyUI-GGUF」と「ComfyUI_essentials」を導入します。
- ComfyUI-Manager(github.com)
- ComfyUI-GGUF(github.com)
- ComfyUI_essentials(github.com)
「git clone」がよく分からない方は、ComfyUI-Managerだけ入れて、Managerから各種プラグインをインストールすると楽です。

(ベンチマーク用に自作)
ベンチマーク用のワークフロー(Workflow)は、筆者が自作したテンプレートを使います。ベンチマークに不要な機能を取り除いた、シンプルなテンプレートです。
ダウンロードした.zipファイルを展開して、中に入っている.jsonファイルをComfyUI画面に放り込むだけでテンプレが開きます。

テスト環境:使用したグラボとPCスペックを紹介

テスト環境 「ちもろぐ専用ベンチ機(2025)」 | ||
---|---|---|
スペック | NVIDIA GeForce | AMD Radeon |
CPU | Ryzen 7 9800X3D(レビュー) | |
マザーボード | ASUS TUF GAMING X670E-PLUS WIFI | |
メモリ | DDR5-5600 128GB(64GB 2枚組) → Crucial Pro DDR5-5600 | |
グラボ |
|
|
SSD | WD Black SN850X 8TB → 8 TB版レビューはこちら | |
OS | Windows 11 Pro (24H2) | |
生成ソフト | ComfyUI v0.3.49 pytorch 2.7.1 + cu128 | |
ドライバ | Game Ready 572.83 WHQL | Adrenalin 25.6.3 WHQL |
ライブラリ | NVIDIA CUDA | AMD ROCm Pytorch wheels based ROCm 6.5.0rc |
今回のWan2.2ベンチマークで使用するテスト機のPCスペックです。
CPUにRyzen 7 9800X3D(8コア16スレッド)、メモリにDDR5-5600(JEDEC準拠)を容量128 GBたっぷり搭載しました。
Wan2.2本体のVRAM使用量は使用する量子化モデルに依存しますが、生成する解像度を大きくしたり、後処理にアップスケーリングを入れるとメモリ使用量が急増します。

(共有メモリに漏れるとSSDの寿命を無駄に浪費するし生成速度も・・・)
最低でも64 GB以上、予算に余裕があれば96~128 GBを検討したいです(比較データは後ほど紹介)。
テストに使用したグラフィックボードは全部で20枚(GeForce:16枚 + Radeon:4枚)です。
筆者のお財布事情と時間の都合で、すべてのグラフィックボードが揃っているわけではないものの、ベンチマークとして性能を比較するのに不足しない量を揃えています。
【グラボ別】動画生成AI(Wan2.2)の生成速度

ベンチマーク内容は「HD画質(480 x 704)」を5秒(81フレーム)生成させて、動画が完成するまでにかかった時間(Prompt executed seconds)をテストします。
なお、アップスケーリングやフレーム補間など、グラボよりメモリ容量で勝負が決まりやすい後処理のベンチマークは省略します。
あくまでも、VRAMが足りている範囲でグラフィックボードが出せるネイティブ生成性能に注目した検証です。
使用した量子化モデル(一覧) | |
---|---|
VRAM:32 GB以下 (24 ~ 32 GB) |
|
VRAM:24 GB以下 (16 ~ 24 GB) |
|
VRAM:16 GB以下 (12 ~ 16 GB) |
|
VRAM:12 GB以下 (8 ~ 12 GB) |
|
使用した高速化LoRAモデル | |
VRAM:すべて (8 ~ 32 GB) |
|
Wan2.2のオリジナル版はなんと「27B」もあり、HighとLowをあわせて合計「54B」もの超巨大モデルです。VRAM容量が48 GBあっても入り切らないです。
幸い、ComfyUIをはじめとした有志ユーザーによって、性能をなるべく維持しつつモデルサイズを軽量化した「量子化モデル」が充実しています。
Comfy-Orgチームが作成した「14B_fp8」版なら、14B+14BでVRAM容量32 GBあれば足りる計算です。QuantStackチームが作成した「Q6_K」版は11.7B+11.7BだからVRAM容量24 GBでギリギリ収納できます。
なお、モデルサイズとVRAM使用量がそこそこ一致するのはGeForceシリーズ限定です。Radeonシリーズは信じられないほどVRAM使用量が肥大化するため、原則として「Q2_K」版を使います。
処理速度を高速化するLoRAモデルは、Kijai氏が作成した「Lightx2v」を適用しています。モーション量がやや犠牲になる代わりに、必要なステップ数を3~4分の1まで削減可能です。
480×704:神里綾華(I2V)ベンチマーク
開始 | 終了 |
---|---|
![]() | ![]() |
イラスト(Image)から動画(Video)に変換する、I2V(Image to Video)ベンチマークです。
完成 |
---|
ベースとなるイラストのアスペクト比に合わせて解像度を「480 x 704」に設定し、高速化LoRA「Lightx2v」を導入してステップ数を合計6(High側で3 + Low側も3)ステップに削減します。
生成する動画の長さは「5秒」です。Wan2.2は16 FPSで動画が生成されるため、最初のフレーム + 5秒 x 16枚 = 81枚の生成に相当します。

(※クリックでグラフ拡大)
ほとんどの生成AIユーザーが予想していたとおり、GeForceシリーズが圧倒的な成績を収めます。
Radeonシリーズはむしろ動いただけでも驚きです。TheRock版ROCm(Windowsネイティブ版)が登場したおかげで、最新版ComfyUIでそのまま動画を生成できます。

しかし、軽量版モデル(Q2_K版)ですらVRAM容量をあるだけすべて湯水のように浪費し、最後の仕上げ工程(VAEデコード)で深刻な目詰まりを起こして大きく時間が伸びます。
ROCmの最適化が遅れているRX 9070 XTはさらに酷く、そもそも最終VAEデコードが通らないです。苦肉の策として「–cpu-vae」オプションを使って、CPU処理でなんとか通しました。


(※クリックでグラフ拡大)
次に、GeForceだけに焦点をあてた拡大グラフをチェック。
すべてVRAM容量がギリギリ足りている範囲で動いているから、グラボ本来のネイティブ生成性能を比較できました。
生成AIユーザーの新規獲得に大きく貢献した名作RTX 3060 12GBも未だにけっこう強いです。RTX 4060に速度で負けますが、VRAM容量が多いから少し高品質なモデルを使えます。
同様にRTX 5060 Ti 16GBも速度こそRTX 4070に届かないものの、サイズの大きなモデルをロードでき、生成品質で優位性があります。
RTX 5070以上は順当に性能が伸びています。イラスト生成で伸びがイマイチだったRTX 50シリーズですが、なぜか動画生成なら意外と性能アップ。
CUDA性能の割に生成速度が伸びているため、おそらくVRAM帯域幅が効いている可能性が高いです。

メインメモリ容量ごとに生成時間を比較

Wan2.2の前世代モデル「Wan2.1」が登場したころ、動画生成AIには大量のメインメモリが必要だと話題になっていました。
本当にメインメモリ容量が大量に必要なのか、「RTX 5090」を使ってメモリ容量ごとに生成時間を比較します。生成する内容や各種設定は同じままです。

(※クリックでグラフ拡大)
4パターンで比較した結果、たしかにメインメモリ容量が多いほど生成時間が短縮されています。
- メモリ容量128 GB:約2.3倍
- メモリ容量64 GB:約2.3倍
- メモリ容量48 GB:約1.8倍
- メモリ容量32 GB:-
容量32 GBに対する性能の向上幅を計算すると、容量64 GB以上がおすすめです。メモリ容量を増やしただけで、生成時間が半減します。

メモリ容量を増やすと劇的に生成時間を減らせる理由は「スワップ現象」です。
VRAMに入り切らないデータは、PCIeバスを経由してメインメモリに移動し、メインメモリでも足りなければ共有メモリ(システムSSD)に移動します。
それぞれの移動速度は以下のとおりです。
エリア | 具体例 | 帯域幅 (移動速度) |
---|---|---|
PCIeバス | PCIe 5.0 x16 | 64.0 GB/s |
PCIe 4.0 x16 | 32.0 GB/s | |
PCIe 4.0 x8 | 16.0 GB/s | |
メインメモリ | DDR5-5600 | 69.2 GB/s |
DDR4-3200 | 33.6 GB/s | |
共有メモリ | NVMe SSD(Gen5) | 14.8 GB/s |
NVMe SSD(Gen4) | 7.4 GB/s | |
SATA SSD | 0.5 GB/s |
一見するとぶっ飛んだ速度に見えます。
GPU | VRAM | 帯域幅 |
---|---|---|
RTX 5090 | GDDR7 | 1792 GB/s |
RTX 4090 | GDDR6X | 1008 GB/s |
RTX 5070 | GDDR7 | 672 GB/s |
RTX 4070 | GDDR6X | 504 GB/s |
RTX 3060 12GB | GDDR6 | 360 GB/s |
一方で、VRAM帯域幅は文字どおり桁違いの帯域幅です。
PCIeバスやメインメモリの約5~30倍以上も速く、ましてや共有メモリ(NVMe SSD)と比較してまうと約50~250倍も速いです。
VRAMと比較してメモリの帯域幅が遅すぎるから、メインメモリに漏れると生成時間が一気に低速化します。
メインメモリにすら入り切らず、共有メモリ(NVMe SSD)に漏れた場合は、SSDの寿命(TBW:書き込み保証値)を無駄に浪費するペナルティまで付いてきます。

【おまけ】モデルサイズと生成品質の違い
Q2_K版 (VRAM:~ 12 GB) | Q3_K_M版 (VRAM:~ 16 GB) | 14B_Fp8版 (VRAM:~ 32 GB) |
---|---|---|
同じワークフロー、まったく同じ設定のまま、量子化モデルだけを変更して動画を生成させました。
モデルサイズが小さいほどVRAM使用量を減らせますが、やはり生成品質が犠牲になる様子が明らかです。
映像のアーティファクト(ガビガビ)度合いや解像度の細かさだけでなく、入力したプロンプト(指示内容)に対する追従性も大きく変わってきます。
Wan2.2で指摘が相次ぐ「口パク現象」の発生率も、体感ですがモデルサイズに比例する気がします。
まとめ:動画生成AIにおすすめなグラボ【3選】

今回のWan2.2ベンチマーク調査で、「動画生成AIにおすすめなグラボ」がざっくりと判明しました。
RTX 5060 Ti 16GB:動画生成AI向け入門グラボ

動画生成AIをとりあえず導入してみたい方に、おすすめなグラフィックボードが「RTX 5060 Ti 16GB」です。
生成速度はRTX 4070にやや劣る程度ですが、GDDR7メモリ(448 GB/s)を16 GBも搭載します。そこそこ品質が高い「Q4_0」版や「Q3_K_M」版を収納できるVRAM容量です。
予算10万円未満で買えるグラボの中で、もっとも動画生成AIに適性があるグラフィックボードと評価してます。
なお、RTX 5060 Tiの問題点はゲーム性能の低さです。対応ドライバ「566.xx」以降、ゲームによる性能のバラツキが拡大していて取り扱いが難しいです。
動画生成AI用におすすめできますが、生成AI以外の用途で推奨しづらい惜しいグラボです。革ジャンが早期にドライバの安定化を推し進めてくれるといいのですが。

RTX 5070 Ti 16GB:速度と容量のバランスならこれ

RTX 4080 SUPERに迫る生成性能と、容量16 GB(896 GB/s)を両立するグラボが「RTX 5070 Ti」です。
在庫がかなり安定してきて、今なら約12~13万円台で落ち着いています。それでも価格だけを見るとけっこういい値段してますが、性能とコスパは負けてないです。

RTX 5060 Tiに対して約1.8倍の生成速度があり、一方で価格差は約1.6~1.7倍だから意外とコスパが良い(1.8 / 1.6~1.7 = +6~13%)です。
VRAM容量もRTX 5060 Tiと同じく16 GBを備え、VRAM帯域幅は約2倍近い896 GB/sまで跳ね上がり、なんとRTX 4080 SUPERに迫る生成速度を出せています。

RTX 5090 32GB:動きのある高解像度な動画生成に

「RTX 5090」は筆者がもっとも気に入っている動画生成AIグラボです。
生成速度あたりのコストパフォーマンスで、正直なところ割高と言わざるを得ないです。今回の検証でも、RTX 5070 Tiに速度比コスパでかなり劣っています。
しかし、RTX 5090に搭載された容量32 GBもの巨大なVRAMに「14B_fp8_scaled」版モデルを収納できます。
そもそもコスパがやや悪いだけで、生成速度はちゃんと最強です。凄まじい速度を叩き出せるから、あえて高速化LoRA(Lightx2v)を無効化して、ネイティブ生成で躍動感のある映像も出せます。
高速化を使うと品質だけでなく、映像そのもののモーション量も大きく低減してしまい、ローカル版AIを導入する強い動機となる “特定のニーズ※” にうまく応えられません。
爆速かつ大容量VRAMを誇るRTX 5090なら、品質の高い巨大モデルを使って、高速化LoRA無しに動画生成が可能です。
もちろんアップスケーリングに頼らないネイティブ高解像度(例:960 x 1408など)も対応可能です。
ネイティブ高解像度かつモーション量の多い動画生成なら、現時点でRTX 5090をおすすめします。次点で「Q6_K」版を扱えるRTX 4090でしょうか。
※紳士向けコンテンツ(俗にいうNSFW用途)において、映像のモーション量はとても重要です。

以上「【Wan2.2】動画生成AIにおすすめなグラボをゆるく検証【GPU別の生成速度】」でした。
AIイラスト生成におすすめなグラボ
2025年現在も定番の「SDXL」モデルにおすすめなグラボ解説です。
RTX 5000搭載のおすすめゲーミングPC【解説】
これからAIイラスト用にパソコンを用意するなら、基本的にBTOパソコンを推奨します。手っ取り早く完成済みかつプロが組み立てたパソコンを入手できます。
すでにパソコンを持っている方は、「グラフィックボードの増設・交換ガイド」を参考に、新しく買ってきたグラボを増設・交換するだけでOKです。
- 2025/08/10:Wan2.2のGPUベンチマーク結果をアップ(UPDATE !!)
あまり詳しくないけどやっぱりそのままcudaで動かせるnvidiaと互換機能を使って動かすAMDでは超えられない壁があるのかな?windows版ROCmでもまるで勝負になってない。
Intel Arcはやらなかったんです?
最近だとIPEX無しでも動かせたりしますが
購入の参考になる素晴らしい検証ありがとうございます
5090に電力制限(70~80%くらい)かけた場合どのくらいの性能になるかわかりますでしょうか?
買おうかすごい迷っているんですが600Wで動かすのが怖くて踏ん切りが付かなくて
RTX5090を買ってしまったので、もう何も悩まなくて済むぜぇ!あとはComfyUI覚えるだけだな!(最難関)
この検証、動画生成に興味ある人にはめちゃめちゃ需要あると思いますよ!
私は5070tiユーザーですが、他グラボとの比較が各種AIコミュニティの伝聞しかなかったので、非常に参考になりました!
万一、DGX Sparkもご購入予定がありましたら比較検討に加えていただけると幸いです!
結局NVIDIAの独擅場ですね
しかしIntelもAIに関しては結構優秀という噂も聞きますので
B580とその後に噂されているVRAM48GBバージョンも気になってしまいます。
文中の「共有メモリ」は、「仮想メモリ」の誤りかと思われます。
共有メモリは、例えば複数の同じプログラムを動かす時に同じメモリ領域を使い回すとか、プログラム間でデータをやり取りする等に使う物ですね。
タスクマネージャだと「共有ワーキングセット」で表示されます。
リソースモニタで、ハード フォールト/秒ってのが有りますが、ソレがSSDやHDD上のスワップorページファイル関連の数値になります。
タスクマネージャだと、ページ フォールト(差分の同デルタ)です。
タスクマネージャのパフォーマンスタブのメモリだと、「コミット済み」の分子側が急激に増える状態がRAM不足になってページアウトしている状態です。
※アプリ起動後のアイドル時にゆっくり増える事も有りますが、
RAM不足時に備えて、予めページファイルに書き出しておく機能(※※)が原因で、実際はRAM不足ではない場合も有ります。
※※予めページファイルに書き出しておけば、不足してから実際に書き出してRAMを確保するよりも快適になる事が多い。
タスクマネージャのGPUの項目で「共有GPUメモリ」と記載されているからでは?
3Dゲームには興味ないけどAIのためにグラボ買おうか考えてるので、今後もこういう記事を期待してます
画像生成の比較と違って使用するモデルがVRAM量で違っているのに注意ですね。
32Gと8Gでモデルの大きさを合わせるのは実用からかけ離れるので納得ですが、
VRAM量が違えば単純な性能比較表にはならない。
それでも4年前の3060にはるかに及ばないRadeonはインパクトありますね
噂される5070ti superだとVRAM24GBになるので新たな決定版になりそうですね
現状ではGPUの処理性能よりメモリスワップによるボトルネックの方が重大なので
結局VRAMが大事だそうよ、5080ちゃん…
3080や5070にてVRAM容量を超えた時にどう変化するのか、ギリギリ可能な範囲がどんなものか。
ここらへんが知りたく思います。
特に5070がゲーミングで実用的であり5060Tiの16GBが何故か執拗に勧められる所ですね。
Thank you for your test
この128GBメモリってX670Eでも動くんですね
crucialの互換性チェックでは 、殆どのX670Eマザーボードは互換性無し的な表示をされてるから驚きです
Asrockのx670e steel legendでも動く場合があるんでしょうか?
CPUが9000番台じゃないとダメとかあるんですかね?
まず貴重なベンチマーク結果ありがとうございました。
ただ、VRAM容量ごとにアウトプット品質が異なるモデルを使用して比較するのは、
画像生成で異なる解像度で生成した結果を比較するような違和感を感じます。
(実際使う場合を考慮した条件というのも理解できます。)
例えばBlockToSwapを使えば低VRAMでも高容量モデルを動かせるので、
共通のモデルを使用して、VRAM容量ごと最速になるBlockToSwapを設定することで、
アウトプット品質は同じで、VRAM容量による影響も含めた生成時間を比較できる
ベンチマーク結果が得られるのではないかと思います。
次回ベンチマークする機会がありましたら、ご検討いただけると幸いです。