グラフィックボードを差し込むスロットは「PCI Express 3.0」という規格であり、レーンの長さ(数)によって1秒あたりの最大転送量(帯域幅)が大きく変わってくる。そして数値上の違いは非常に大きいため、しばしば「x16」と比較して「x8」はグラボ本来の力を引き出せないと言われています。
実際のところはどうなのだろうか?
事前知識:PCI Expressの最大帯域幅
レーン数 / 規格 | PCIe 1.0 | PCIe 2.0 | PCIe 3.0 | PCIe 4.0 |
---|---|---|---|---|
x1 | 250MB/s | 500MB/s | 985MB/s | 1969MB/s |
x4 | 1000MB/s | 2000MB/s | 3940MB/s | 7876MB/s |
x8 | 2000MB/s | 4000MB/s | 7880MB/s | 15752MB/s |
x16 | 4000MB/s | 8000MB/s | 15760MB/s | 31504MB/s |
規格とレーン数別に、帯域幅を表にまとめた。今回見ていくのは「PCI Express 3.0」という2017年現在は主流の規格。ほとんどのマザーボードにはレーン数が16本のPCIe 3.0が少なくとも1本は搭載されている。
ゲーミング向け・ハイエンドなマザーボードだと、PCIe 3.0 x16が2本以上用意されていることもありますね。さて、表を見ての通りPCIe 3.0 x8とx16では、帯域幅は2倍も違うのが分かります。秒間8GBと16GBの差。
普通の感覚だと1秒間あたり8GBも帯域幅が減ってしまえば、グラボの性能は落ちるのではないか…と感じますよね。
x8 VS x16:グラフィックボード1枚の場合
テスト環境 | |
---|---|
CPU | Core i7 5930K |
GPU | MSI GTX 1080 Gaming X |
メモリー | DDR4-3200 32GB |
M/B | EVGA X99 |
SSD | Kingston HyperX Savage |
電源ユニット | NZXT 1200W 90+ |
まずはシングルボードの性能差から見てみます。テスト環境は6コア搭載のCore i7 5930Kで、グラフィックボードはGTX 1080が使用された。メモリはDDR4-3200なので、基本的にボトルネックが発生する可能性は皆無です。純粋にx8とx16の性能差を確認できるはず。
PCIe 3.0 x8 vs. x16: Does It Impact GPU Performance?
x8 VS x16 : Metro Last Light
全体的に安定したパフォーマンスを計測できるという定評を持つゲーム、Metro Last Lightでの検証。平均フレームレートでは大きな差は無いが、最低フレームレートでは最大5%程度の差が出ており、やや安定性が低下したように見える。
4K画質だとほとんど差が無くなってしまい、レーン数が8本だろうが16本だろうがパフォーマンスには影響がないという結果に。
x8 VS x16 : Shadow of Mordor
Shadow of Mordorでは全く性能差は観測できず。
4K画質にすると、ほんの少し安定性が低下しました。何らかの拍子(例えばテクスチャの多い都市に入った時など)に転送量が一時的に増加した時に、x16の方がさばける情報量が多いから最低フレームレートが安定しやすい、といったところですね。
x8 VS x16 : Call of Duty Black Ops 3
特に傾向はなし。
CoDの場合、4K画質にしてもこれといった差は確認できなかった。
x8 VS x16 : Grand Theft Auto V
GTAVの4K画質。これといって差はない。
x8 VS x16 : Ashes of Singularity
DirectX12環境、4K画質のAshes of Singularityでも性能差は全く確認できず。
結論、レーン数の違いはシングルボードではほとんど影響がない
どのタイトルでも目立った性能差は確認できず、Metro Last Lightでフレームレートの安定性がわずかだが低下するのが分かっただけでした。x16の方が高いパフォーマンスが出る可能性はあると言えるが、人間がプレイする上ではほとんど問題の無い「差」ということだ。
x8とx16で、データ上ではその違いを認識できても、人間が肉眼でプレイする場合は認識すらできない。よって、シングルボードの場合はPCIe 3.0のレーン数は気にする必要はありません。
x8 VS x16:グラフィックボード2枚(SLI)の場合
テスト環境 | |
---|---|
CPU | Core i7 6900K |
GPU | x2 Titan X Pascal 12GB |
メモリー | DDR4-2133 64GB(8GB *8) |
M/B | ASUS X99 |
SSD | Samsung 850 Pro 512GB |
電源ユニット | EVGA 1200W |
次はグラフィックボードを2枚使う「SLI」環境で、レーン数の帯域幅不足によるボトルネックが確認できないか検証。CPUは8コア搭載のCore i7 6900Kで、グラフィックボードはTitan X Pascalが2枚使用された。i7 6900Kは最大40本のレーン数に対応しているから問題なく検証が可能だ。
Titan X Performance: PCI-E 3.0 x8 vs x16
x8 VS x16:Unigine Heaven Pro 4.0
「Unigine Heaven Pro 4.0」はいわゆるベンチマークソフト。4K画質ではレーン数による性能差はまったく見られないが…。
4Kディスプレイを3枚使って解像度を11520×2160にまで拡張した場合は、レーン数による性能差がついに確認された。面白いのはベンチマークのグラフィック設定を落とせば落とすほど、その差は大きくなったこと。
設定を軽くしてグラフィックボードが処理できる情報量が多くなれば多くなるほど、帯域幅の高さはパフォーマンスに影響を与えたと考えられます。秒間16GBの16本と秒間32GBの32本では、フレームレートは50%も変化した。
x8 VS x16:Ashes of the Singularity
DirectX12環境、4K画質のAshes of the Singularityで検証。レーン数が多いほうが、パフォーマンスも良い気はするけれど、この程度の差ではなんとも…。
x8 VS x16:GRID Autosport
レーシングゲームのGRID Autosportで検証。フルHD画質では、レーン数が多いほうが逆にパフォーマンスが悪化してしまった。
4K画質にするとレーン数が多い順にパフォーマンスも良い結果に。合計16本と32本では10%程度の違いが出た。
4Kディスプレイも3枚使った場合も、同様の結果に。合計16本に対して32本は8%程度のパフォーマンス向上。
x8 VS x16:Octane Render
Octane RenderはGPUだけでレンダリング処理を行えるアプリケーション。しかし、結果は見ての通りで帯域幅の影響はほとんど受けていないようだ。
結論:PCIe 3.0 x16の方が優秀だが…
シングルボードの場合はまったく差が見られなかった。安定性がわずかに向上するだけで、人間が体感しやすい平均フレームレートまで向上することは無かった。
次にデュアルボード(SLI)の場合ですが、全体的には16レーンのほうが優秀でした。しかし、ソフトウェアやアプリケーションによって傾向が違うため、一概に16レーンが優秀とは言いづらいところ。
もうひとつは、処理しなければならない情報量が多い環境であればあるほど、帯域幅が多いほうが高いパフォーマンスを出せるということです。今回のケースでは、4K Surround(4Kを3枚)環境にて確認できた。
- 「x8」と「x16」のパフォーマンス差は、アプリケーションの違いに大きく左右される
- 処理量が多い環境ほど、PCI Express 3.0のレーン数は多いほうが良い
この2点が結論になります。以上「PCI Express 3.0 x8 と x16でグラボの性能に差はあるのか?」でした。
個人的な感想を言うと、思っていた以上にレーン数の影響は少なかった…。要するに、PCI Express 3.0の帯域幅を100%使い切れる状況があまり存在しないってことなんですね。真価が試されるのは360度パノラマやVR、そして8K環境かもしれない。
好奇心のある人は他の記事も
基本中の基本「フレームレート」について、あらためて力説した記事。
123枚のグラフィックボードについて、ベンチマークスコアやVRAM容量、希望小売価格まで。あらゆる情報をひと目で分かるようにまとめた記事。
ゲームが始まった後のデータ交換程度では1.0~3.0で殆ど差が出ないみたいですね
巨大なデータを扱う研究機関のような所になるとボトルネックになるそうで
GPUへのロード時間や返しの時間が大半を占めるという話が昔載っていました
NVLINK300Gbps(37.5GB/s)とか、きっとそういう事なんだと思います。
PCI-E 2.0 x16とPCI-E 3.0 x16での性能差も知りたいです。
PCIe 2.0 x16 = PCIe 3.0 x8相当です。
4Kモニターまでなら、誤差レベルの性能差しかありません。
動画のエンコード、書き出しにおいてPCIe3.0 x8,x16の差はやはり無いでしょうか?
実際に検証したわけではないのですが、RAMプレビューやDavinci Resolveで4Kサイズ以上の動画編集をする場合は、若干の差が出るはずです。ゲームの場合はx8で足りています。
ゲームでは変わらないと思うのですが、RTX40XXシリーズが出たらまた同じ検証をして頂きたいです。