当ブログはWeb広告を導入しています(景表法による表示)

PCI Express 3.0 x8 と x16でグラボの性能に差はあるのか?

グラフィックボードを差し込むスロットは「PCI Express 3.0」という規格であり、レーンの長さ(数)によって1秒あたりの最大転送量(帯域幅)が大きく変わってくる。そして数値上の違いは非常に大きいため、しばしば「x16」と比較して「x8」はグラボ本来の力を引き出せないと言われています。

実際のところはどうなのだろうか?

Sponsored Link

事前知識:PCI Expressの最大帯域幅

レーン数 / 規格PCIe 1.0PCIe 2.0PCIe 3.0PCIe 4.0
x1250MB/s500MB/s985MB/s1969MB/s
x41000MB/s2000MB/s3940MB/s7876MB/s
x82000MB/s4000MB/s7880MB/s15752MB/s
x164000MB/s8000MB/s15760MB/s31504MB/s

規格とレーン数別に、帯域幅を表にまとめた。今回見ていくのは「PCI Express 3.0」という2017年現在は主流の規格。ほとんどのマザーボードにはレーン数が16本のPCIe 3.0が少なくとも1本は搭載されている。

ゲーミング向け・ハイエンドなマザーボードだと、PCIe 3.0 x16が2本以上用意されていることもありますね。さて、表を見ての通りPCIe 3.0 x8とx16では、帯域幅は2倍も違うのが分かります。秒間8GBと16GBの差。

普通の感覚だと1秒間あたり8GBも帯域幅が減ってしまえば、グラボの性能は落ちるのではないか…と感じますよね。

x8 VS x16:グラフィックボード1枚の場合

テスト環境
CPUCore i7 5930K
GPUMSI GTX 1080 Gaming X
メモリーDDR4-3200 32GB
M/BEVGA X99
SSDKingston HyperX Savage
電源ユニットNZXT 1200W 90+

まずはシングルボードの性能差から見てみます。テスト環境は6コア搭載のCore i7 5930Kで、グラフィックボードはGTX 1080が使用された。メモリはDDR4-3200なので、基本的にボトルネックが発生する可能性は皆無です。純粋にx8とx16の性能差を確認できるはず。

x8 VS x16 : Metro Last Light

Metro Last Light – WQHD(2560×1440)
x16 :96.0
x16 :74.0
x16 :70.3
x8 :95.0
x8 :73.3
x8 :67.0
平均フレームレート
最低フレームレート(全体の1%)
最低フレームレート(全体の0.1%)

全体的に安定したパフォーマンスを計測できるという定評を持つゲーム、Metro Last Lightでの検証。平均フレームレートでは大きな差は無いが、最低フレームレートでは最大5%程度の差が出ており、やや安定性が低下したように見える。

Metro Last Light – 4K(3840×2160)
x16 :66.0
x16 :54.0
x16 :51.7
x8 :66.0
x8 :54.0
x8 :51.3
平均フレームレート
最低フレームレート(全体の1%)
最低フレームレート(全体の0.1%)

4K画質だとほとんど差が無くなってしまい、レーン数が8本だろうが16本だろうがパフォーマンスには影響がないという結果に。

x8 VS x16 : Shadow of Mordor

Shadow of Mordor – WQHD(2560×1440)
x16 :108.0
x16 :60.7
x16 :51.0
x8 :107.0
x8 :60.7
x8 :50.7
平均フレームレート
最低フレームレート(全体の1%)
最低フレームレート(全体の0.1%)

Shadow of Mordorでは全く性能差は観測できず。

Shadow of Mordor – 4K(3840×2160)
x16 :64.0
x16 :43.3
x16 :38.7
x8 :63.3
x8 :39.0
x8 :36.7
平均フレームレート
最低フレームレート(全体の1%)
最低フレームレート(全体の0.1%)

4K画質にすると、ほんの少し安定性が低下しました。何らかの拍子(例えばテクスチャの多い都市に入った時など)に転送量が一時的に増加した時に、x16の方がさばける情報量が多いから最低フレームレートが安定しやすい、といったところですね。

x8 VS x16 : Call of Duty Black Ops 3

Call of Duty Black Ops 3 – WQHD(2560×1440)
x16 :140.0
x16 :111.0
x16 :100.0
x8 :140.0
x8 :108.3
x8 :100.0
平均フレームレート
最低フレームレート(全体の1%)
最低フレームレート(全体の0.1%)

特に傾向はなし。

Call of Duty Black Ops 3 – 4K(3840×2160)
x16 :71.3
x16 :57.3
x16 :54.0
x8 :70.7
x8 :56.7
x8 :53.0
平均フレームレート
最低フレームレート(全体の1%)
最低フレームレート(全体の0.1%)

CoDの場合、4K画質にしてもこれといった差は確認できなかった。

x8 VS x16 : Grand Theft Auto V

Grand Theft Auto V – 4K(3840×2160)
x16 :58.3
x16 :45.3
x16 :38.0
x8 :58.0
x8 :44.3
x8 :37.7
平均フレームレート
最低フレームレート(全体の1%)
最低フレームレート(全体の0.1%)

GTAVの4K画質。これといって差はない。

x8 VS x16 : Ashes of Singularity

Ashes of Singularity – 4K(3840×2160) – DirectX12
x16 :59.59
x8 :59.5
平均フレームレート

DirectX12環境、4K画質のAshes of Singularityでも性能差は全く確認できず。

結論、レーン数の違いはシングルボードではほとんど影響がない

どのタイトルでも目立った性能差は確認できず、Metro Last Lightでフレームレートの安定性がわずかだが低下するのが分かっただけでした。x16の方が高いパフォーマンスが出る可能性はあると言えるが、人間がプレイする上ではほとんど問題の無い「差」ということだ。

x8とx16で、データ上ではその違いを認識できても、人間が肉眼でプレイする場合は認識すらできない。よって、シングルボードの場合はPCIe 3.0のレーン数は気にする必要はありません。

Sponsored Link

x8 VS x16:グラフィックボード2枚(SLI)の場合

テスト環境
CPUCore i7 6900K
GPUx2 Titan X Pascal 12GB
メモリーDDR4-2133 64GB(8GB *8)
M/BASUS X99
SSDSamsung 850 Pro 512GB
電源ユニットEVGA 1200W

次はグラフィックボードを2枚使う「SLI」環境で、レーン数の帯域幅不足によるボトルネックが確認できないか検証。CPUは8コア搭載のCore i7 6900Kで、グラフィックボードはTitan X Pascalが2枚使用された。i7 6900Kは最大40本のレーン数に対応しているから問題なく検証が可能だ。

x8 VS x16:Unigine Heaven Pro 4.0

Unigine Heaven Pro 4.0 – 4K(3840×2160)
x8 / x8 :68.7
x16 / x8 :68.7
x16 / x16 :69.2

「Unigine Heaven Pro 4.0」はいわゆるベンチマークソフト。4K画質ではレーン数による性能差はまったく見られないが…。

Unigine Heaven Pro 4.0 – 4K Surround(11520×2160)
x8 / x8 Ultra :22.6
x16 / x8 Ultra :22.7
x16 / x16 Ultra :22.6
x8 / x8 Medium :44.3
x16 / x8 Medium :45.5
x16 / x16 Medium :46.0
x8 / x8 Low :86.9
x16 / x8 Low :105.7
x16 / x16 Low :124.0

4Kディスプレイを3枚使って解像度を11520×2160にまで拡張した場合は、レーン数による性能差がついに確認された。面白いのはベンチマークのグラフィック設定を落とせば落とすほど、その差は大きくなったこと。

設定を軽くしてグラフィックボードが処理できる情報量が多くなれば多くなるほど、帯域幅の高さはパフォーマンスに影響を与えたと考えられます。秒間16GBの16本と秒間32GBの32本では、フレームレートは50%も変化した。

x8 VS x16:Ashes of the Singularity

Ashes of the Singularity – 4K(3840×2160)
x8 / x8 :78.9
x16 / x8 :77.8
x16 / x16 :80.9

DirectX12環境、4K画質のAshes of the Singularityで検証。レーン数が多いほうが、パフォーマンスも良い気はするけれど、この程度の差ではなんとも…。

x8 VS x16:GRID Autosport

GRID Autosport – FullHD(1920×1080)
x8 / x8 :174.74
x16 / x8 :177.61
x16 / x16 :161.37

レーシングゲームのGRID Autosportで検証。フルHD画質では、レーン数が多いほうが逆にパフォーマンスが悪化してしまった。

GRID Autosport – 4K(3840×2160)
x8 / x8 :151.14
x16 / x8 :162.10
x16 / x16 :165.30

4K画質にするとレーン数が多い順にパフォーマンスも良い結果に。合計16本と32本では10%程度の違いが出た。

GRID Autosport – 4K Surround(11520×2160)
x8 / x8 :65.45
x16 / x8 :66.48
x16 / x16 :69.89

4Kディスプレイも3枚使った場合も、同様の結果に。合計16本に対して32本は8%程度のパフォーマンス向上。

x8 VS x16:Octane Render

Octane Render
x8 / x8 :141.71
x16 / x8 :143.12
x16 / x16 :142.81

Octane RenderはGPUだけでレンダリング処理を行えるアプリケーション。しかし、結果は見ての通りで帯域幅の影響はほとんど受けていないようだ。

結論:PCIe 3.0 x16の方が優秀だが…

シングルボードの場合はまったく差が見られなかった。安定性がわずかに向上するだけで、人間が体感しやすい平均フレームレートまで向上することは無かった。

次にデュアルボード(SLI)の場合ですが、全体的には16レーンのほうが優秀でした。しかし、ソフトウェアやアプリケーションによって傾向が違うため、一概に16レーンが優秀とは言いづらいところ。

もうひとつは、処理しなければならない情報量が多い環境であればあるほど、帯域幅が多いほうが高いパフォーマンスを出せるということです。今回のケースでは、4K Surround(4Kを3枚)環境にて確認できた。

  • 「x8」と「x16」のパフォーマンス差は、アプリケーションの違いに大きく左右される
  • 処理量が多い環境ほど、PCI Express 3.0のレーン数は多いほうが良い

この2点が結論になります。以上「PCI Express 3.0 x8 と x16でグラボの性能に差はあるのか?」でした。

 あとがき

個人的な感想を言うと、思っていた以上にレーン数の影響は少なかった…。要するに、PCI Express 3.0の帯域幅を100%使い切れる状況があまり存在しないってことなんですね。真価が試されるのは360度パノラマやVR、そして8K環境かもしれない。

好奇心のある人は他の記事も

基本中の基本「フレームレート」について、あらためて力説した記事。

123枚のグラフィックボードについて、ベンチマークスコアやVRAM容量、希望小売価格まで。あらゆる情報をひと目で分かるようにまとめた記事。

Sponsored Link

6 件のコメント

  • ゲームが始まった後のデータ交換程度では1.0~3.0で殆ど差が出ないみたいですね

    巨大なデータを扱う研究機関のような所になるとボトルネックになるそうで
    GPUへのロード時間や返しの時間が大半を占めるという話が昔載っていました
    NVLINK300Gbps(37.5GB/s)とか、きっとそういう事なんだと思います。

    • 実際に検証したわけではないのですが、RAMプレビューやDavinci Resolveで4Kサイズ以上の動画編集をする場合は、若干の差が出るはずです。ゲームの場合はx8で足りています。

  • ゲームでは変わらないと思うのですが、RTX40XXシリーズが出たらまた同じ検証をして頂きたいです。

  • けるふぁ へ返信する コメントをキャンセル

    メールアドレスが公開されることはありません。 が付いている欄は必須項目です