機械学習向けAMDの新シリーズ「Radeon Instinct」3種スペックまとめ

AMDが機械学習向けに「Vega」に基づいたGPUなどを含む新しいファミリー(シリーズ)「Radeon Instinct」を発表。全部で3種あり、それぞれ「Radeon Instinct MI25」(Vega)、「MI6」(Polaris)、「MI8」(Fiji)と、別々のアーキテクチャに基いているのも特徴的。

この記事ではそんなRadeon Instinctについてまとめるよ。

Sponsored Link

AMD Radeon Instinct

「Radeon Instinct」は最新のVega世代などを含んでいるが、コンテンツクリエイター向けに開発された「Radeon Vega Frontier Edition」とは違って、こちらはクラウドや機械学習向けに設計されている。

Radeon Instinct MI25

シリーズRadeon Instinct
世代Vega 10
GPU名MI25
プロセスルール14nm
ストリーミングプロセッサ数4096
TMU数256
ROP数0
ベースクロック1501 Mhz
ブーストクロック1501 Mhz
理論性能(FP16)24.6 TFLOPS
理論性能(FP32)12.3 TFLOPS
テクスチャ描写速度384.3 Gtexel/s
メモリクロック472 Mhz
1888 Mbps
メモリ容量16 GB
メモリ規格HMB2
メモリバス2048-bit
メモリ帯域幅483.3 GB/s
スロットx2
補助電源8pin x2
TDP300W

やはりVEGA世代のGPUは性能が良いな。基本的な仕様はVega FEとほぼ同じなんですが、ROP(レンダー出力ユニット)が64個から0個へと除去されています。なるほど、さすが機械学習仕様。

動作クロックもFE版と比べると100 Mhzほど落ちています。しかし、性能は依然としてかなり優秀な部類。単精度の理論性能は12.3 TFLOPSであり、GTX 1080 Tiより約20%ほど高いパフォーマンスです。

もちろんROPが取り除かれているし、そもそもこのグラボにはIOが用意されていないためゲーミング用途には使えない。ただ、VEGAの潜在能力は現行のPascal世代を十分に上回る可能性があるってこと。

Radeon Instinct MI8

シリーズRadeon Instinct
世代Fiji
GPU名MI8
プロセスルール28nm
ストリーミングプロセッサ数4096
TMU数256
ROP数64
ベースクロック1000 Mhz
ブーストクロック1000 Mhz
理論性能(FP16)8.2 TFLOPS
理論性能(FP32)8.2 TFLOPS
テクスチャ描写速度256 Gtexel/s
メモリクロック500 Mhz
1000 Mbps
メモリ容量4 GB
メモリ規格HBM
メモリバス4096-bit
メモリ帯域幅512 GB/s
スロットx2
補助電源8pin x1
TDP175W

「Fury X」や「R9 Nano」で知られるFijiアーキテクチャに基づいたGPU。今更Fijiですが…という気もしなくはない。こちらはROPが残されたまま。ストリーミングプロセッサ数は4000個超え。

単精度の理論性能は8.2 TFLOPSほど。どれくらいの性能かと言うとRadeon R9 Nanoと大差ありません。R9 Nanoから出力部分を取り除いてしまったグラボって感じ(悲しい)。

Radeon Instinct MI6

シリーズRadeon Instinct
世代Polaris 10
GPU名MI6
プロセスルール14nm
ストリーミングプロセッサ数2304
TMU数144
ROP数32
ベースクロック1237 Mhz
ブーストクロック1237 Mhz
理論性能(FP16)5.7 TFLOPS
理論性能(FP32)5.7 TFLOPS
テクスチャ描写速度178.1 Gtexel/s
メモリクロック1750 Mhz
7000 Mbps
メモリ容量16 GB
メモリ規格GDDR5
メモリバス256-bit
メモリ帯域幅224 GB/s
スロットx2
補助電源6pin x1
TDP150W

最下位モデルにはPolarisが使われた。RX 470やRX 580などで知られるPolarisですね。基本的な仕様はRadeon RX 480 / 580とほとんど同じ。各種プロセッサ数も完全に同じ仕様です。

単精度の理論性能は8.2 TFLOPSなのでRadeon RX 580より100 GFLOPSほど劣った性能。搭載VRAMは倍の16GBだ。

まとめ

シリーズRadeon Instinct
世代Vega 10FijiPolaris 10
GPU名MI25MI8MI6
プロセスルール14nm28nm14nm
ストリーミングプロセッサ数409640962304
TMU数256256144
ROP数06432
ベースクロック1501 Mhz1000 Mhz1237 Mhz
ブーストクロック1501 Mhz1000 Mhz1237 Mhz
理論性能(FP16)24.6 TFLOPS8.2 TFLOPS5.7 TFLOPS
理論性能(FP32)12.3 TFLOPS8.2 TFLOPS5.7 TFLOPS
テクスチャ描写速度384.3 Gtexel/s256 Gtexel/s178.1 Gtexel/s
メモリクロック472 Mhz500 Mhz1750 Mhz
1888 Mbps1000 Mbps7000 Mbps
メモリ容量16 GB4 GB16 GB
メモリ規格HMB2HBMGDDR5
メモリバス2048-bit4096-bit256-bit
メモリ帯域幅483.3 GB/s512 GB/s224 GB/s
スロットx2x2x2
補助電源8pin x28pin x16pin x1
TDP300W175W150W

各アーキテクチャの最上位モデルを、若干マイナーチェンジして出力I/Oを取り除いた。それが「Radeon Instinct」ということ。まぁ、機械学習やクラウド向けですからね。

  • 1080 Ti:10.6 TLOPFS
  • Titan XP:11.4 TFLOPS
  • Instinct MI25:12.3 TFLOPS
  • Vega FE:13.0 TFLOPS

個人的にテンションが上がるのは、やっぱり「Vega 10」の理論性能がかなり高いってことですよ。あの「Titan Xp」ですら理論性能は11.4 TFLOPSなので、ゲーミング仕様のRX Vegaは相当に期待しています。

以上、機械学習向けAMDの新シリーズ「Radeon Instinct」3種スペックまとめでした。

Sponsored Link

コメントを残す

メールアドレスが公開されることはありません。