当ブログはWeb広告を導入しています（景表法による表示）

2018.11.21 CPU やかもち（管理人）

「Zen 2」の痺れる設計を解説。Ryzenの欠点を解決して真の完成形になりそうです。

2019年に登場する予定の第3世代のAMD Ryzen「Zen 2」は、今までのRyzenの弱点を根本的に解決する数々の設計改良が加えられ、見ているだけで痺れてくる。…というわけで、Ryzenの弱点が存在する設計上の背景から、Zen 2でどのように弱点が解決されるのか。分かりやすく解説します。

分かりやすさ重視なので、小難しい専門用語を「言い換え」たりしていますが、気にしないでください。

「Zen 2」の設計を図解：今までのRyzenと何が違う？

従来の「Zen」設計を図解でおさらい

まずは基本中の基本である「Ryzenの設計」について、ザックリと説明します。「Ryzen」はコア数が多いにも関わらず、価格が非常に安くてコスパに優れているため、自作PCを中心に浸透してインテルを脅かす存在になった。

Ryzenが初めて市場に登場した当時、8コアCPUは10万円くらい出さないと購入できないエンスージアスト向けのハイエンドCPUでした。そこにAMDはわずか3.5～4万円で8コアを投入したのです。

しかも実際の性能もちゃんと8コアらしい強力なモノで、停滞気味だったCPU業界を一気に沸かせた。もちろん、原価ギリギリで売っているわけではなく、安価に8コアを作れる合理的な設計こそが「Zen」の強みでした。

その設計の基本が「Zeppelin」と呼ばれるチップです。Zeppelinの中には「CCX」と呼ばれる4コアCPUが2個入っていて、その他にZeppelin同士を接続する「IFOP」や、グラボやメモリと通信するためのコントローラなどが内蔵されています。

基本的にCPUはコア数が多いチップほど、チップの面積が巨大化して作るのに必要なコストがどんどん増えていく（=歩留まり率の悪化）。だからAMDは「Zeppelin」と言う安価に製造できる8コアのチップを「最小単位」として製造。

Ryzen：「Zeppelin」を1個で4～8コアを実現
Ryzen Threadripper：「Zeppelin」を2個で8～16コアを実現
AMD EPYC：「Zeppelin」を4個で8コア～32コアを実現

あとは最小単位であるZeppelinを組み合わせることで、コア数を倍々ゲームのようにカンタンに増やせるという設計です。最小単位より大きいチップは製造しないので、結果的にコストを抑えられるという狙いになる。

だからRyzenはコア数の割に安い。8コアなら約4万円、16コアは9万円くらい。インテルの同じコア数なら、8コアが6.5万円で、16コアは18万円も掛かる。ほぼ半額ですね。

インテルはチップ1個で8コア以上を作るけど、AMDは複数のチップを合体させてコア数を増やすのね。

そういうこと。しかし、チップ同士の「合体」にRyzenの弱点があるのです。

多コア化に合理的な「Zen」の弱点

Zeppelinという最小単位を複数使って、安価に多コアCPUを作ることができるのが「Zen」の強みでしたが、複数のZeppelinを接続する時に使う「IFOP」が原因で、いろいろな弱点が生まれてしまった。

IFOP = Zepplelin同士を接続するパイプ

「IFOP」はInfinity Fabric On-Packageの略称で、機能はZenの最小単位であるZeppelin同士を、相互通信できるように接続して「多コア化」を実現するためのパイプのようなモノ…と思ってください。

たとえば、16コア搭載のRyzen Threadripperを作る場合は、最小単位のZeppelinを2個使う。IFOPを2本使って、2つのZeppelinを接続して、カンタンに16コアCPUが完成するというわけ。

しかし、これは「8コアCPUを2個使っている状態」に近い。

そのため、何らかの処理を行う場合、ソフトからメモリ、そしてCPUへとデータの転送が行われるわけですが、Zeppelinの間をまたいで転送すると時間が掛かります。つまり遅延が発生しやすい。

この遅延が存在するために、最適化が乏しいという弱点を抱えることになってしまった。最近は少しずつマシにはなってきたが、Adobe全般は未だに最適化されていないなど、大手ほど重い腰を上げない傾向がある。

あとは動画エンコード系も、同じコア数で速度を競うとインテルの方が速いことが多い。筆者の知る範囲では、Aviutlが唯一Ryzenに最適化されているけれど、Adobe PremiereやHandbrakeなどの有名所はおおむねダメです。

IF = あらゆるデータが必ず通るパイプ

先のIFOPは、Zeppelinチップを相互接続するためのパイプでした。次はZeppelinの内部に埋め込まれている「インフィニティーファブリック」についても、解説しておく。

このインフィニティーファブリックは別名「スケーラブルな制御網」（Scalable Control Fabric）と呼ばれており、その名の通り、Zeppelin内部の各種コンポーネントを相互接続するためのパイプとして機能する。

つまり、何かの処理をする時。ソフトウェアからメモリーに送られたデータは、Zeppelinの中にあるメモリコントローラにやってきて、その後インフィニティーファブリックへ送られて「CCX」に到達するというわけ。

CCXで処理が済んだらデータは元の位置へ戻る。当然、来る時にパンくずを落としてあるので、その痕跡を追いかけて来た道を戻ることでメモリーに帰っていきます（ここのレイテンシはメモリークロックを同期することで解消している）。

ここで問題になるのが、CCXは2つあるということ。Zeppelinは見かけは8コアの単一CPUですが、内部的には更に小さい「CCX」と言う4コアCPUが2個入っている形式です。そして、2つのCCXコアと、他のコンポーネントをIFを使って相互接続している。

ここを説明している文献は少ないので、筆者の経験則も含んだ推測になるが、おそらく2つのCCXコアに上手く役割分担を行えるかどうかが割と重要なポイントなのかもしれない。

たとえば、Ryzen以前から存在していて既に更新が止まっている「Aviutl」（日本で大人気の動画編集ソフト）の場合、Ryzen環境ではなぜかプレビューが安定して動作しないという不具合に遭遇しています。

多少カクつくだけなら許容できるが、レイヤーを重ねていればいるほど動作がひどくなり、割とクラッシュする。もちろん、原因の調査を行いました。すると面白い事実が発覚した。

インテルCPUだと当然スムーズに動く。次に、Ryzen 5やRyzen 7ではダメ。そして「Ryzen APU」だと割と普通に動いてくれる。Ryzen APUにはCCXが1個しか入っていません。

このことから、CCXが2個入っているという構造が古いソフトにとっては結構厄介なんだろうな…と。大手のソフトでも未だに最適化されていないことは珍しくないので、意外と面倒くさいのかもしれない。

つまりRyzenの汎用性が悪いのは、中身が「4コアCPUのデュアルソケット的」な状態だから？

ものすごく大雑把に言えば、そうなるね。少なくともAviutlの件はそうでした。

「Zen 2」はZenの弱点を解決し、更に多コア化

ここまでの解説で、現時点の「Zen」は安価に多コア化に成功はしてインテルを脅かしたが、構造上の弱点によりインテルに対して「最適化」が大きく劣っている現状があることが分かったと思います。

では、設計が刷新される「Zen 2」ではどのように弱点が克服されるのか。図解していく。

「Zen」の最小単位は「4コアCPU x2個 + その他もろもろ」で構成されるZeppelinチップでした。一方「Zen 2」の最小単位はChipletチップに置き換わり、その他もろもろの部分はI/O Dieに分割されます。

要するに、今までCPU部分とIFOPなどの接続バス（パイプ）や各種コントローラはすべて同じチップに詰め込まれていたわけですが、Zen 2では2つに分けてしまったのです。

今のところChipletの中身はよく分かっていないが、AMDが公表したZen 2世代のサーバー向けCPU「EPYC」（コードネームはRome）のイラストから、ざっくりと推測できる。

64コア / 128スレッド搭載の、Zen 2世代のEPYCです。一部詳細は伏せられたまま公開されたため、I/O Dieの中身は確定ではありません。

個々のChipletたちとI/O Dieを接続するためにZenと同様「IFOP」（インフィニティーファブリック）を使うのはほぼ確定。4コアのCCXはなんと2倍の8コア化が実現される見込み。

つまり、今まで実質的2つのCPUで8コアを実現していたモノが、Zen 2からは1つのCPUで8コアになる。これにより、CCXが2つ存在することに由来する問題が解消される可能性が出てくるというわけ。

だって、最小単位がちゃんとした8コアになるということは、従来のRyzen APUと同じような構造でも8コアCPUが作れるということ。最小単位の純粋な8コア化は、汎用性を大きく改善する可能性を秘めている。

64コア搭載「EPYC」のサンプルを掲げるLisa Su氏（AMD Next Horizonより）

Zen 2から最小単位がガチで最小になったんだね。

今までは最小単位の中に更に4コアが2個詰まってたわけですから、Zen 2は素直に期待できる。

AVX演算機が1つになり、エンコードの遅さも解消

Zen 2はCCXが1つに統合されたことで汎用性を大幅に改善できる。これだけでも結構大きな進化なわけですが、加えてエンコードが遅くなる原因だった「AVX演算機」の実装方法も変更される。

Zenは128 bit幅の演算機（レジスタ）を2つ使って、256 bit幅で計算ができる命令セット「AVX 2」を実現していました。しかし、演算機（レジスタ）を2つ使うと、ボトルネックが発生してインテルほど速くエンコード出来ない傾向が強かった。

AviutlならRyzenでもマトモに速度が出る（参考）

もちろん、この構造を考慮してプログラムされたエンコーダなら、Ryzenの持つ本来の性能のままにエンコードできる。例えば、Aviutlの拡張エンコーダである「x264guiEx」（rigaya氏）は、Ryzenに最適化されている数少ないエンコーダです。

だが、AdobeやHandbrakeといった有名所はなぜかエンコーダの改善を全く進めていないのが現状。

Zen 2ではこの構造的な問題を、演算機（レジスタ）を256 bit幅に強化することで解消する。128 bitを2個使って256 bitではなく、1個だけ使って256 bitを実現するのです。

ようやくインテルCPUとほぼ同じ実装方法になったため、恐らくエンコードが遅い問題は解消されると考えられる。OBSを使ったリアルタイム配信も、軽くなることが予想されますね。

ラインナップは最低8コアになるかも？

まだまだ確定事項ではないが、現時点の情報に基づくなら「CCXが8コア化」しているわけですから、同じラインナップのままコア数が2倍になる可能性が無くはない。

今のラインナップに、Zen 2の設計を直接当てはめるとこうなります。本当にこうなるかは不明。Zenで使われていたCCXを内部的に無効化する手法をZen 2でも使うなら、従来どおりのラインナップ展開も可能です。

Zen 2の最小単位「Chiplet」は7nmプロセスで製造されるため、質の悪いChipletが思った以上に出てしまった場合は、低品質なチップを4コアにしてRyzen 3へ…という流れも想定できる。

「Zen 2」は2019年のCPUとして「最大の目玉」

AMDが投資家向けのイベント「Next Horizon」で発表した資料を元に今回の記事を書いているため、まだまだ不透明な部分や正確性に欠ける部分も多い。

それでも、「Zen 2」のおおまかな設計が見えてきて非常に興奮してくるのが正直なところ。2つ内蔵されているCCXが統合された新しい最小単位「Chiplet」や、IOダイの分離による極めて自由度の高い設計思想。

128 bitだったAVX演算機（レジスタ）を256 bitに強化、TSMCの7nmプロセスを用いたCPUコアの製造など。本当に今の情報通りのモノが出てくるなら、期待せざるをえないです。

「7nm」のシングル8コアとか、やばくない？

本当にデュアルCCXを撤廃した純粋な8コアCPUなら、極めて強力なCPUになる可能性が高いです。

【補足】製造プロセスについて

「Zen 2」の製造はTSMC社の7nmプロセスを用いて行われる。従来の「Zen」「Zen+」は、GLOBALFOUNDRIES社の14nmプロセスが使われていた。

このため、Zen 2は同じ面積で計算上は4倍のトランジスタを詰め込むことが可能。にも関わらず、Next Horizenでは同じ面積で約2倍の密度と発表されています。

理由の一つとして、7nmプロセスで製造されるのはCPU部分である「Chiplet」だけで、分割された「I/Oダイ」は従来どおり14nmプロセスで製造されるためです。実はCPUより、その他もろもろの部分の方が微細化は難しい事情がある。

インテルが10nmプロセスにものすごく苦戦している原因も、その他もろもろの微細化が上手く行っていないためです。つまり、Zen 2は製造工程の違う完全に異種のチップが混在した設計になるわけですね（本当に面白い）。

なお、7nmプロセスだとインテルより更に先を行っているように見えるが、TSMCの7nmはインテルの10nmより難易度はやや低いので、圧倒的に先を行っているわけではありません。このあたりの話は以下の記事が詳しい。

「Zen 2」の設計まとめ

最後に、ここまで解説してきたZen 2の設計について、まとめて終わります。

「Zen 2」の改善ポイント

今まで4コアだったCCXが倍増（8コア化）
2個入っているCCXが、1個になる（かも）
CPU部分は7nmプロセスで製造される
「AVX 2」を256 bit幅の演算機1個で実現する
CPU部分とI/O部分（その他）を分離

7nmで製造されることで、消費電力を削減し、クロック周波数を更に高められる。AMDによれば、IPC（クロックあたりの処理回数）はZenと比較して29%も向上するという情報もあるので、シングルスレッド性能の大幅な進化はほぼ確実。

マルチスレッド性能も、コア数の倍増だけでなく、IOダイをCPUから切り離して分割することで「ダイ → 他のダイ」のレイテンシがバラバラになってしまう現象を解消するので今まで以上に効率が良くなる可能性が濃厚。

汎用性の向上はもちろん、Ryzenの弱点としてたびたび挙げられているゲーミング性能の低さも改善されるはずです。エンコードが遅い問題も構造的に解消されそうですし、Zenの欠点をほぼカバーしています。

「Zen 2」の懸念ポイント

~~CPUとIOを接続するIFOPの遅延の影響は？~~

懸念としては、IFOP（インフィニティーファブリック）由来の遅延くらいですね。CPUとIOダイを分離してしまったため、一般向けのRyzen 3 / 5 / 7でも、IFOPを使って接続する必要がある。

だからCCX間の遅延は無くなったけれど、今度はCPUとIO間の遅延が生まれてしまうわけです。この遅延が原因で、また最適化問題を引きずることになってしまうと、惜しい感じになる…。

コメントの指摘を受けて内容を修正します。

レイテンシ（遅延）の足並みが完璧に揃わない問題は、IOダイの引き離しでほぼ解消するため、AMDの32コアがなぜかインテルの18コアにボロ負けするといった現象はかなり解決されるはず。

今までのZenで作られる16コア以上のCPU（=つまり、Zeppelinを2個以上使うCPU）では、別のZeppelinへアクセスしに行く時にレイテンシが発生し、4個になるとZeppelinの場所によってレイテンシに差異が生じてしまっていた。

実際のところ、同じ16コアのCPUでもインテルのCore i9シリーズの方が、汎用性に優れていてゲーミング性能も高い理由は、レイテンシが均一であるかどうかの影響は決して無視できない。

あとは7nmプロセスの製造が上手くいくかどうかですが、TSMCの技術力を見る限りはそれほど心配はなさそう。既に7nmで製造されている「Apple A12」などは、すこぶる調子良いので、TSMCの技術力に期待したいところです。

新しい最小単位「Chiplet」の中身が、ガチの8コアかどうか楽しみ～。

7nm化による面積の縮小と、CPUだけというシンプル構造により、恐らく純粋な8コアになると思いますね。

以上「Zen 2の痺れる設計を解説。Ryzenの欠点を解決して真の完成形になりそうです。」について、初心者向けに図解を使って解説でした。

その他「Ryzen」な記事

「Zen 2」もスゴそうですが、現在の「Zen+」もなかなかのモノです。

2018年4月と、ちょっと古いですが。Ryzen 7とCore i7のスペックの違いや性能差を分かりやすくまとめたガイド記事。i7 8700Kに圧勝とは行かないが、コスパを考えるとやっぱり魅力的。

32 件のコメント

これだけ変化があってもソケットはそのままなんでしたっけ？
だとしたらすごいですよね

「Zen 2」の設計を図解：今までのRyzenと何が違う？

従来の「Zen」設計を図解でおさらい

多コア化に合理的な「Zen」の弱点

IFOP = Zepplelin同士を接続するパイプ

IF = あらゆるデータが必ず通るパイプ

「Zen 2」はZenの弱点を解決し、更に多コア化

AVX演算機が1つになり、エンコードの遅さも解消

ラインナップは最低8コアになるかも？

「Zen 2」は2019年のCPUとして「最大の目玉」

【補足】製造プロセスについて

「Zen 2」の設計まとめ

「Zen 2」の改善ポイント

「Zen 2」の懸念ポイント

その他「Ryzen」な記事

シェア！

32 件のコメント

コメントを残す コメントをキャンセル

ABOUTこの記事をかいた人

NEW POST最新の記事

MSI MAG 321UP QD-OLED X24レビュー：第4世代QD-O…

【4K】おすすめゲーミングモニター：7選を測定オタクが解説【2026年版】

TITAN ARMY P275MS PROレビュー：「P275MS+」の競技…

INNOCN GA32V1M MAX：32インチMini LEDで初「グレア…

RECOMMENDこちらの記事も人気です。

Ryzen 5 7600Xベンチマーク&レビュー：最強の6コアですがZen4…

Zen+世代「Ryzen 2000」シリーズの仕様や価格まとめ

【第12世代の今】Core i5とi7のどちらを選ぶべきか問題を解説

Ryzen 9 7950Xベンチマーク&レビュー：最高のデスクトップCPU

Core i5 12400Fベンチマークレビュー：2.5万円で性能はRyze…

Core Ultra 5 250K Plus 買ってベンチマーク：4万円で大…

Core i7 13700（無印）ベンチマーク&レビュー：無印モデルは大人し…

Core i9 13900Kベンチマーク&レビュー：24コアと300W超で7…

LINEスタンプ発売中

「ちもろぐ」の筆者

筆者お気に入りの通販

筆者が使ってる光回線

アーカイブ

カテゴリー

コメントを残すコメントをキャンセル