前向きの考え方 スーパーコンピューティング17には、いくつかの驚き、未来へのヒントが含まれています

スーパーコンピューティング17には、いくつかの驚き、未来へのヒントが含まれています

ビデオ: La Voz De WNY (九月 2024)

ビデオ: La Voz De WNY (九月 2024)
Anonim

今月のスーパーコンピューティング17カンファレンスでは、PEZY-SC2アクセラレータの非常に優れた展示や、IntelのXeon Phiラインの方向転換など、いくつかの驚きがありました。 さらに、IntelのXeonスケーラブルプロセッサ(Skylake)で構築された最初のシステムと、NvidiaのVoltaアクセラレータを搭載した最初のシステムも確認しました。

しかし、おそらく最も注目すべきは、中国のシステムが現在、最新のトップ500リストにある500台のスーパーコンピューターのうち202台を占めていることです。 25年前の創業以来、アメリカのシステムがリストを支配してきました。ほんの数ヶ月前、米国は中国の160に対して169のシステムを有していました。トップ500システムの合計パフォーマンス。

世界で最速のコンピューターは、数年前からリストのトップに立つ2台の巨大な中国製マシンです:中国無錫の国立スーパーコンピューティングセンターのSunway TaihuLightは、93ペタフロップス(93千兆浮動小数点)の持続的なLinpackパフォーマンスを備えています1秒あたりの操作数)、および広州にある中国の国立スーパーコンピューターセンターのTianhe-2で、33.8ペタフロップス以上のパフォーマンスを維持しています。 これらは最速のマシンであり、大きなマージンがあります。 Intel XeonsとNvidia Tesla P100を使用するCrayシステムであるスイス国立スーパーコンピューティングセンターのPiz Daintシステムは、Linpackが19.6ペタフロップスのパフォーマンスを維持して3位になりました。

最上位の最大の変更点は、4番目の新しいシステムです。海洋科学技術庁に配備されたZettaScaler-2.2システムであるGyoukouスーパーコンピューターのアップグレード版です。 このマシンは、PEZY-SC2アクセラレータを使用します。これは、倍精度で4.096テラフロップスのピークパフォーマンスを提供する第2世代の2048コアチップと、従来のIntel Xeonプロセッサで合計19, 860, 000コアです。 (PEZY-SC2を搭載した初期のZettaScalerマシンは、6月バージョンの下位レベルでリストを作成しました)。 これにより、現在使用されているコアの最大数(最高レベルの同時実行性とも呼ばれます)が得られ、10.6百万のコアを持つTaihuLightを超えています。 Gyoukouマシンは19.14ペタフロップスのLinpack持続性能を達成しましたが、興味深いのは、PizDaintの2.27メガワット、Tinahe-2の17.8メガワット、Taihulightの15.4メガワットと比較して、1.35メガワットの電力を使用することです。 それはまだ大きな力ですが、他のシステムと比べて大幅に削減されており、世界最速のマシンであっても、電力に関する懸念が重要であることを強く示しています。 これは、新しいアーキテクチャが消費電力を劇的に削減する方法を示していることにも注目してください。

米国のトップシステムは、Nvidia K20x GPUアクセラレータを使用し、17.59ペタフロップスを配信する5年前のシステムであるオークリッジ国立研究所のTitanスーパーコンピューターのままです。

最もエネルギー効率の高いスーパーコンピューターの最新のGreen 500リストでは、上位3スロットを含む上位5スロットのうち4スロットが、すべてZettaScaler-2.2アーキテクチャとPEZY-SC2アクセラレーターに基づいて新しくインストールされた日本のシステムに行きました。 これらの中で最も効率的なのは、理研のコンピューティングとコミュニケーションのための先進センターに設置されているShoubu System Bです。 Shoubu System Bは17.0ギガフロップス/ワットを達成しました。 Shoubu System Bおよび次の2つのシステムは、それぞれ16.8および16.7ギガフロップス/ワットを使用し、すべてトップ500リストの下半分にあります。 グリーンランキングの5番目のシステムは、上記の行口システムです。トップ500リストの4位のシステムで、14.2ギガフロップス/ワットです。

これらはPEZY-SC2アクセラレータの大きなブレークスルーであり、スーパーコンピューティングアーキテクチャの将来の方向性を示す可能性があります。

4番目に環境に優しいスーパーコンピューターは、Nvidiaの内部DGX SaturnV Voltaシステムであり、15.1ギガフロップス/ワットを達成し、トップ500リストで149に入っています。 このシステムには、22, 440個のVoltaコアがあります(リスト上では、他のコアとは多少異なる方法でカウントされるようです)。Nvidiaは、アクセラレータにとって非常に良い年を過ごしており、Voltaを使用するより多くのマシンに大きな期待を寄せていますGPUアーキテクチャ。

いつものように、主要ベンダーはリストで成功を称賛しており、IntelはCPUがトップ10システムの6つにあり、500システム中471の記録的な高さにあると述べました。 Intelはまた、新しいXeonスケーラブルプロセッサは、25ペタフロップス以上のパフォーマンスを備えた18台のスーパーコンピューターに搭載されていたと述べました。 しかし、注目すべきは、Intelが、14nmのKnights Landing Xeon Phiプロセッサの後継となる10nmのKnights Hillをキャンセルすると発表したことです。 同社は、2021年までにエクサスケールシステム(1, 000ペタフロップス)の新しいプラットフォームを計画していると述べたが、詳細は明らかにしなかった。

Nvidiaは、リストにアクセラレータを備えた34の新しいシステムがあり、会社の合計が87であることを強調しました。NvidiaとパートナーIBMは、次のリストが6月に期限を迎えるまでに、Oak RidgeのSummitマシン国立研究所(ORNL)は、リストの一番上にあるマシンの中にあるべきです。 このマシンは4600ノードを特徴とし、各ノードには2つのIBM Power 9ベースCPUと6つのNvidia Voltaアクセラレーターがあり、予測されるパフォーマンスは約200ペタフロップスです。 これはNvidiaの内部ソリューションとは異なり、CPUとGPUはすべてOpenCAPIを使用してキャッシュコヒーレントな方法でNVLink 2.0を介して通信するため、GPUはメインシステムRAMに直接アクセスできます。 サミットの後には、ローレンスリバモア国立研究所のSierraマシンと、日本のAIブリッジングクラウドインフラストラクチャ(ABCI)マシンが続きます。

XC50スーパーコンピューターの一部として現在入手可能な64ビットArmv8-Aアーキテクチャー上のCavium ThunderX2プロセッサーをベースにした「生産準備完了」のスーパーコンピューターをCrayが発表するのを聞いて興味がありました。 ARMベースのマシンは、バルセロナスーパーコンピューターセンター(現在、マーレノストラムマシンがトップ500リストで16位にランクされています)、および「Post-K」スーパーコンピューターと英国のIsambardスーパーコンピューターでテストされています。 CaviumはThunderX2でいくつかの初期のベンチマークを行いましたが、マルチスレッドまたはメモリバウンドアプリケーションで14nmチップのパフォーマンスがIntelのSkylake Xeonsよりも優れていることを示しましたが、Intelはシングルスレッドおよびrawテラフロップのリーダーであり続けています。 Caviumの設計に加えて、QualcommはCentriqと呼ばれるARMベースのサーバーチップも発表しています。

他のプロセッサニュースでは、AMDはEpycプロセッサの生産量を増やしたと発表しましたが、トップ500システムにはまだありません。NECは、新しいSX-Aurora TSUBASAスーパーコンピュータシリーズ用のVector Engine PCIeアクセラレータカードのバージョンを発表しました特に高速のメモリ帯域幅を備えています。

相互接続に関しては、Mellanoxは、上位500リストの新しいシステムの77%がInfiniBandを使用し、IntelはXeonスケーラブルプロセッサ(Skylake)システムで主に使用されるOmni-Pathアーキテクチャで最近の成功を宣伝したと述べました。 一方、多くのベンダーは、コンピューティングデバイスとメモリ/ストレージデバイス間の非常に高速な接続のための低レイテンシ、メモリ中心のアプローチとして設計されたGen-Zを探しています。

また、Top 500のすべてのマシンが初めてLinuxを実行していることに注意してください。

PEZY-SC2からの強い第一印象と、新しいアーキテクチャ、NvidiaのVolta、およびAMD、ARMベンダー、NECからの新しい競争のためにKnights Millを捨てるというIntelの決定は、スーパーコンピューティングの世界でエキサイティングな時間です。 来年のリストは非常に興味深いはずです。多くのベンダーとスーパーコンピューターのサイトは、サブアーキテクチャーを備えたエクサスケール(1000ペタフロップス)のコンピューターを製造するためにレースに参加しようとしています。 -20メガワットの消費電力。

ブロードバンドのインターネット速度に興味がありますか? 今すぐテストしてください!

スーパーコンピューティング17には、いくつかの驚き、未来へのヒントが含まれています