家前向きの考え方代替アーキテクチャはスーパーコンピューティングを支配しますか？

代替アーキテクチャはスーパーコンピューティングを支配しますか？

2024

近年、高性能コンピューティングへの興味深い新しいアプローチがいくつか見られます。特に、従来のビッグプロセッサから、特定の種類の計算を高速化するためのアクセラレータまたはコプロセッサを備えたx86 CPUのクラスタへの移行が見られます。先週のスーパーコンピューティングショーから出てきたインテルは、プログラミングを容易にするために、Xeon Phiコプロセッサーと従来のXeonサーバープロセッサーを統合することを推し進めました。 Nvidiaは、Tesla GPUアクセラレータの新しいバージョンを導入しています。 Micronは、さらに特殊なコンピューティングのために非常に異なる種類のプロセッサをサポートしています。そして、これらはすべて、アクセラレーターとコプロセッサーが世界最速のコンピューターのトップ500リストを支配するようになったときに起こっていたため、一部の専門家は、既存のベンチマークがこれらのプロセッサーに過度の重みを与えることを示唆しています。

Nvidiaは、IntelまたはAMDのメインプロセッサに接続されたGPUの大きなクラスターであるTeslaアクセラレータボードで成功を売り込んでいた。このようなチップは、オークリッジ国立研究所のTitanシステムや、スイス国立スーパーコンピューティングコンピューティングセンターの新しいPiz Daintシステムなど、さまざまなシステムで使用されています。さらに興味深いことに、Teslaボードは、世界で最もエネルギー効率の高いスーパーコンピューターの最新のGreen 500リストにあるトップ10システムすべてに搭載されています。 AMD OpteronベースのTitanを除き、これらのシステムはすべてIntel Xeonsを使用しています。これは、Top 500で世界で2番目に速いシステムですが、Green 500リストでははるかに低いランクです。

さらに、NvidiaはIBMとのパートナーシップを発表し、IBM Powerアーキテクチャに基づいたシステムでTeslaアクセラレータを提供しています。 IBMは長い間、シリアルパフォーマンスを売り込んでおり、PowerプロセッサーをベースにしたBlueGene / Qシステムは、Lawrence Livermore National LaboratoryのSequoiaシステムと、Argonne National LaboratoryのMiraシステムを実行しています。 IBMとNvidiaを連携させることで、将来興味深いシステムが生まれるはずです。

ショーで、同社はGPUアクセラレーターボードの次世代であるTesla K40を発表しました。同社は、1.4テラフロップスの倍精度パフォーマンス、12GBのメモリ（288GBpsの帯域幅）、および状況によってはより速いクロック速度で実行できるGPUブースト機能を提供すると述べました。これは、既存のTesla K20シリーズからのアップグレードで、28nmテクノロジーで作成された同じ基本的なGPU設計を使用しています。

その他のイニシアチブには、CUDA 6などのGPUプログラミングを簡単にする方法が含まれます。CUDA6では、ユニファイドメモリがサポートされ、CPUとGPUメモリが別々のままでも、開発者は単一のプールとしてメモリにアプローチできます。同社は、パフォーマンスを向上させるためにCPUからアクセラレータにプログラムのどの部分（C / C ++およびFortranで記述された）をオフロードできるかをシステムに伝えるコンパイラ指令の標準コレクションであるOpenACCもサポートしています。

Intelのメニーインテグレーテッドコア（MIC）アーキテクチャと呼ばれるアプローチは、まったく異なります。複数の小さなx86コアをXeon Phiと呼ばれる単一のチップに結合します。過去数年間、Intelはプログラミングを容易にするものとしてすべてx86であるという事実を宣伝してきましたが、開発者はまだアーキテクチャを直接ターゲットにしなければならないことは明らかです。 Knights Cornerと呼ばれるXeon Phiの現在のバージョンは、従来のXeon Eサーバーチップとともにアクセラレータとして使用されるように設計されており、中国のTianhe-2（現在最速のシステムテキサス大学のAdvanced Computing CenterのStampedeシステム。

ショーで、IntelはKnights Landingというコード名の新しいバージョンを発表しました。これは、標準のラックアーキテクチャに適合し、ホストCPU（Xeon Eなど）を必要とせずにオペレーティングシステムを直接実行できるスタンドアロンCPUとしても動作します。これは、特にワークステーション市場で、Xeon Phiの魅力を拡大する上で非常に重要です。繰り返しますが、これはソフトウェア開発者が単一のCPUとして見やすくするために設計されています。 Knights Landingは、スタンドアロンCPUとしても、Knights Cornerからのアップグレードとして既存のシステムに適合するPCI Expressボードとしても利用できます。

Knights Landingには他にも重要な変更があります。たとえば、「ニアメモリ」の追加、CPUを搭載したパッケージで提供されるDRAMなど、従来のDDRメモリよりもはるかに高い帯域幅を提供できます。バス。（それも速くなっていますが、それ程ではありません。）これはこの方向への最初の動きではありません。 IBMは長年Powerアーキテクチャに組み込みDRAMを売り込んでおり、Intel自身はHaswell CoreファミリのIris Proバージョンのグラフィックスに組み込みDRAMを搭載しています。それでも、私は、今後数年間でこの方向でさらに多くの努力が行われると思います。

一方、最も興味深い新しいアプローチの1つは、複雑な非構造化データの問題に対処するために主に設計されたAutomataプロセッサと呼ばれる新しいアクセラレータを発表したMicronによるものです。

マイクロンは、これを特定のタスクを解決するために接続された数万から数百万の処理要素で構成されるファブリックを提供すると説明しました。 DRAMとNANDメモリの最大のメーカーの1つである同社は、これがメモリベースの処理を使用して、ネットワークセキュリティ、バイオインフォマティクス、画像処理、分析などの分野における複雑なコンピューティングの課題を解決すると述べています。 Micronは、最初にPCI-ExpressボードでAutomataプロセッサを配布し、開発者が作業するようにしますが、同社はDIMMまたは組み込みシステムの個別のチップとして知られる標準メモリモジュールでプロセッサを販売する予定です。いくつかの点で、これはパターンマッチングを含む特定のアプリケーションを解決するために調整されたフィールドプログラマブルゲートアレイ（FPGA）に似ています。

同社は、ジョージア工科大学、ミズーリ大学、バージニア大学と協力してオートマタの新しいアプリケーションを開発していると語った。同社は最終製品の日付を発表していませんが、ソフトウェア開発キットはシミュレーションツールとともに来年発売される予定です。

オートマタは進行中の作業のように聞こえますが、アプリケーションの広さを知るのは時期尚早かもしれませんが、興味深いアプローチです。

全体として、高性能コンピューティングの進化が見られます。何年も前ではありませんが、最速のコンピューターはほとんどが標準的なサーバープロセッサの膨大な数でした。実際、IBM Blue GeneシステムおよびSparcに基づくシステム（富士通のSparcプロセッサを使用する理化学研究所計算科学研究所のKコンピューターなど）は、市場の大部分を占めています。世界のシステム。しかし、最近では、テスラと最近ではXeon Phiアクセラレータを使用したシステムが新しいシステムをより多く構成するなど、コプロセッサに向かって勢いが増しています。これらのシステムの改善、新しいパートナーシップ、より優れたソフトウェア、いくつかの新しいアプローチにより、スーパーコンピューティング市場は将来大きく異なる可能性があります。