家前向きの考え方スーパーコンピューティング15：地平線上の大きな変化

スーパーコンピューティング15：地平線上の大きな変化

2024

ビデオ: The Hardest Karaoke Song in the World (十一月 2024)

先月のオースティンでのスーパーコンピューティング15（SC15）カンファレンスの発表と手順を見ると、ハイパフォーマンスコンピューティングは少し落ち着いているかもしれませんが、今年は大きな変化が見込まれる市場です。来て

年に2回、世界最速のコンピューターのリストであるtop500リストのリーダーを見ると、6年連続でリーダーはTianhe-2であり、中国の防衛技術大学が構築したスーパーコンピューターです。 top500リストによると、このマシンはLinpackベンチマークで33.86ペタフロップス/秒（1秒あたり数十億回の計算）の持続的なパフォーマンスと、54.9ペタフロップス/秒の理論的なピークパフォーマンスを提供します。これは、Intel XeonおよびXeon Phiプロセッサに基づいています。

第2位は、DOEのオークリッジ国立研究所に設置されたAMD Opteron CPUとNvidia K20x GPUに基づくCray XK7システムであるTitanに引き続き進み、Linpackベンチマークで17.59ペタフロップス/秒のパフォーマンスを維持しました。

ローレンスリバモア国立研究所（LLNL）のTrinityコンピューターは8.1ペタフロップス/秒で6番目であり、ドイツのHöchstleistungsrechenzentrumシュトゥットガルト（HLRS）のHazel-Henシステムは5.6ペタフロップス/秒で8位でした。両方とも、Aries相互接続を備えたIntel Xeonプロセッサに基づくCray XCマシンです。

大きな変更はリストのさらに下で発生します。特に、中国のシステムの数が大幅に増加し、前のリストではわずか37でしたが、109に増加しました。部分的には、これはベンチマークを実行し、リストの結果を送信する中国のシステムからのようです。その結果、米国のシステムの数は231から200に減少しました。これは、1993年にリストが開始されて以来の最低数です。ヨーロッパのシステムの数は141から108に減少しました。

大きなトレンドの1つは、アクセラレーターまたはコプロセッサーを使用するシステムの数の増加です。これは、7月の90から現在のリストで104システムに増加しました。これらのシステムの大部分はNvidia Tesla GPUを使用し、続いてIntelのXeon Phiコプロセッサーを使用していますが、いくつかは組み合わせを使用しています。 Nvidiaは、リストにある24の新しいシステムのうち23を含む、これらのシステムのうち70にあることを指摘しました。

ショーでは、Nvidiaはアクセラレータの成長、特に企業のCUDAアーキテクチャ向けに最適化された現在利用可能なアプリケーションの数を強調しました。同社によれば、上位10の高性能コンピューティングアプリケーションの90パーセントと上位50の70パーセントが加速化されています。興味深い予測の1つは、あらゆる種類の政府によって天気予報が作成されるため、高性能コンピューティングの主要なアプリケーションである天気シミュレーションを実行するシステムです。 Crayは以前、スイス気象局（MeteoSwiss）でそのような加速器を使用することを指摘しており、その応用の多くを書き直す際にスイスの研究者とどのように連携するかについて話しました。 Nvidiaは現在、気象予報の一部にも米国海洋大気庁（NOAA）による加速器の使用を指摘しています。

他のアプリケーションの中でも、Crayは、3D地球物理学を使用して貯水池をシミュレートするなどの石油およびガスのアプリケーション、ならびにリスク評価などの金融サービスを宣伝しました。このようなアプリケーションが世界最速のシステムを構成することはめったにありませんが、より高性能なコンピューティングがより多くの企業アプリケーションで幅広い役割を果たしていることを示しています。 Crayは、すべての科学および工学分野でより大きくより詳細なモデルを実行し、従来のワークロードと分析を組み合わせることへの着実な進展について話しました。

また、HPCの世界でよりオープンな標準を作成するために設計されたOpenHPCと呼ばれる新しい取り組みのLinux Foundationによる発表にも興味がありました。これは興味深いアイデアであり、多くの大手プレイヤーがサインオンしているようです。

作業中の新しいシステムがいくつかあります。 IBMは、IBM PowerアーキテクチャCPU、Nvidia Tesla GPU、およびMellanoxインターコネクトに基づいて、Oak Ridge National Laboratories（ORNL）でSummitと呼ばれる新しいマシンを、Lawrence Livermore National Laboratory（LLNL）でSierraと呼ばれる別のマシンを構築しています。 Summitは、ピークペタフロップスが150〜300ペタフロップス、シエラが100ペタフロップス/秒以上になると予想されています。

さらに、IntelとCrayは、Argonne Leadership Computing Facility（Argonne National Labsの一部）向けの次期Knights Hill Intel Xeon Phiプロセッサに基づいて、2018年に150ペタフロップスを目標とするAuroraと呼ばれる新しいマシンを構築しています。高性能コンピューティング、特にFastForward 2プロジェクトの開発を加速することを目的とした、オークリッジ、アルゴンヌ、およびローレンスリバモア国立研究所（CORAL）のコラボレーションとして知られるエネルギー省プログラムの一部です。

それでも、「エクサスケールコンピューティング」への道のりはまだ長い。

それまでの間、将来の前兆となるプロセッサの発表がいくつかありました。 Nvidiaは特に、ハイパースケールWebアプリケーション、特に機械学習にスーパーコンピューターの使用を推進しました。いくつかのやや低価格の製品を発表しました。3072CUDAコアを搭載したTesla M40ボードは、主に「ディープラーニング」トレーニングを目的とした最大7つの単精度テラフロップスで実行可能であると言われました。 1024コアと2.2の単精度テラフロップスを備えた低電力ボードは、ディープラーニングの推論や画像やビデオ処理などに使用できます。さらに、同社は、最大のコンピューティングサイトを対象としたアプリケーションを備えた新しい「ハイパースケールスイート」を発表しました。両方の新しいハードウェア製品は、28nmプロセス技術と同社のMaxwellアーキテクチャに基づいています。

同社は、来年発売予定のPascalとして知られる2つの後続アーキテクチャと、それに続くVoltaを発表しました。 IntelはHPCが科学にどのように影響するかに焦点を当てており、独自のスーパーコンピューター（現在トップ500リストで99位）を使用して独自のプロセッサーを設計する方法についての説明に興味をそそられました。特に、同社は次世代プロセッサ用のフォトマスクを設計するためだけに100万CPU時間を使用すると述べた。

Intelの活動の多くは、Xeon Phiチップの次のバージョンであるKnights Landingに焦点を当てていました。これは、アクセラレータとして使用することも、起動することもできます。およびそのOmni-Pathファブリック。 Intelは現在、一般提供は2016年前半に予定されていると述べていますが、一部のお客様はKnights Landingに早期にアクセスできます。現在、Crayは、National Energy Research Scientific Computing Center（NERSC）およびLos Alamos National Laboratory and Sandia National Laboratoriesに来年、Coriと呼ばれる新しいスーパーコンピューターを提供する準備として、大規模なKnights Landingシステムをテストしています。フランスのシステムインテグレーター、アトスのユニットであるブルは、フランスの代替エネルギーおよび原子力委員会のために構築しているTera 1000システムの準備のためにナイツ・ランディングの初期バージョンも受け取りました。 Argonne Leadership Computing Facilityは、来年出荷予定のThetaと呼ばれるシステムに取り組んでおり、Sandia National Laboratoriesはペンギンコンピューティングと協力して、旧世代のXeon Phiコプロセッサを使用するいくつかのシステムをアップグレードしています。

インテルは、Knights Landingにはベースラインホストプロセッサ（セルフブートが可能な）、Omni-Pathファブリックが統合されたホストプロセッサ、PCIeアクセラレータカードの3つの異なるバージョンがあると以前に述べています。チップ自体は、それぞれ2つのCPUコア（合計72コア）、4つのベクトル処理ユニット（コアあたり2つ）、1MBの共有L2キャッシュ、および一貫性を維持するためのキャッシュエージェントを備えた36タイルで構成されます。 Intelは、3テラフロップス/秒の倍精度と6テラフロップス/秒の単精度ピークパフォーマンスで、Knights Corner CPUの約3倍のスカラーパフォーマンスを提供する必要があると述べています。また、MCDRAMと呼ばれる新しいメモリシステムを使用します。これは、IntelとMicronが話しているハイブリッドメモリキューブアーキテクチャのバリアントであると思われるDDR4に比べて3倍以上の帯域幅を持つオンパッケージメモリです。ショーでは、Crayにはブート可能なKnights Landingを備えたプロトタイプシステムがあり、他の多くのベンダーがKnights Landing用に設計されたシステムを示していました。 Xeon Phiのこのバージョンの後には、Knights Hillと呼ばれるバージョンが予定されています。これは、今後の10nmプロセスで構築される予定です。

さらに、富士通は32コアのFX100として知られる新しいチップに基づいて、Flagship 2020プロジェクトについてもう少し話をしました。これにより、現在のFX10の約4倍の浮動小数点性能が期待され、Knights Landingと同様に、富士通のFX100もハイブリッドメモリキューブアーキテクチャのバージョンを使用します。さらに、NECには、SX-ACEチップへのフォローアップに基づいて、より大きなメモリ帯域幅を持つAuroraというコードネームのプロジェクト（CORALプロジェクトとは無関係）があります。これは2017年を対象としています。